作者丨王悦
编辑丨陈彩娴
AI 科技评论独家获悉,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。
知情人士称,已有外部 AI 大牛加入大模型研究院。
此外,原序智科技创始人秦禹嘉、原零一万物核心成员黄文灏已加入字节大模型团队。目前暂不清楚是否归属在大模型研究院。
从去年开始,字节才陆续对外公布关于大模型的相关工作进展。2023 年 8 月,字节自研的底层大模型「云雀」上线,随即推出 AI 对话产品「豆包」。
2023 年 11 月, Flow 在字节内部成立,专注于 AI 应用层面的研究和开发,由技术副总裁洪定坤和字节大模型团队负责人朱文佳主导该项目。
12 月
底,除豆包之外的又一产品 Coze 在海外上线,其核心服务是为用户提供一个快速开发 AI 应用的平台,支持30秒无代码生成AI Bot,并且集成了插件工具集,满足了个性化的使用需求。
2024 年初,
Coze 相应的国内版的产品“扣子”也正式上线,海外版和国内版整体产品形态和功能定位基本差不多,都是能够快速创建、调试和优化AI聊天机器人的应用程序。
过去,字节大模型团队的人才更多来自字节内部业务线,包括搜索、抖音、西瓜、TikTok 等,这与众多明星人才云集的大模型初创公司十分不同,很少出现从公司外部新招一号位的情况。
而今,大模型研究院的人才方法论则不同于以往,花费大手笔从外部招揽人才。
上周,零一万物联创黄文灏离职,加入字节。
黄文灏博士就读于北京大学计算机专业,读博期间恰遇 Deep Learning 兴起,于是 All in Deep Learning 研究,是国内最早做 Deep Learning 的一批人。
毕业之后,黄文灏加入微软亚洲研究院,做 Agent 相关研究,聚焦在可以完成任务的聊天机器人(Task Completion Chatbot)。之后,也做了 AI 技术落地的一些尝试,包括金融量化、AI for Science 等。
从微软亚洲研究院离职后,黄文灏来到智源研究院,担任健康计算研究中心技术负责人、创新应用实验室负责人,
重点研究 AI for Life Science 方向 ,在基础层面上探索「AI+大健康」的研究课题、方法路径、外部合作以及人才储备等。
其中,他的主要研究集中在两方面:
一个是基于生物识别的自然语言处理研究;
另一个是探索自然语言处理方法与结构研究的有机结合。
随后,他以联创的身份加入零一万物,担任算法副总裁,负责零一万物大模型 Yi-Large,包括 Yi-34B 在内的多个开源模型的训练和发布,在 LMSYS,huggingface llm leaderboard 上取得成绩。
更多内容
,点击下方关注: