杨植麟出生于1993年,来自中国。他高中就读于汕头金山中学,通过信息学奥林匹克竞赛获得清华大学保送资格。杨植麟曾梦想成为摇滚明星或流浪诗人。本科期间在清华大学组建了校园摇滚乐队Splay,担任鼓手和词曲作者。
教育经历
高中:就读于汕头金山中学。
本科:2011年保送进入清华大学,最初被录取到热能工程系,大二时转入计算机系,2015年以年级第一的成绩毕业。
博士:2015年进入卡内基梅隆大学(CMU)语言技术研究所(LTI),2019年获得计算机专业博士学位,师从苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen。2019年:获得卡内基梅隆大学计算机专业博士学位。同年,作为第一作者,与谷歌、卡内基梅隆大学联合发表深度学习和自然语言处理模型XLNet。
工作经历和职业生涯
2019年:回国创立循环智能(Recurrent AI),专注于AI技术的研发和应用。
2023年:创立月之暗面科技有限公司(Moonshot AI),推出支持20万字输入的智能助手Kimi。
2024年:月之暗面估值超过33亿美元。
参与过的AI项目或科研成果
XLNet:在20个标准任务上超过了Google BERT模型。
Transformer-XL:首个全面超越RNN的注意力语言模型。
盘古NLP:主导开发的NLP大模型,获2021年世界人工智能大会“SAIL之星”称号。
智能助手Kimi:月之暗面公司推出的支持20万汉字输入的智能助手。
在人工智能领域的创新或突破
杨植麟在大模型和自然语言处理领域取得了显著成果,特别是在长文本输入优化、RoPE相对位置编码、Group Normalization等技术方面。他的研究和创业项目推动了AI技术的进步和应用。杨植麟的研究和创业项目在学术界和工业界都有重要影响。他的工作如XLNet和Transformer-XL在多个任务上取得了世界领先的成绩,推动了AI技术的发展和应用。
对AI的看法和观点
杨植麟认为,AI未来的发展方向将集中在大模型和通用人工智能(AGI)的实现上。他强调通过不断扩大模型规模(Scaling Law)和优化压缩来提升智能水平。他认为,AI技术的终极目标是实现AGI,而AGI将极大地改变人类社会,包括生产力提升、时间分配的变化以及新的虚拟精神空间的形成。当前的AI技术已经取得了显著进展,但仍存在一些局限性,特别是在数据稀缺和模型架构方面。他认为,现有的Transformer架构虽然强大,但在处理更通用的场景时仍有不足。为了解决这些问题,需要开发新的架构和方法,如无损压缩和长上下文(long-context)技术。AI技术将逐步渗透到各行各业,特别是在生产力工具和智能助手等领域。他强调,AI的核心价值在于个性化交互,通过提升上下文一致性和指令跟随能力,实现高度个性化的用户体验。他还指出,未来的AI产品将不仅仅是工具,而是与用户共创的伙伴。AI商业化需要结合技术创新和用户需求。他的公司月之暗面(Moonshot AI)专注于面向消费者(to C)的智能助手产品Kimi,通过技术创新实现长期的世界改变。他强调,AI产品的核心价值在于其智能增量,而不是简单的功能提升。
对AI的长远愿景:真正的人工通用智能(AGI)必然是全球化的,并且会与大量用户产生互动,共同创造价值。他强调,一个伟大的AGI公司应该结合技术理想主义,并将其通过优秀的产品与用户共同创造,从而推动人类文明向更高层次发展。