专栏名称: 新浪科技
新浪科技官方微博 新浪科技是中国最有影响力的TMT产业资讯及数码产品服务平台。让我们带你观察世界变化,看清行业趋势!
目录
相关文章推荐
大众软件  ·  2025年2月国产游戏版号公布 ·  昨天  
36氪  ·  7万大定的智界R7,贴脸竞争特斯拉 ·  昨天  
风动幡动还是心动  ·  抽空来赏梅 ·  2 天前  
51好读  ›  专栏  ›  新浪科技

【#为什么说梁文锋杨植麟论文撞题#,“注意力机制”对大模型意味着-20250219224456

新浪科技  · 微博  · 科技媒体  · 2025-02-19 22:44

正文

2025-02-19 22:44

#为什么说梁文锋杨植麟论文撞题# ,“注意力机制”对大模型意味着什么】2月18日,在大洋彼岸的马斯克秀出最新大模型Grok 3当天,国产AI公司深度求索(DeepSeek)最新一篇论文引发关注,创始人梁文锋在署名之列,并2月16日提交到预印本平台arxiv。值得注意的是,此次论文作者中,梁文锋在作者排名中位列倒数第二。而第一作者是袁景阳(Jingyang Yuan)。据公开信息,袁景阳目前是北京大学硕士研究生,研究领域包括LLM和AI for Science,目前是DeepSeek的实习生,据袁景阳个人主页,他在去年参与7篇论文的撰写。
有趣的是,对于马斯克坚持大力出奇迹的思路,另一家国内大模型独角兽“月之暗面”几乎在同时提出挑战。(澎湃新闻)






请到「今天看啥」查看全文