专栏名称: 程序员专栏
点击关注,进实战技术交流群!分享技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。
目录
相关文章推荐
舰大官人  ·  -20250207065657 ·  18 小时前  
舰大官人  ·  -20250207071749 ·  17 小时前  
香港365天  ·  全港学科排名第一!这所港校太牛了! ·  昨天  
香港365天  ·  全港学科排名第一!这所港校太牛了! ·  昨天  
审计芸  ·  春节福利!2025年度公众号订阅限时优惠 ·  4 天前  
51好读  ›  专栏  ›  程序员专栏

「斯坦福AI团队抄袭中国开源大模型」最新进展:创始人称已经比较确信对方是套壳

程序员专栏  · 公众号  ·  · 2024-06-10 18:00

正文

架构师大咖
架构师大咖,打造有价值的架构师交流平台。分享架构师干货、教程、课程、资讯。架构师大咖,每日推送。
公众号
针对“斯坦福AI团队被曝抄袭清华系AI创业公司面壁智能发布的开源大模型”,面壁智能创始人刘知远在知乎平台回应称:



已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳,比较有意思的证据是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋,就是对清华简的识别能力。

这是我们从清华简逐字扫描并标注的数据集,并未公开,而Llama3-V展现出了一模一样的清华简识别能力,连做错的样例都一样。



事件回顾:

1、斯坦福大学的一个 AI 团队 5 月 29 日发布了名为 Llama3V 的开源多模态模型,声称 只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

2、网友发现 Llama3V 与面壁智能 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5 在模型结构、代码、配置文件上高度相似,只是变量名有所不同。

3、面对质疑,斯坦福团队成员删除了在社交媒体上官宣模型的推文,并将项目在 GitHub 和 HuggingFace 上的库一并删除。

4、面壁智能团队通过测试发现,Llama3V 在识别清华简的文字时,结果与 MiniCPM-Llama3-V 2.5 高度相似,不仅在正确的地方一样,在错误的地方也雷同,且两个模型在清华简上的高斯噪声也高度相似。



5、斯坦福团队辩称只是使用了 MiniCPM-Llama3-V 2.5的tokenizer,并声称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。







请到「今天看啥」查看全文


推荐文章
舰大官人  ·  -20250207065657
18 小时前
舰大官人  ·  -20250207071749
17 小时前
广东台今日关注  ·  当街被劫万元?真相竟是....
8 年前
墨香中华  ·  中国最美古建筑摄影,美翻了!
8 年前
影视全版权  ·  “爱乐之城”情人节奏响爱的乐章
7 年前
狮子座网  ·  狮子座在六月会有什么惊喜?
7 年前