专栏名称: iOS开发
分享iOS相关技术文章、学习资料、视频教程、热点资讯、工具资源、课程书籍等。每天推送,欢迎投稿!
目录
相关文章推荐
KJ123跨境电商  ·  24年速卖通和Temu在韩销售额超4万亿韩元 ... ·  昨天  
KJ123跨境电商  ·  24年速卖通和Temu在韩销售额超4万亿韩元 ... ·  昨天  
蛋先生工作室  ·  2025年2月11日最新蛋价(早报) ·  昨天  
掌上平度  ·  增收致富!点赞平度的这个地方...... ·  昨天  
天津市文化和旅游局  ·  早安·天津 ·  3 天前  
天津市文化和旅游局  ·  早安·天津 ·  3 天前  
51好读  ›  专栏  ›  iOS开发

「斯坦福AI团队抄袭中国开源大模型」最新进展:创始人称已经比较确信对方是套壳

iOS开发  · 公众号  ·  · 2024-06-12 18:00

正文

架构师大咖
架构师大咖,打造有价值的架构师交流平台。分享架构师干货、教程、课程、资讯。架构师大咖,每日推送。
公众号
针对“斯坦福AI团队被曝抄袭清华系AI创业公司面壁智能发布的开源大模型”,面壁智能创始人刘知远在知乎平台回应称:



已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳,比较有意思的证据是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋,就是对清华简的识别能力。

这是我们从清华简逐字扫描并标注的数据集,并未公开,而Llama3-V展现出了一模一样的清华简识别能力,连做错的样例都一样。



事件回顾:

1、斯坦福大学的一个 AI 团队 5 月 29 日发布了名为 Llama3V 的开源多模态模型,声称 只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

2、网友发现 Llama3V 与面壁智能 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5 在模型结构、代码、配置文件上高度相似,只是变量名有所不同。

3、面对质疑,斯坦福团队成员删除了在社交媒体上官宣模型的推文,并将项目在 GitHub 和 HuggingFace 上的库一并删除。

4、面壁智能团队通过测试发现,Llama3V 在识别清华简的文字时,结果与 MiniCPM-Llama3-V 2.5 高度相似,不仅在正确的地方一样,在错误的地方也雷同,且两个模型在清华简上的高斯噪声也高度相似。



5、斯坦福团队辩称只是使用了 MiniCPM-Llama3-V 2.5的tokenizer,并声称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。







请到「今天看啥」查看全文


推荐文章
蛋先生工作室  ·  2025年2月11日最新蛋价(早报)
昨天
天津市文化和旅游局  ·  早安·天津
3 天前
天津市文化和旅游局  ·  早安·天津
3 天前
妙法佛音  ·  【法师开示】真 爱
7 年前
健康生活圈  ·  长期失眠的最好---食物,不可错过!
7 年前
懒人医学考试中心  ·  2017年技能考官手册--7天满分--病历分析105-108
7 年前