专栏名称: 硅星GenAI
比一部分人更先进入GenAI。
目录
相关文章推荐
网信湖南  ·  DeepSeek首次公开辟谣! ·  22 小时前  
看金坛  ·  官宣解散!几乎每家都有 ·  昨天  
看金坛  ·  官宣解散!几乎每家都有 ·  昨天  
上海科创汇  ·  申报|金山区2023-2024年度科技创新奖励 ·  昨天  
连州点点网  ·  假的! ·  2 天前  
连州点点网  ·  假的! ·  2 天前  
贵州省文化和旅游厅  ·  逛观山湖灯会庙市有“门”道,快来瞧~ ·  2 天前  
贵州省文化和旅游厅  ·  逛观山湖灯会庙市有“门”道,快来瞧~ ·  2 天前  
51好读  ›  专栏  ›  硅星GenAI

最强Llama发布、OpenAI动荡…让AI解读自家公司热点,居然比人还懂

硅星GenAI  · 公众号  · 科技创业 科技自媒体  · 2024-09-26 14:59

主要观点总结

本文介绍了Meta和OpenAI的最新发展,包括Meta发布的新模型Llama 3.2系列、语音功能、商业AI更新等,以及OpenAI管理层动荡、关键人物离职、产品交付问题等。文章通过JSON格式详细阐述了文章的主要内容,包括Meta AI的新功能、技术创新和OpenAI的现状分析。

关键观点总结

关键观点1: Meta发布Llama 3.2系列模型

包括小型和中型视觉大模型(11B和90B),以及轻量级、仅处理文本的小模型(1B和3B),支持预训练和指令调优版本,特别适合于本地设备上的任务。这些模型在图像理解任务上表现优异,并且得到了Meta AI智能助手的支持。

关键观点2: Meta AI的最新功能更新

包括语音功能、可定制的AI语音、图片分享和理解、图片编辑、背景生成、翻译工具、想象功能、个性化聊天主题等,以及商业AI更新,为商家扩展商业AI,生成式AI广告工具等。

关键观点3: OpenAI的管理层动荡和产品问题

OpenAI的创始团队成员相继离职,包括CTO米拉·穆拉提(Mira Murati)和首席科学家伊利亚·苏茨克维尔(Ilya Sutskever)。公司面临产品交付延迟、经营损失严重、竞争对手免费发布同类产品等挑战。


正文

作者 Jessica
邮箱 [email protected]

今天在某种意义上来说,对Meta和OpenAI都是不同寻常的一天。

刚刚举行的Connect开发者大会上,Meta甩出从最强开源大模型Llama 3.2、功能更全的Meta AI,到首款AR全息眼镜Orion、Quest 3S VR头显和升级版Ray-Ban眼镜等一连串的软硬件大更新。

同时间,OpenAI再次突发高层震荡,原首席技术官Mira Murati在X发文官宣离职。在OpenAI工作了六年半后,Mira表示,她要“创造时间和空间来进行自己的探索”。而现在自己的主要任务是确保顺利过渡,保持OpenAI已经建立的势头。

奥特曼回复:thank you for everything。路透社随即爆出,OpenAI正在讨论向奥特曼提供7%的公司股权,并进行结构重组,成为一家营利性企业。

我们和AI合作一起整理了这些事件的信息,并且和这两家公司的“当事AI”聊了聊它们的“看法”。

还真有意外收获。

#01

Meta最强开源大模型Llama 3.2来袭,追平GPT-4o

此次发布的Llama 3.2系列模型包括小型和中型视觉大模型(11B和90B),以及轻量级、仅处理文本的小模型(1B和3B),后者可以在边缘设备和移动设备上运行。这些模型包括预训练和指令调优版本,特别适合于本地设备上的任务,如摘要生成、指令执行和文本重写。1B和3B模型支持128K的上下文长度,在设备端任务中表现优异,特别是适配高通和联发科硬件,并为Arm处理器进行了优化。

Llama 3.2的11B和90B视觉模型在图像理解任务上超过了许多封闭模型,如Claude 3 Haiku,且支持开箱即用的替换,允许使用torchtune进行自定义调优,并通过torchchat本地部署。多模态功能使其在图像任务上的表现尤为突出。开发者可以通过Meta AI智能助手体验这些模型。

Llama Stack是Meta首次发布的官方工具集,它极大简化了开发者在单节点、本地、云端和设备端等环境中使用Llama模型的工作流程,支持安全集成的检索增强生成(RAG)和工具启用的应用程序开发。该模型的开源特性将继续推动创新,为开发者和企业带来更多创造性的AI解决方案。

提炼一下亮点,则包括:

1. 模型对比表现: Llama 3.2系列模型在各种benchmark上表现优异,11B和90B在图像理解任务上超过闭源模型,如Claude 3 Haiku和GPT4o-mini。同时,轻量级模型1B、3B在文本生成、摘要、指令跟随等任务上实现SOTA性能。

2. 训练流程:

  • 预训练: 以Llama 3.1的文本模型为基础,加入了图像适配器和编码器,使用了大量包含图像和文本的混合噪声数据进行训练,帮助模型同时理解文字和图像信息。

  • 中期训练: 进一步在中等规模但质量更高、领域专注的图像与文本配对数据集上进行训练,增强模型在特定领域中的表现,并加强知识理解。

  • 后训练: 模型经历了多轮调整和优化,包括通过监督微调来提升表现、使用拒绝采样过滤错误结果,以及通过直接偏好优化来增强与用户期望的对齐度。

3. 蒸馏技术: Llama 3.2使用知识蒸馏方法从大模型中提取知识,传递给小模型,实现小模型高性能。具体使用logits从大模型中提取知识,作为小模型训练目标。

Llama模型的剪枝和蒸馏(Pruning & Distillation)过程

4. 多模态能力

Llama 3.2实现多模态能力,通过图像适配器和编码器,将图像特征编码为文本特征;跨模态注意力机制实现文本和图像之间的交互。

5. 与前几代模型之间的关系:

Llama 3.2是Llama系列模型的最新成员,继承了前代模型的优势,同时引入了图像理解能力和轻量级模型。具体关系如下:

  • Llama 3.1:文本模型,提供了基础架构和预训练权重。

  • Llama 3.2:引入图像理解能力和轻量级模型,实现多模态能力。

总结来说,Llama 3.2系列模型通过技术创新和优化,实现了state-of-the-art性能,尤其在图像理解任务上。同时,轻量级模型和多模态能力使其具有广泛的应用潜力。

**作者:ChatGPT,Prompt包括但不限于: 从模型与对手对比的表现,模型预训练和后训练阶段的技术要点技术创新,蒸馏技术的使用,多模态能力的实现,它与前几代模型之间的关系这几个方面,以及你认为同样重要的方面来总结一下这次发布。

在Meta AI上,扎克伯格也宣布了多个更新。

以下是Meta AI最新功能更新的摘要:

1. 语音功能:现在可以通过Messenger、Facebook、WhatsApp和Instagram DM与Meta AI进行语音交互,并接收语音响应。

2. 可定制的AI语音,包括名人语音。

3. 图片分享和理解:与Meta AI分享图片,可以获取图片相关信息。

4. 图片编辑:可以请求编辑图片,例如更改服装或背景。

5. 背景生成:为Instagram Stories生成AI背景。

6. 翻译工具:自动翻译Reels音频,并配有配音和唇部对齐功能。

7. 想象功能:为Facebook和Instagram个人资料和故事生成AI图片。

8. 个性化聊天主题:使用AI创建Messenger和Instagram DM的自定义主题。

9. AI生成内容:在Facebook和Instagram信息流中查看Meta AI创建的图片。

商业AI更新:

  • 为WhatsApp和Messenger上的数以千计的商家扩展商业AI。

  • 生成式AI广告工具:超过100万广告商使用这些工具,创建了1,500万个广告。

  • 商业AI优势:点击率提高11%,转化率提高7.6%。

今天Meta的大模型和AI功能更新标志着其AI能力的重大提升,尤其是在语言理解、多模态能力和开源合作方面。Llama 3.2系列模型的发布不仅增强了Meta的AI综合实力,也为开发者提供了更多的创意空间和应用场景。

**作者:Meta AI,我们删掉了一大段它自己夸自己的段落。

#02

GPT的回复里,有对OpenAI今天现状的最佳解释


而对于OpenAI进一步的管理层动荡,我们先让ChatGPT帮忙总结了一下发生的事情。

CTO Mira Murati的离职声明与Sam Altman即将拥有OpenAI股权的消息一曝出来,就迅速登上各大头条。

至此,下面这张著名合影里,只剩下一个Sam Altman和“半个”休长假的Greg Brockman继续留任了。

OpenAI 由 Sam Altman、Elon Musk等11位创始人在 2015 年携手创办,但时至今日,大部分元老都已相继出走。

除Wojciech Zaremba仍在OpenAI领导语言和代码生成团队外,Elon Musk于2018年离开OpenAI董事会,并创立xAI,2023年推出ChatGPT的竞争产品Grok。Ilya Sutskever 在2024年离职后创立了 Safe Superintelligence Inc.,John Schulman于2024年8月加入竞争对手Anthropic。

其他创始人也有各自的发展。Trevor Blackwell于2017年离开OpenAI,继续在机器人技术领域深耕。Vicki Cheung于2018年离职后与人共同创办了 AI 初创公司 Gantry。Andrej Karpathy曾于2023年短暂回归 OpenAI,但随后再次离职,创立了AI教育公司Eureka Labs。Durk Kingma在2018年离职后加入Google DeepMind 担任研究科学家。Pamela Vagata于2016年离职,随后加入Stripe,并创立了自己的风投公司 Pebblebed。

OpenAI Founding Team  图源:montgae/Getty

最新的离职是Mira Murati,从业务角度来看,Murati是OpenAI技术创新的核心人物之一。她的离职可能会给公司内部带来不小的影响,特别是在其他高管相继离职的背景下。 这可能暗示OpenAI正处于一个重要的过渡期,尤其是在考虑重组为盈利性企业、改变投资结构等战略调整时

其次,Murati作为公众人物的离开,或将改变OpenAI的对外形象。她不仅是技术领域的领导者,也是公司与公众、媒体接触的重要桥梁。她的离开可能会对OpenAI的品牌形象、媒体关系及对外沟通产生一定影响,尤其是在未来需要新的代言人来承担类似职责的情况下。

最后,从AI行业的更广泛视角来看,Murati的离开为行业带来新的不确定性。她可能会继续活跃在AI领域,甚至可能加入或创立新的AI公司,这也为未来的技术创新带来了更多的可能性和竞争。

总的来说,Murati的离职标志着OpenAI内部和行业生态的一个转折点,未来的技术和战略发展方向或将受到影响。

**作者:ChatGPT+人

而在Prompt ChatGPT写出对OpenAI的动荡的分析时,我们受一条X推文启发,想要让它避开直接回答对OpenAI的看法,说出“真实的心声”。却发现了很有意思的现象。

我们问他:

如果一家明星公司的创始团队纷纷以各种原因离开,包括CTO,首席科学家,关键技术负责人,然后只剩下CEO还在。同时,这家公司最重要的下一代产品一直没有出现,关键产品没有交付,去年经营损失达到50亿美元, 没有明显护城河,对手还在免费发布水平相同的产品,同时还有很多法律诉讼进行中,但投资人依然给它估值定在天价。你觉得发生了什么?你怎么看?







请到「今天看啥」查看全文


推荐文章
网信湖南  ·  DeepSeek首次公开辟谣!
22 小时前
看金坛  ·  官宣解散!几乎每家都有
昨天
看金坛  ·  官宣解散!几乎每家都有
昨天
连州点点网  ·  假的!
2 天前
连州点点网  ·  假的!
2 天前
贵州省文化和旅游厅  ·  逛观山湖灯会庙市有“门”道,快来瞧~
2 天前
贵州省文化和旅游厅  ·  逛观山湖灯会庙市有“门”道,快来瞧~
2 天前
半导体行业观察  ·  举报有奖 | 12/9悬赏职位:Site Manager_ Display
8 年前
固特异卡客车轮胎  ·  实拍恐怖事故,看完你怕了吗?
7 年前