专栏名称: AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
目录
相关文章推荐
LCA  ·  一棵树,让我觉得安静 ·  20 小时前  
最爱大北京  ·  2月22日 | 京城事儿全知道 ·  2 天前  
最爱大北京  ·  北京:马松莉被查 ·  2 天前  
康石石  ·  拿到藤校奖学金的作品集长什么样? ·  3 天前  
51好读  ›  专栏  ›  AI科技大本营

“百模大战”与开闭源路线交织的模型生态

AI科技大本营  · 公众号  ·  · 2024-07-30 16:51

正文

投稿 | 中信出版集团,节选自《云上的中国》

责编 | 梦依丹

出品丨AI 科技大本营(ID:rgznai100)


群雄并起的中国市场
欧美市场各家大模型企业各自的技术优势和商业模式都相对清晰,而中国市场的竞争更加碎片化,变化速度也更快,各家大模型企业的技术定位也还相对模糊和同质化。
由于初期没有像 OpenAI 这样具有明显技术优势的大模型公司出现,中国大模型市场很快进入“百模大战”的阶段。国家互联网信息办公室公布,截至 2024 年 3 月,我国共有 117 个生成式人工智能服务完成了备案,包括通义千问大模型、文心一言、智谱清言(ChatGLM)、云雀大模型、abab、日日新、星火认知大模型、华为云盘古 NLP 大模型及滴滴出行大模型等。参与竞争的包括初创公司、科技行业巨头和互联网平台企业等三方势力,形成了一个多方混战的格局。
此外,由于软件生态没有美国市场成熟,中国大模型企业在开闭源路线的选择上也更加灵活兼容,更多是根据市场需求提供不同的开闭源选择,而非像 Llama 和 GPT 一样泾渭分明。
从本质上看,开源和闭源的选择是两种商业逻辑的选择。开源更看重生态的建设,先推动大模型产业的建设,再谋求商业化变现的机会;而闭源路线则更注重打造产品的稳定性和体验,用产品去赢得客户。这体现的是每家公司对企业战略和行业生态的不同思考。
目前, 中国大模型在路线选择上分为两种主流路线:第一种是闭源 ,例如云厂商的代表百度、腾讯和华为等都采用闭源大模型路线; 第二种则是开源和闭源兼顾 ,例如百川智能在发布 Baichuan-7B、Baichuan-13B 开源大模型后,又发布了 Baichuan-53B 闭源大模型。此外,出身于院校研究院的智谱 AI 的 GLM 是开源大模型,但也为客户提供闭源大模型服务。值得一提的是,阿里云是全球云厂商中对开源模型支持程度最高的企业之一,通义大模型系列在 2023 年完成了全尺寸和全模态的开放。

书名:《云上中国3》

作者:吴晓波

泾渭分明的欧美市场
先看欧美市场,表现最突出的三家闭源大模型公司分别是 OpenAI、Anthropic 和谷歌的 Gemini。由于前文已经介绍过 OpenAI 研发大模型的过程,此处不再赘述。但需要注意的是,OpenAI 仍被公认为掌握了大模型核心秘密的公司,其领先地位尚未动摇,其他公司还处于追赶状态。
与 Open AI 师出同门的 Anthropic
2020 年, OpenAI 负责开发 GPT-2 和 GPT-3 的研究副总裁达里奥·阿莫迪(Dario Amodei)和安全政策副总裁丹妮拉·阿莫迪(Daniela Amodei)选择离开 OpenAI,创建了 Anthropic。短短三年后,兄妹两人的公司以超 180 亿美元的估值寻求新的融资,俨然已经成为 OpenAI 在全球最大的竞争对手之一。
阿莫迪兄妹和 OpenAI 分手,既有桌面上的理念之争,也潜伏着资本的暗流涌动。“反叛”的兄妹两人在 OpenAI 各自担任要职,达里奥主导了 GPT-3 的研发工作,丹妮拉则负责公司的风险与合规工作。也许是由于丹妮拉扮演着“守门人”的角色,兄妹两人在发展通用工人智能的节奏上偏向保守,与激进的技术加速派 CEO 萨姆·奥尔特曼在理念上有严重分歧。两人认为,AI 的发展要首先保障人类的安全。后来 OpenAI 爆发的“宫斗”大戏,也再次印证了 OpenAI 内部技术加速派与伦理派之间长期存在的矛盾,这也是当前所有大模型公司,乃至整个人类社会必须解决的挑战。
当然,理念不合只是原因之一。硅谷从来痛恨垄断和一家独大,传统的科技巨头最不想看到 OpenAI 全面倒向微软的局面出现。阿莫迪兄妹出走,“正好”与微软向 OpenAI 伸出橄榄枝的时间段重合。
Anthropic 成立后也迅速获得了谷歌、亚马逊和赛富时三家巨头的投资。其中谷歌持股达到了 10%,而亚马逊云则在 2023 年底与 Anthropic 达成独家合作协议,独占其对话模型 Claude 2 的某些企业服务功能。
在巨头的支持下,Anthropic 的估值迅速增长,已经成为 OpenAI 的最大竞争对手之一,它们也是目前全球估值最高的两家大模型初创公司。
与 OpenAI 相对激进的商业化态度不同,Anthropic 显得低调很多。达里奥·阿莫迪曾在接受媒体访问时表示,Anthropic 始终把安全和稳定性当作首要问题进行考虑,这是因为公司目前的主要客户是 B 端客户,而安全性也是这一客群最为关注的点。
基于对安全性的高度重视,Anthropic 推出了 Constitutional AI(宪法AI)的概念,指在模型设计和训练过程中融入约束和监督,大模型系统遵循特定的行为规范,类似于社会契约和宪法对公民的要求。达里奥认为,Constitutional AI 将促使 AI 与大众利益相一致,提高人机合作与互信的基础。这也被视为 Anthropic 开发 Claude 的核心设计理念之一。

姗姗来迟的 Gemini
作为老牌 AI 领军者,谷歌也不甘一直被 OpenAI 压制。受限于基础模型的能力,被寄予厚望的对话应用 Bard 并没有给 ChatGPT 带来实质性的威胁。终于到 2023 年底,谷歌推出了 Gemini,其开发团队正是在人机围棋大战中一战成名的 AlphaGo 的开发团队——DeepMind。在纸面上,Gemini 是谷歌目前最强大的基础模型。
在谷歌提供的各种测试成绩中,Gemini 都超越了 GPT-4。在大规模多任务语言理解测试里,Gemini 还超越了人类专家,成为首次在该子任务中超越人类的 AI。
抛开这些技术指标,在发布演示中最引人注目的是 Gemini 强大的多模态能力。在演示中,其对人类画出的涂鸦的理解能力让人感到震惊。
尽管技术演示非常惊艳,但事后也有新闻爆出谷歌在演示中作弊,对多模态演示视频进行了人工剪辑——在多次推理任务中选择了较好的结果。但无论如何,Gemini 已经展示了其强大的技术能力,在实际使用中能实现多少,还需拭目以待。
在开源领域,目前最引人注目的两家欧美公司就是 Meta 和 Mistral。

另辟蹊径的 Meta Llama 2
与前两家公司不同,Meta 和其 Llama 系列率先占据了开源大模型的生态定位。在互联网巨头中,Meta 和其前身脸书其实在 AI 领域早已布局,特别是对顶尖 AI 科学家的招募。在“深度学习之父”辛顿加入谷歌后,脸书紧随其后,在 2013 年将与辛顿并称为“AI 三巨头”之一的杨立昆(Yann LeCun)招致麾下,成为首席 AI 科学家。
Meta 没想到的是,Transformer 和 GPT-3 在大模型方向上的爆发,一下让 Meta 落后 OpenAI 和谷歌几个身位。面对不利局面,Meta 另辟蹊径地选择了“团结群众”的开源路线,一举成为 AI 时代的开源先锋。
2023 年 2 月 Meta 发布了 Llama 一代开源大模型,从此这只“羊驼”与 Java 企鹅和 GitHub 章鱼猫一样,成为“开源动物园”的明星之一。2023 年 7 月,Llama 二代发布,这款 700 亿参数的大模型已经成为全球最受欢迎的开源大模型。
在算力方面,截至 2023 年底,Meta 已经是全球采购 H100 显卡数量最多的企业,甚至超过了拥有大量智能算力云服务的微软,这显示其全力投入 AI 的决心。






请到「今天看啥」查看全文