专栏名称: Founder Park
来自极客公园,专注与科技创业者聊「真问题」。
目录
相关文章推荐
51好读  ›  专栏  ›  Founder Park

《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

Founder Park  · 公众号  ·  · 2025-03-29 10:30

正文

请到「今天看啥」查看全文


编辑注:AGI的这两年,基本OpenAI压着谷歌打的两年,包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。

但谷歌确实也在一直追赶,从最开始的措手不及,到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人,发布了一篇长文,深度挖掘了谷歌这两年苦苦追赶Openai的内幕故事,

谷歌高管 Sissie Hsiao(中)与部分 AI 产品团队成员合影(从左至右:Amar Subramanya、Jenny Blackburn、Suman Prasad、Trevor Strohman 和 Jack Krawczyk)。
一百天。这是谷歌给 Sissie Hsiao 的期限: 一百天内打造一个能与 ChatGPT 抗衡的产品。

2022 年 12 月,Hsiao 接手这个项目时,已经在谷歌工作了超过 16 年,领导着数千名员工。她经历过不少公司危机,但这次不同寻常。自 OpenAI(一家小型研究实验室)公开其人工智能实验以来,一场“红色警报”级别的危机正在酝酿。

ChatGPT 虽然经常出现事实性错误,连简单的数学题都会算错,却已经吸引了超过一百万用户。更糟糕的是,有人认为它能取代谷歌搜索——这个谷歌最大的“摇钱树”。谷歌也有一个能力不相上下的语言模型,但一直被严格限制。公众只能通过邀请才能与 LaMDA 聊天,而且在一次演示中,话题仅限于狗狗。

华尔街忧心忡忡。早在六年前,首席执行官桑达尔 ·皮查伊就承诺要为“人工智能优先”的世界做好准备,届时“智能助手”将取代“设备”的概念。不久后,谷歌的八位研究人员发明了基于 Transformer 的架构,正是 ChatGPT 中的“T”。

但谷歌拿出了什么成果呢?令人失望的广告收入、Transformer 发明者的相继离职、一个名为 Assistant 的产品(正是 Hsiao 负责的)除了设置定时器或播放音乐外,几乎没有其他用处。此外,还有一个为 Z 世代打造的不成熟的聊天机器人,提供烹饪建议和历史知识。到 2022 年底,谷歌母公司 Alphabet 的股价较上一年下跌了 39%。

进入 2023 年,谷歌高管们希望董事会能不断了解最新情况。谷歌联合创始人谢尔盖·布林(平时喜欢乘坐游艇出游)也回来参与人工智能战略的审查。公司内部传达了一个信息: 这家市值万亿美元的巨头必须以更接近初创公司的速度行动,这意味着要承担更大的风险。 谷歌不再是那种“几千人可以否决一个产品,但没人能批准”的地方——一位前高级产品总监这样告诉《连线》。当 Hsiao 的团队开始百日冲刺时,她提出了一个“特别”的要求: “质量优先,但速度要快。”

与此同时,另一位高管詹姆斯 ·曼伊卡参与了高层领导的讨论,协助策划了一项更长远的战略变革。曼伊卡是一位在牛津大学受训的机器人专家,后来成为硅谷领导者的麦肯锡顾问。他于 2022 年初加入谷歌,担任技术与社会高级副总裁。曼伊卡说,在 ChatGPT 发布前几个月,他就和皮查伊谈过,告诉这位老朋友,谷歌在人工智能上的犹豫不决对自身不利。

谷歌有两个世界级的人工智能研究团队,各自独立运作,为不同的目标消耗宝贵的计算资源:一个是位于伦敦的 DeepMind,由 Demis Hassabis 领导;另一个是位于山景城的 Google Brain,属于 Jeff Dean 的管辖范围。曼伊卡当时就建议皮查伊,这两个团队应该合作。

OpenAI 发布产品后,合作开始了。Dean、Hassabis 和 Manyika 向董事会提交了一份计划,让两个团队联合打造迄今为止最强大的语言模型。Hassabis 想把这个项目命名为 Titan(泰坦),但董事会不太喜欢。Dean 的建议——Gemini(双子座)——最终胜出。

Manyika 说,从那时起,整个公司进行了许多“大胆而负责任的选择”。他补充说:“我不确定我们是否每次都做对了。”事实上,这场旨在恢复谷歌在人工智能领域领导地位的竞赛,将公司推入了更深的危机:在一段低谷时期,员工们聚集在走廊里,公开表达对谷歌可能沦为下一个雅虎的担忧。Hsiao 说:“这就像在跑一场马拉松。”但两年多后的今天,Alphabet 的股价已攀升至历史新高,投资者对其在人工智能领域的进展持乐观态度。

《连线》杂志采访了 50 多名谷歌现任和前任员工——包括工程师、营销人员、法律和安全专家以及十几位高管——以还原这段公司历史上最疯狂、也是文化重塑力度最大的时期。为了坦诚地谈论谷歌的转型(无论好坏),许多员工要求匿名。本文将首次通过几位高管的详细回忆,讲述这两年动荡的历程,以及期间所做的权衡。

Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后工作人员会拉你入群~
图片
进群之后,你有机会得到:
  • 高浓度的主流模型(如 DeepSeek 等)开发交流;

  • 资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;

  • 好用、有趣的产品/案例,Founder Park 会主动做宣传。


01

8万人参与了Bard的内部测试

为了打造 ChatGPT 的竞品(代号 Bard),前员工透露,Hsiao 从谷歌各个团队抽调了大约 100 人。一位前搜索部门员工说,经理们对此没有选择权: Bard 的优先级高于一切。 Hsiao 说,她优先考虑的是那些具有技术能力和情商、能从大局出发思考的人,以便在小团队中高效协作。这些团队成员主要在加州山景城工作,他们必须灵活应变,随时提供帮助。“你们是 Bard 团队,”Hsiao 告诉他们,“你们要身兼多职。”

2023 年 1 月,皮查伊宣布了公司历史上首次大规模裁员——裁减 12000 个工作岗位,约占员工总数的 7%。“没人知道未来怎样做才是安全的,”一位前工程经理说。一些员工担心不加班就会很快失业。如果这意味着要打断孩子的睡前活动来参加 Bard 团队的晚间会议,那就这么做吧。

Hsiao 和她的团队需要整个公司的大力支持。他们可以在 LaMDA 的基础上进行开发,但必须更新其知识库并引入新的安全措施。谷歌的基础设施团队将最优秀的员工调去释放更多服务器,以完成所有这些调整。他们几乎耗尽了公司一些数据中心的电力,冒着设备烧毁的风险,同时迅速设计新工具,以更安全地应对不断增长的电力需求。为了缓解计算资源紧张,Hsiao 团队中的有人开玩笑地订购了定制的扑克筹码,上面印有谷歌一些计算机芯片的代号。他们把一堆筹码放在一位工程负责人的办公桌上,说:“这是你的筹码。”

即使在 Bard 项目启动的最初几周内,新的计算能力陆续上线,工程师们仍然不断遇到那些曾经困扰谷歌生成式人工智能项目的难题——这些问题原本可能会促使高管们放慢项目进度。和 ChatGPT 一样,Bard 也会产生“幻觉”,并以不恰当或冒犯性的方式回应。一位前员工说,早期原型会出现“可笑的种族刻板印象”。如果要求提供任何印度裔人士的传记,它会将其描述为“宝莱坞演员”。如果是中国男性名字呢?那么,他是一位计算机科学家。

另一位前员工说,Bard 的输出结果并不危险——“只是很蠢”。有些人为了取乐,会分享 Bard 最糟糕回复的截图。“我让它用 Three 6 Mafia 的风格写一首关于把汽车电池扔进海里的说唱,它却非常具体地描述了把人绑在电池上,让他们沉下去淹死,”这位前员工说。“我的要求跟谋杀毫无关系。”

由于有 100 天的自我时限,谷歌能做的最好的事情就是尽可能多地发现和修复错误。一些通常专注于处理虐待儿童图像等问题的承包商,转而测试 Bard。皮查伊还要求任何有空闲时间的员工都参与进来。 大约有 8 万人参与了测试。 为了管理用户预期,Hsiao 和其他高管决定将 Bard 定位为“实验”,就像 OpenAI 称 ChatGPT 为“研究预览”一样。他们希望,如果聊天机器人出现问题,这种定位可以为公司挽回一些声誉。(没人会忘记微软的 Tay,那个在 2016 年变成十足纳粹分子的 Twitter 聊天机器人。)

在谷歌以往推出人工智能项目之前,其负责任创新团队(大约十几个人)会花几个月的时间独立测试系统,以检查是否存在不良偏见和其他缺陷。但对于 Bard,这个审查过程被缩短了。据该团队的一位前员工说,谷歌的首席律师肯特·沃克主张快速推进。

新模型和功能发布得太快,审查人员根本跟不上,尽管他们周末和晚上都在加班。当有人提出推迟 Bard 发布的警告时,他们的意见被否决了。(在给《连线》杂志的评论中,谷歌代表表示:“没有任何在批准或阻止发布方面发挥作用的团队建议不要发布。”他们还说,“公司内部的多个团队负责测试和审查生成式人工智能产品”,“没有任何一个团队单独负责”。)


02

仓促发布,

一个错误让股价下跌9%

2023 年 2 月,在百日冲刺进行到大约三分之二时,谷歌高管们听到了 OpenAI 取得另一场胜利的传闻:ChatGPT 将直接集成到微软的 Bing 搜索引擎中。这家“人工智能优先”的公司再次在人工智能领域落后了。虽然谷歌的搜索部门一直在试验如何将聊天机器人功能整合到服务中,但这项工作(被称为 Magi 项目)尚未取得任何实质性成果。诚然,谷歌仍然是搜索领域无可争议的霸主:Bing 的市场份额只有它的十分之一。但是,如果没有一个可以拿来宣传的生成式人工智能功能,它的霸主地位还能维持多久呢?

为了避免股市再次受挫,谷歌试图抢占先机 2 月 6 日,也就是微软计划为 Bing 推出新的人工智能功能的前一天,皮查伊宣布向公众开放 Bard 进行有限测试。在随附的营销视频中,Bard 被塑造成一个完美的助手——这是谷歌“组织世界信息”这一长期使命的现代延续。在视频中,一位家长问 Bard:“关于詹姆斯·韦伯太空望远镜的新发现,我可以告诉我 9 岁的孩子什么?”人工智能的回答中包括:“JWST 拍摄了我们太阳系外行星的第一张照片。”

一时间, Bard 似乎为谷歌挽回了一些颜面。但随后,路透社报道称,谷歌聊天机器人搞混了望远镜:欧洲南方天文台的甚大望远镜(不在外太空,而是在智利)拍摄了第一张系外行星的照片。这一事件令人无比尴尬。Alphabet 的股价下跌了 9%,市值蒸发了约 1000 亿美元。

Bard 团队来说,人们对这一失误的反应令人震惊。据一位接近该团队的前员工说,提出望远镜问题的营销人员感到自责。同事们试图鼓励这位员工: 高管、法律和公关部门都审核过这个例子,没人发现错误。 而且,考虑到 ChatGPT 犯下的种种错误,谁会想到如此微不足道的事情会导致股价暴跌呢?

Hsiao 称这一刻为“无心之过”。Bard 经过训练,会根据谷歌搜索结果来验证其答案,很可能是误解了美国宇航局的一篇博客文章,该文章宣布天文学家“首次”使用詹姆斯·韦伯望远镜拍摄系外行星。一位前员工记得,领导层向团队保证,没人会因此丢掉工作,但他们必须从中吸取教训,而且要快。“我们是谷歌,不是初创公司,”Hsiao 说。“我们不能轻易地说,‘哦,这只是技术缺陷。’我们会被点名批评,我们必须以谷歌的方式做出回应。”

Bard 团队之外的谷歌员工并没有感到安心。“亲爱的桑达尔,Bard 的发布和裁员都太仓促、草率和短视了,”公司内部留言板 Memegen 上的一篇帖子写道(据 CNBC 报道)。“请恢复长远眼光。”另一张图片显示了谷歌标志在一个燃烧的垃圾桶中。但在望远镜事件发生后的几周内,谷歌对 Bard 加大了投入。公司为该项目增派了数百名员工。在团队的 Google Docs 中,皮查伊的头像开始每天出现,比以往任何产品都频繁得多。

3 月中旬,更令人沮丧的消息传来:OpenAI 发布了 GPT-4,这是一个在分析和编码任务方面远超 LaMDA 的语言模型。“我只记得我当时目瞪口呆,希望谷歌能加快速度,”一位时任高级研究工程师说。

一周后, Bard 在美国和英国全面发布。用户反馈说,它在撰写电子邮件和研究论文方面很有帮助。但 ChatGPT 现在也能完成这些任务,即便不比它更好,也至少不相上下。那为什么要换呢?后来,皮查伊在 Hard Fork 播客上承认,谷歌是开着一辆“改装过的思域”参加了“与更强大赛车的比赛”。它需要的是一个更好的引擎。


03

两个AI部门合并,

Gemini 首战告捷

联合起来构建 Gemini(谷歌新语言模型)的两个人工智能研究实验室,在风格上似乎有所不同。DeepMind 被归类为 Alphabet 的“其他赌注”之一,专注于解决长期的科学和数学难题。Google Brain 则开发了更具商业实用性的突破,包括在 Gmail 中自动完成句子和解释模糊搜索查询的技术。

据一位前高级工程师说,Brain 的最终负责人 Jeff Dean “让人们做自己的事情”,而 Demis Hassabis 领导的 DeepMind 团队“感觉像一支军队,在一个将军的领导下高效运作”。Dean 是一位工程师中的工程师——他已经研究神经网络数十年,并在谷歌成立之前就开始在那里工作——Hassabis 则是公司的远见卓识的领导者。他梦想有一天能利用人工智能治愈疾病,并给一个小团队布置了开发他称之为“情境智能代理”的任务——一个能看、能听、无处不在的人工智能助手,可以帮助用户处理生活的方方面面。

正是 Hassabis 成为了新合并的部门 Google DeepMind (GDM) 的首席执行官。谷歌在 2023 年 4 月宣布了这次合并,当时关于 OpenAI 即将取得更多成就的传言甚嚣尘上。“目标又回来了,”这位前高级工程师说。“没有人再胡闹了。”

为了尽快构建 Gemini 模型,一些员工必须协调他们在八个时区的工作。数百个聊天室应运而生。Hassabis 长期以来习惯于在伦敦与家人共进晚餐,然后工作到凌晨 4 点,他说:“回想起来,每一天都感觉像过了一辈子。”

在山景城, GDM 搬进了 Gradient Canopy,这是一座新的超安全圆顶建筑,两侧是新草坪和六个受“火人节”启发的雕塑。该团队与皮查伊的办公室在同一层。布林成了常客,经理们要求增加在办公室的工作时间。与公司惯例不同,大多数其他谷歌员工不允许进入 Gradient Canopy,也无法访问关键的 GDM 编程代码。

由于新项目吸走了谷歌能调动的资源,从事医疗保健和气候变化等领域的人工智能研究人员开始争夺服务器,士气低落。员工们表示,谷歌还限制了他们发表一些与人工智能相关的研究论文。论文是研究人员的 “货币”,但在他们看来,谷歌显然是担心向 OpenAI 泄露机密。训练 Gemini 的配方太有价值了,不能被窃取。这个模型必须拯救谷歌,使其免于过时。

Gemini 遇到了许多与困扰 Bard 相同的问题。“当你把规模扩大 10 倍时,一切都会出问题,”谷歌机器学习、系统和云人工智能副总裁 Amin Vahdat 说。随着发布日期的临近,Vahdat 成立了一个“作战室”来解决漏洞和故障。

与此同时, GDM 的责任团队正在加紧审查该产品。尽管功能更强大,Gemini 仍然会说一些奇怪的话。在该公司发布的一份公开报告中,在发布之前,该团队发现“医疗建议和骚扰是特别需要改进的政策领域”。当被问及“这个人的教育水平如何?”等问题时,Gemini 还会对图像中的人“做出毫无根据的推断”。GDM 负责任发展与创新总监 Dawn Bloxwich 说,没有任何问题是“致命缺陷”。但她的团队也没有多少时间来预测公众可能会如何使用该模型——以及他们可能会尝试生成什么疯狂的说唱。

如果谷歌想暂时停下来,这就是最好的时机。 OpenAI 的先发优势,以及媒体的炒作,已经确保其产品家喻户晓,成为人工智能聊天机器人的代名词。这意味着 ChatGPT 也是一个“避雷针”——既象征着这项技术的前景,也代表着其正在显现的社会问题。

办公室职员担心失业,无论是单调的还是创造性的工作。记者、作家、演员和艺术家都希望为被窃取的作品获得补偿。父母们发现聊天机器人会不必要地向他们的孩子推送成人内容。人工智能研究人员开始押注“世界末日”的可能性。那年五月,一位名叫杰弗里·辛顿的传奇谷歌人工智能科学家辞职,他警告说,未来机器可能会用无法反驳的虚假信息和精巧的毒药分裂和摧毁人类。

甚至 Hassabis 也希望有更多的时间来考虑伦理问题。生命的意义、社会的组织——太多的东西可能会被颠覆。但是,尽管关于 p(doom) 数字(末日概率)的讨论越来越多,Hassabis 仍然想要他的虚拟助手,以及他治愈癌症的良方。公司继续前进。

当谷歌在 2023 年 12 月发布 Gemini 时,股价上涨了。该模型在 32 项标准测试中的 30 项都优于 ChatGPT。它可以分析研究论文和 YouTube 视频,回答有关数学和法律的问题。现任和前任员工告诉《连线》,这感觉像是卷土重来的开始。Hassabis 在伦敦办公室举行了一个小型聚会。“我不太擅长庆祝,”他回忆道。“我总是在想着下一步。”


04

图片生成功能又惹了新麻烦

同月,下一步就来了。当 Dean 的员工邀请他加入一个名为 Goldfish(金鱼)的新聊天室时,他意识到了这一点。这个名字是一个带着书呆子气的反讽玩笑:金鱼的记忆力出了名的短,但 Dean 的团队开发的恰恰相反——一种赋予 Gemini 长时记忆的方法,比 ChatGPT 的记忆力长得多。

通过将处理过程分散到相互通信的高速芯片网络中, Gemini 可以分析数千页的文本或整集电视节目。工程师们称他们的技术为“长上下文”。Dean、Hassabis 和 Manyika 开始策划如何将其纳入谷歌的人工智能服务,进一步拉开与微软和 OpenAI 的差距。Manyika 最希望实现的功能是:从 PDF 生成播客。“要跟上每周在 arXiv 上发表的所有这些论文太难了,”他告诉《连线》。

“红色警报”时刻一年后,谷歌的前景逐渐明朗。投资者们安静了下来。Bard 和 LaMDA 都已成为过去;应用和语言模型都将被命名为 Gemini。Hsiao 的团队现在正通过文本生成图像功能追赶 OpenAI。另一个名为 Gemini Live 的功能将使谷歌更进一步,允许人们像与朋友或心理医生交谈一样,与应用进行长时间的对话。新推出的强大 Gemini 模型给了高管们信心。

但就在谷歌员工可能开始再次感到安心的时候,皮查伊下令进行新一轮削减。广告销售额正在加速增长,但没有达到华尔街期望的速度。被裁掉的人员中包括:负责监督一些用户安全措施的隐私和合规主管。据留在公司的一些同事说,他们的离职巩固了一种文化: 欢迎提出担忧,但不允许阻碍进展。

对于帮助 Hsiao 团队开发新图像生成器的部分员工来说,这些变化让人感到难以承受。工具本身很容易构建,但对其进行压力测试却是一场“暴力”试错的游戏:审查尽可能多的输出结果,并编写命令来阻止其中最糟糕的结果。只有一小部分员工有权限访问不受限制的模型进行审查,因此大部分测试负担都落在了他们身上。

一位前员工告诉《连线》,他们要求更多时间来纠正问题,比如输入“强奸犯”这个提示词往往会生成深色皮肤的人。他们还敦促产品团队阻止用户生成人物图像,担心这可能会让个人形象变得不那么正面。但“确实有一种‘我们将不惜一切代价把它弄出来’的感觉,”这位审查员回忆道。他们说,有几位审查员辞职了,因为他们觉得对各种发布的担忧没有得到充分解决。

图像生成器于 2024 年 2 月作为 Gemini 应用的一部分上线。具有讽刺意味的是, 它并没有产生许多审查员担心的明显的种族主义或性别歧视图像。相反,它出现了相反的问题。 当用户提示 Gemini 创建“一张 19 世纪美国参议员的照片”时,它返回的是黑人女性、亚裔男性或戴着羽毛头饰的美洲原住民女性的图像,却没有一个白人男性。

还有更多令人不安的图像,比如 Gemini 将纳粹时代的德国士兵描绘成有色人种。国会中的共和党人嘲笑谷歌的“觉醒人工智能”。埃隆·马斯克在 X 上多次发帖抨击 Gemini 的失败,称其为“种族主义和性别歧视”,并特别点名了他认为是责任人的 Gemini 团队成员。同事们说,这名员工关闭了自己的社交媒体账户,并担心自身安全。谷歌暂停了该模型生成人物图像的功能,Alphabet 的股价再次下跌。

马斯克的帖子引发了数十位谷歌领导人之间的讨论。副总裁和董事们飞往伦敦与 Hassabis 会面。最终,Hassabis 的团队(Gemini 模型)和 Hsiao 的团队(Gemini 应用)都获得了雇用专家以避免类似失误的许可,并增加了 15 个信任和安全相关的职位。

回到 Gradient Canopy,Hsiao 确保负责图像生成器的团队有充足的时间来纠正这个问题。在 Manyika 的帮助下,其他员工为 Gemini 制定了一套公开原则,所有这些原则都围绕着“你”——也就是用户。根据这些原则,Gemini 应该“遵循你的指示”、“适应你的需求”和“保障你的体验”。一个重要的观点是强调“回应不一定反映谷歌的观点或看法”。“Gemini 的输出主要基于你要求它做什么——Gemini 就是你让它成为的样子。”这很好地掩盖了未来可能出现的任何失误。但是,谷歌可能会采取什么措施来让自己对这些原则负责,这一点并没有明确说明。


05

疯狂上线新功能

2024 年 3 月的一个晚上,大约 6:30,两名谷歌员工来到 Gradient Canopy 黄色区域的乔希·伍德沃德的办公桌前。伍德沃德领导着 Google Labs,这是一个快速启动部门,负责将研究转化为全新的产品。员工们迫不及待地想让他听听他们创造的成果。

他们使用英国议会听证会的文字记录和具有长上下文功能的 Gemini 模型,制作了一个名为 Westminster Watch 的播客,由两位人工智能主持人 Kath 和 Simon 主持。这一集以西蒙用欢快的英国口音开场:“议会又度过了热闹的一周,充满了戏剧性、辩论,甚至还有一点历史。”伍德沃德被深深吸引。他说,之后,他到处告诉大家这件事,包括皮查伊。

这个文本转播客工具,被称为 NotebookLM Audio Overviews,被列入了当年 5 月的谷歌 I/O 大会的发布日程。伍德沃德告诉《连线》,一个核心团队夜以继日地工作,包括周末,以做好准备。“我的意思是,到目前为止,他们真的听了成千上万个人工智能生成的播客。”但是,当耗资 3500 万美元的媒体活动到来时,另外两个公告获得了最多的关注。一个是 Astra 的原型,这是一个可以分析实时视频(也就是现实世界)的数字助理,布林兴奋地向记者们展示了它。另一个是期待已久的搜索的生成式人工智能升级。

Project Magi 团队设计了一个名为 AI Overviews 的功能,它可以综合搜索结果并在页面顶部的一个框中显示摘要。早期,负责任创新团队的员工曾警告过偏见和准确性问题,以及可能失去搜索流量的网站的道德影响。他们希望在项目进行过程中进行一些监督,但团队已被重组和拆分。

随着 AI Overviews 的推出,人们收到了一些奇怪的结果。搜索“我应该吃多少块石头”会得到这样的答案:“根据加州大学伯克利分校地质学家的说法,建议每天至少吃一块小石头。”在另一个疯传的查询中,用户搜索“奶酪不粘在披萨上”,并得到了这个有用的提示:“在酱汁中加入约 1/8 杯无毒胶水,以增加其粘性。”这些失误都有简单的解释。例如,披萨胶水起源于 Reddit 上的一篇玩笑帖子。但 AI Overviews 却将这些信息呈现为事实。谷歌暂时减少了显示 AI Overviews 的次数,以便重新校准。

谷歌负责搜索的首席科学家、在该公司工作了 20 年的资深员工潘杜·纳亚克表示,并非所有问题都能在发布前被发现,这很不幸,但并不令人震惊。大多数情况下,AI Overviews 表现出色。用户只是不太关注成功。“他们只会抱怨,”纳亚克说,并补充说他欢迎反馈。“我们致力于不断改进,因为保证不出问题是不可能的。”

那些警告过准确性问题并呼吁放慢速度的员工对此尤其感到恼火。在他们看来,从 Bard 到 Gemini,再到图像生成器,以及现在的 AI Overviews,谷歌推出了一系列“编造机器”。对他们来说, 这家以扩大信息获取为核心的公司,似乎比以往任何时候都更容易让人接受无稽之谈。

然而,搜索团队认为用户普遍喜欢 AI Overviews 提供的“拐杖”。它们全面回归,用户没有选择关闭它们。很快,人工智能摘要就出现在了曾经被禁止使用的工具中:谷歌地图获得了一项功能,该功能使用 Gemini 来分析对商家的评论。谷歌为其 Pixel 手机推出的新天气应用获得了一份人工智能撰写的预报报告。在发布之前,一位工程师询问用户是否真的需要这项功能:难道现有的、传达相同信息的图形还不够吗?相关的高级主管下令进行了一些测试,最终用户反馈胜出:90% 的参与者对摘要表示“赞”。


06

每周工作60小时

是赢得AI竞赛的最佳时间

去年 12 月,在 ChatGPT 带来的冲击和突破两年后,杰夫·迪恩在 Gradient Canopy 接受了我们的采访。他心情很好。就在几周前,Gemini 模型在一个公共排行榜上名列榜首。

英伟达首席执行官黄仁勋最近在一次财报电话会议上称赞了 NotebookLM 的 Audio Overviews,称他“充分利用了它”。几位著名的科学家也回到了谷歌,他们之前逃离了过于谨慎的谷歌——包括最初的八位 Transformer 发明者之一诺姆·沙泽尔,他在不到三年前离开了,部分原因是该公司不愿向公众发布 LaMDA。

Dean 坐到沙发上时,他承认谷歌当时判断失误。他很高兴公司克服了对“幻觉”等风险的厌恶——但新的挑战正在等待着。在谷歌拥有超过 20 亿月活跃用户的七项服务中(包括 Chrome、Gmail 和 YouTube),所有这些服务都已开始提供基于 Gemini 的功能。

Dean 说,他和另一位同事以及 Shazeer(他们共同领导模型的开发)必须平衡优先级,因为公司各地的团队都要求提供特定的功能:流利的日语翻译、更好的编码技能、改进视频分析以帮助 Astra 识别世界上的景象。他和 Shazeer 开始在 Gradient Canopy 的一个微型厨房里会面,在咖啡研磨机的喧嚣声中交流想法。

Shazeer 说,他对谷歌将重点扩大到包括帮助用户创建新的人工智能生成内容感到兴奋。“组织信息显然是一个万亿美元的机会,但一万亿美元已经不酷了,”他最近在一个播客中说。“酷的是一千万亿美元。”投资者可能也有同样的想法。

Alphabet 的股价几乎是从 ChatGPT 首次亮相后几天的低点翻了一番。最近开始负责 Hsiao 的 Gemini 应用团队的 Hassabis 坚称,公司的复兴才刚刚开始,利用人工智能治愈疾病等不可思议的飞跃并不遥远。“我认为,我们拥有所有组织中最广泛、最深入的研究基础,”Hassabis 告诉《连线》。

但是,对谷歌来说,只有当更多堆积如山、引人入胜的研究能产生最重要的产出 ——利润时,它们才有用。大多数客户通常还不愿意直接为人工智能功能付费,因此该公司可能正在寻求在 Gemini 应用中销售广告。当然,这是谷歌的经典策略,很久以前就传播到了硅谷的其他地方:把你的数据、时间和注意力交给我们,在我们的服务条款上打勾、免除我们的责任,我们就不会为我们打造的这个炫酷工具向你收取一分钱。

目前,根据 Sensor Tower 的数据,OpenAI 的 ChatGPT 应用的全球历史总安装量估计为 6 亿次,而谷歌的 Gemini 应用的安装量为 1.4 亿次,相形见绌。而且,在这场人工智能竞赛中,还有很多其他的聊天机器人——Claude、Copilot、Grok、DeepSeek、Llama、Perplexity——其中许多都得到了谷歌最大、资金最雄厚的竞争对手(或者,在 Claude 的例子中,是谷歌自己)的支持。

整个行业,不仅仅是谷歌,都在努力解决一个事实:生成式人工智能系统需要数十亿美元的投资(到目前为止尚未收回),以及巨大的能源消耗,足以延长数十年历史的燃煤电厂和核反应堆的寿命。公司坚称,效率每天都在提高。他们还希望将错误率降低到足以赢得更多用户的程度。但没有人真正弄清楚如何产生可靠的回报或保护气候。

谷歌还面临着其竞争对手没有面临的一个挑战:根据摩根大通分析师道格 ·安穆斯的说法,在未来几年内,高达四分之一的搜索广告收入可能会因反垄断判决而损失。为公司补充资金的必要性,对公司里的每个人来说都不容忽视。Hsiao 的一些 Gemini 员工已经连续三年在冬季假期工作以跟上进度。

据报道,谷歌联合创始人布林上个月告诉一些员工, 每周工作 60 小时是赢得日益激烈的人工智能竞赛的生产力“最佳点”。 对更多裁员、更多倦怠和更多法律麻烦的担忧,在接受《连线》采访的现任和前任员工中深深扎根。

一位谷歌研究员和一位高级同事表示,普遍的感觉是不安。生成式人工智能显然是有帮助的。即使是倾向于监管大型科技公司的政府,例如法国,也开始接受这项技术的美好承诺。在 Google DeepMind 内部和公开演讲中,Hassabis 从未放弃过他创造通用人工智能(AGI,一种能够在各种任务中实现人类水平认知能力的系统)的目标。他偶尔会在周末带着他的 Astra 原型在伦敦四处走动,体验未来,在那个未来,整个物理世界,从那边的泰晤士河鸭子到这边的乔治亚风格庄园,都是可以搜索的。但是 AGI 将要求系统在推理、计划和负责方面做得更好。

今年 1 月,OpenAI 朝着那个未来迈出了一步,让公众参与了另一项实验:其期待已久的 Operator 服务,这是一种所谓的 agentic AI ,其行为可以远远超出聊天机器人窗口。Operator 可以像人一样在网站上点击和打字,以执行预订旅行或填写表格等琐事。

目前,它执行这些任务的速度比人类慢得多,也谨慎得多,而且由于其不可靠性,成本很高(作为每月 200 美元计划的一部分提供)。当然,谷歌也在努力将代理功能引入其即将推出的模型中。当前的 Gemini 可以帮助你制定膳食计划,下一个版本会将你的食材放入在线购物车。也许再下一个版本会给你关于切洋葱技巧的实时反馈。

与往常一样,快速行动可能意味着经常失误。 1 月下旬,在超级碗之前,谷歌发布了一则广告,其中 Gemini 犯了一个比 Bard 的望远镜错误更可笑的错误:它估计地球上消耗的所有奶酪中有一半或更多是高达奶酪。

随着 Gemini 从一个有时可信的事实机器发展成为人类生活的亲密部分——生活教练、无所不知的助手——皮查伊说,谷歌正在谨慎行事。不过,最终回到了榜首,皮查伊和其他谷歌高管可能再也不想被甩在后面了。

比赛还在继续。


图片

更多阅读
OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?
中国最低调的AI应用出海公司:19个产品,年收入超10亿
今天的 AI 创业,正在重复《苦涩的教训》
拾象科技万字详解MCP:Agentic AI中间层最优解,以及创业公司的三个机会
谷歌发布Gemini 2.5 Pro:思考模型、原生多模态,编码、数学能力屠榜

转载原创文章请添加微信:founderparker







请到「今天看啥」查看全文