大概是在上周四,许多渠道都传出消息称,苹果的AI进军中国市场已选定合作伙伴——百度。
这条消息在极客圈和IT达人圈中引起了轩然大波。
因为我们这些程序员、自认技术水平还算不错的人,一般并不使用百度搜索,而只用Google。
在我们看来,用百度搜索技术问题的效率低,而且常常出现错误或重复的信息,非常低效。
因此,我们普遍认为一个高效的程序员都会用Google,不用百度。
当然,在ChatGPT爆红之后的这一波AI浪潮中,我们对百度的文心一言也没有太高评价。很多人认为,在中国本土的大语言模型中,文心一言也并不是表现最佳的。各种排名和口碑来看,其他国内大语言模型都比百度好。
所以这次苹果选择百度自然就引发了极客圈内的强烈反应。特别大家是对百度的整体印象并不好。大家可能知道,百度的主要金主之一是莆田系医院。当年还有那个叫魏则西的男孩,因为在百度上搜索信息被误导,导致最终人财两空。这类事件让许多极客圈的人对百度非常不满。
然而,我觉得普通老百姓对此大多平静。毕竟如果你用国行iPhone,它的默认搜索引擎一直都是百度。当年苹果刚把国行iPhone的默认搜索设为百度时,可能有人抱怨过,但对普通大众来说,这并不是个大问题。
在中国大陆,普通用户对百度的认知度还是很高。虽然百度搜索存在各种各样的问题,但这么多年过去了,甚至有些人觉得Google搜索不如百度用得顺手。当然,Google离开中国多年,导致对国内网站的抓取也有问题。但总体上我们还是认为Google的内容质量更高。但是
,对普通大众来说,这可能不是什么大事。
极客圈真正关注的是,现在国内有一些大语言模型的效果和排名都要优于百度,那为什么苹果还是选了百度?这就是问题所在。
首先,苹果在中国选择一个大语言模型合作方,与在美国的做法肯定不同。在美国或其他地区的Apple Intelligence,其实有三层架构:
第一层是手机本地的小模型,即本地运行的大语言模型;
第二层是苹果服务器上的大语言模型,一个更大的模型;
第三层是当苹果自己的模型无法解决问题时,会把请求传给像ChatGPT这样的第三方服务。
在美国,这三层体系结构清晰,合作伙伴 ChatGPT只参与第三层。
然而在中国,这套模型体系都涉及到备案和审批的问题。很多人忽视的第一个问题就是:苹果在中国上线本地模型、服务器端模型,乃至与第三方模型合作,都需要走中国的法规流程。这对苹果来说,是一个非常棘手的问题。
也就是说,在中国,苹果必须找到一个本土伙伴,协助它完成这些审批和备案。这个要求不仅限于云端的大模型服务,还包括本地的小模型。根据我朋友阑夕老师周四转述的Information网站的采访内容来看,苹果可能需要与百度合作,共同训练一个适合放在手机上的小模型。
为什么要和百度一起训练呢?
一个很重要的因素是中文语言模型比英文更复杂。英文只有26个字母,词汇结构相对简单,而中文有数千乃至上万常用字符和大量词汇。训练中文大语言模型的复杂度远高于纯英文模型。即使苹果拥有一定的中文语料,也可能觉得与百度合作能更高效地获得更好的中文语料和训练支持。
然而,八卦消息中也提到,文心一言的泛化能力并不理想。当苹果尝试把自己在英文版Apple Intelligence上成熟使用的一套提示词(prompt)套用到文心一言时,效果并不如预期。这意味着与百度合作虽能解决审批和中文语料问题,但在模型质量上可能会有一定的折扣。
那么为什么非选百度不可?
其实,这个问题的核心也许根本不在技术本身。
关键在于,中国政府对互联网服务有自己的监管逻辑和要求。想要合法合规地在中国开展大语言模型业务,需要一整套的备案和审查程序。百度在这方面的经验和人脉都非常丰富。相比之下,苹果在中国的本土化经验主要集中在硬件和iCloud云服务的合规上,而非人工智能服务。百度深谙国内监管流程,知道如何通过各类审核关卡,公关流程和专家评审。苹果自己是搞不定这些事情的。
举例来说,Google当年进中国后发现自己无法适应本土监管的要求,因为中国政府并不像美国政府那样通过正式文件和明文法律要求删除某些搜索结果。中国监管往往更灵活、更隐蔽,这让坚持严格程序和记录的Google难以适应。最终,Google选择退出。
而苹果的策略不同,它主要靠卖硬件赚钱。硬件本质上不涉及价值观与信息审查,所以更易于在各国让步和妥协。苹果愿意在中国放置服务器、遵守本地法规来换取市场。而AI作为一项服务,如果想本地化,就必须寻求本土合作伙伴帮助应对监管,这就是为什么要找百度。
再者,苹果对AI的要求与其他纯AI公司不一样。Apple Intelligence可能不够优秀,但因为苹果的产品拥有庞大的用户基础,它并不需要在短期内就做得极其完美。只要它具备基础可用性,长期有时间慢慢打磨。
Siri就是一个案例:尽管Siri并不像Google Assistant或亚马逊Alexa那么智能,但它依然每天有高达十多亿次的调用量。用户依然买苹果的硬件,而不会因为Siri不够聪明就放弃iPhone。同理,Apple Intelligence只要能稳定上线,在中国有合规的环境,就可以一边迭代一边提升。