主要观点总结
本文主要描述了苹果选择阿里作为其国行版AI的合作伙伴的过程和原因,以及阿里Qwen模型的优势和特点。
关键观点总结
关键观点1: 苹果选择阿里作为合作伙伴
苹果经过多轮考察,最终选择阿里作为其国行版AI的合作伙伴,而不是最热闹的、呼声最高的或反对声最强烈的公司。
关键观点2: 阿里Qwen模型的技术实力
Qwen模型在开源社区表现出强大的实力,被认为是业界领先的开源大模型之一。它满足了苹果对AI功能的高标准要求。
关键观点3: 阿里的优势
相比其他AI初创企业,阿里作为中国老牌AI巨头,更熟悉国内用户需求,更了解数据合规政策,为苹果AI功能的本地化适配和快速落地提供了重要保障。
关键观点4: Qwen模型在苹果生态中的应用
Qwen模型很可能以两种形式融入iPhone生态:作为第三方LLM提供全功能AI服务,以及与阿里合作部署开发蒸馏版小模型。此外,Qwen模型的多模态能力和模型压缩技术的突破也值得关注。
关键观点5: 苹果和阿里合作的未来展望
合作将助力苹果打造真正的系统级AI助理,实现AI手机的生态整合和用户体验的提升。这种合作也暗示着AI手机的竞争正在从单纯的技术比拼,转向生态整合和用户体验的比拼。
正文
当所有人都在猜测苹果国行 AI 的下一步棋会落在哪里时,答案既出人意料又在情理之中。
不是最热闹的,不是呼声最高的,也不是反对声最强烈的,而是最低调的那个——阿里。
在之前发布的文章中,我们也注意到评论区网友态度的两极分化。有人认为阿里是实至名归的最佳人选,也有人对苹果绕过 DeepSeek 而选择阿里表示不解。
但如果回望整个筛选过程,DeepSeek 被苹果放弃或许真的不冤。
在诸多 AI 大厂里,阿里大概是最深藏不露的那位。
很多时候这不一定是劣势,在动辄瞬息万变的 AI 行业里,有时候「不够性感」反而是最大的优势,因为它的另一面往往意味着脚踏实地。
从技术实力这个最核心的维度切入,开源社区就像一面照妖镜,能照出真实的技术实力。而阿里是国内少数能在这面镜子前立得住、站得稳的厂商之一。
这一点,从全球最大 AI 开源社区 Hugging Face 的最新开源大模型榜单就可见一斑,排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
该榜单是目前全球最具权威性的开源大模型榜单,其测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等。
另一个不争的事实是,打造技术品牌这句话的含金量还在不断上升。叫好又叫座的通义千问 Qwen 大模型已然超越 Llama,成为开源社区公认的标杆基座模型。
作为业界率先实现「全尺寸、全模态、多场景」的开源大模型,阿里云 Qwen 模型更是为开发者和企业提供了从 1.5B 到 72B 乃至 110B 的尺寸及版本,充分满足不同应用场景的需求。
其中,仅视觉理解 Qwen-VL 及 Qwen2-VL 两款模型,全球下载量就突破 3200 万次。一周前,Qwen2.5-VL 迎来全新升级,再次点燃了开源社区的热情。
数据会说话,在 Hugging Face 2024 年的开源模型榜单中,Qwen2.5-1.5B-Instruct 以 26.6% 的下载占比,成为全球开发者最青睐的开源模型。
目前,Qwen 衍生模型数量已突破 9 万,发展成为全球最大的开源模型族群。
在推理模型的技术浪潮中,Qwen 展现出强大的引力场。近期,被称为「AI 教母」的李飞飞团队用较少的资源和数据训练出的 s1 推理模型同样基于 Qwen-32B 蒸馏的模型,在多项能力上实现了对标 OpenAI o1-Preview 的效果。
这些成果皆源于 Qwen 模型过硬的基础实力,但同理也正是这份实力,让阿里有底气接下苹果对 AI 功能的高标准要求。
此外,与其他 AI 初创企业相比,阿里作为中国老牌 AI 巨头的优势不言而喻,它更熟悉国内用户需求,也更了解数据合规政策,这些都为苹果 AI 功能的本地化适配和快速落地提供了重要保障。
当然,虽然阿里最终胜出,但这个结果并非一开始就已注定。在过去数月里,苹果对包括腾讯、字节跳动、DeepSeek 在内的多家候选企业进行了多轮考察。
在近期财报电话会议上,苹果 CEO 蒂姆·库克(Tim Cook)就曾盛赞 DeepSeek。
库克指出,DeepSeek 在降低 V3 模型训练和运行成本方面取得了显著创新。他强调,推动效率的创新是非常积极的事情,这也是 DeepSeek 所展示出来的。
然而,受限于团队规模和大客户服务经验的不足,DeepSeek 遗憾出局也不足为奇,这一点在「服务器繁忙,请稍后再试」上就有所体现。相比之下,阿里云的技术底盘和基础设施可为苹果提供本地化算力支持的优势则更加突出。
更重要的是,通过与阿里合作,苹果希望推出符合中国用户习惯的 AI 功能(如智能语音、视觉理解等),提升产品竞争力,扭转市场颓势。
报道称,目标明确的苹果希望找到一个能够基于用户个人数据,并理解中国用户需求的合作伙伴,这也是打造 Apple 智能的重要一环。
而当苹果评估多家中国公司开发的 AI 模型时,苹果对这些模型在理解用户意图及将用户的实际手机使用情况融入生成的响应方面的能力感到不满意。
能否经得起挑剔目光的审视,扛得住严苛场景的考验,苹果国行 AI 选择阿里或许是这个问题最好的回答,也是对 Qwen 实力最好的认证。
iPhone 用上 Qwen 后,这些体验将被重塑
在手机行业迎来新一轮技术变革之际,OPPO 首席产品官刘作虎早在去年 OPPO AI 战略发布会上做出了一个重要判断:「AI 手机将是继功能机、智能机之后,手机行业的第三个重大的变革阶段。」
AI 手机的发展描述为三个阶段,首先是应用级 AI,让单个应用更智能;其次是系统级 AI,将 AI能 力整合到操作系统层面;最终达到「AI 即系统」的阶段,让 AI 成为手机交互的核心。
包括近期随着 Deepseek 的爆火,AI 在手机领域的应用形态也越发清晰,手机厂商普遍采用「端云协同」的方案:轻量级任务由手机本地处理,复杂任务则转交云端。
Apple 智能在去年 WWDC 大会后也展示了类似的分层架构:
本地模型:主要是经过微调的 3B 小模型,专用于摘要、润色等任务,经过适配器的加持后,能力不弱
私有云计算:本地模型满足不了要求的,会传到云端运算。苹果确保端到端加密,保障用户数据的安全和隐私
第三方 LLM:用于泛用的知识问答聊天,如 Siri 等应用接入了 ChatGPT 等外部模型
如无意外,在与阿里的最新合作中,Qwen 模型很可能以两种形式融入 iPhone 生态,其一就是本质上类似于插件的形态,以第三方 LLM 的身份提供全功能 AI 服务。
这种策略与苹果在海外市场接入 ChatGPT 的思路一致。但正如其与 OpenAI 的合作并非独家,未来可能会将 Google Gemini 或 Claude 等模型整合到海外 iPhone 中,国内市场同样可能引入更多本土国产 AI 模型。
其二则是与阿里合作部署开发蒸馏版小模型。与 DeepSeek V3/R1 专注于 671B 超大模型不同,Qwen 走的是全方位路线,即便是声名鹊起的 DeepSeek 公司,在其 6 个开源蒸馏小模型中,也有 4 个选择基于 Qwen 构建,而这本身就是对阿里技术实力的最好背书。
插个题外话,尽管 Deepseek 曾发布超越 OpenAI DALL·E 3 的多模态模型 Janus-Pro-7B,但 DeepSeek 在 C 端目前尚不支持多模态能力。而 Qwen 真就人无我有,人有我也不差,最新发布的 Qwen 2.5 Max 同样跻身最具竞争力的顶级多模态模型。
值得关注的是还有模型压缩技术的突破。2024 年,中国厂商在 AI 模型优化方面取得了显著进展,通过最新量化和剪枝技术在保证输出质量的同时大大精简了参数规模。
比方说,据 Canalys 报道,小米的 MiLM2 将模型参数从 60 亿剪枝至 40 亿,而荣耀和 vivo 也分别将其模型参数从先前的 70 亿剪枝至 30 亿。而通义千问使用结构化剪枝同样将 7B 参数的模型压缩到 2.2B,并保持相当的理解和生成能力。