专栏名称: AI科技评论

点评学术，服务 AI ！

传英伟达 1.65 亿美元收购新创 OctoAI；马斯克脑机接口获批；吴泳铭：AI 最大的想象力不在手机屏幕丨AI情报局

AI科技评论 · 公众号 · · 2024-09-20 19:41

正文

要闻提示

通义千问三款主力模型再降价，最高降幅85%
阿里CEO吴泳铭：AI最大的想象力不在手机屏幕，而是改变物理世界
英伟达再扩AI版图传斥资1.65亿美元收购新创OctoAI
马斯克脑机接口获批，失明者有望重见光明
OpenAI任命前Coursera高管Leah Belsky为教育总经理

今日头条

英伟达再扩AI版图传斥资1.65亿美元收购新创OctoAI

人工智能（AI）芯片巨头英伟达（Nvidia）传出有意扩大版图，计划收购西雅图新创公司OctoAI，目前正进行深度协商。OctoAI主要销售能提高AI模型运作效率的软体，根据该公司发给股东的信件，英伟达提议以大约1.65亿美元的价格收购该公司，盼藉由此次收购增强其软体和云端运算服务能力。

英伟达与OctoAI在此之前便曾紧密合作过，英伟达曾提前为OctoAI提供其最新的芯片，让该公司测试如何在英伟达芯片上高效运行AI模型。

不过，OctoAI与亚马逊云端服务（Amazon Web Services）、AMD和高通（Qualcomm）等英伟达的竞争对手也存在密切合作关系，因此，分析师认为，英伟达若进行对OctoAI的收购，将会面临美国司法部的审查。（工商时报）

国内资讯

通义千问三款主力模型再降价，最高降幅85%

在 9 月 19 日的云栖大会上，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，其中，旗舰模型Qwen2.5-72B性能超越Llama 405B，再登全球开源大模型王座。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架100多个模型，刷新业界纪录。

周靖人宣布，通义旗舰模型Qwen-Max全方位升级，性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max，继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。

值得一提的是，继5月首次大幅降价后，阿里云百炼平台上的三款通义千问主力模型再次降价。Qwen-Turbo价格直降85%，低至百万tokens 0.3元，Qwen-Plus和Qwen-Max分别再降价80%和50%。其中，Qwen-Plus推理能力追平GPT4，可应用于复杂任务，是效果、速度及成本均衡的最优选择，降价后，Qwen-Plus性价比达到业界最高，同等规模较行业价格低84%。同时，阿里云百炼平台还为所有新用户免费赠送超5000万tokens及4500张图片生成额度。（鞭牛士）

阿里CEO吴泳铭：AI最大的想象力不在手机屏幕，而是改变物理世界

9 月 19 日，阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在2024云栖大会上发表主题演讲。他认为，过去22个月，AI发展的速度超过任何历史时期，但我们依然还处于AGI变革的早期。生成式AI最大的想象力，绝不是在手机屏幕上做一两个新的超级app，而是接管数字世界，改变物理世界。

吴泳铭核心观点如下：

AI发展速度已经超过任何历史时期，但依然处于AGI变革的早期。
下一阶段先进模型的投入门槛是几十亿、几百亿美金级别。
生成式AI最大的想象力，绝不是在手机屏幕上做一两个新的超级app，而是接管数字世界，改变物理世界。
机器人将是下一个迎来巨变的行业。未来所有能移动的物体都会变成智能机器人。
未来几乎所有的软硬件都会具备推理能力，它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。
过去一年，阿里云投资新建了大量的AI算力，但还是远远不能满足客户的旺盛需求。
人们对新技术革命，往往对短期高估，又对长期低估，但它会在你的怀疑中成长，在你在迟疑中错过大趋势。（鞭牛士）

全球首个多模态地理科学大模型“坤元”发布，中国科学院打造

9 月 19 日，中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位正式发布全球首个多模态地理科学大模型“坤元”（Sigma Geography）。

据介绍，该大模型是专注于地理科学的专业语言大模型，具备处理地理科学相关问题的专业能力。研发团队完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作，让“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点，实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能。（IT之家）

传音与联发科共建人工智能联合实验室，聚焦手机端侧 AI 技术创新

近日，传音控股与联发科共建的人工智能联合实验室在深圳揭牌。双方将整合人工智能领域的优势技术资源，加速推进 AI 技术在智能终端的应用和普及。传音控股高级副总裁张祺、TEX AI 中心总经理史团委，联发科技计算与人工智能技术事业群副总经理陆忠立博士、无线产品软件开发部协理李绍鼎共同为实验室揭牌。

据传音控股官方介绍，此次成立的人工智能联合实验室，将聚焦大型语言模型、Agent 智能体、AI 语音、影像等领域在手机端的应用创新，提供更多生成式 Al 的端侧部署和优化方案，共同探索面向大众的 AI 智能体服务和手机端应用场景。

据悉。传音目前在大模型和互联互通技术、影像 AIGC 技术、小语种 AI 语音技术等方面有所布局。传音已发布 TECNO AI，并推出新一代智慧助手 Ella。（IT之家）

智源推出下一代检索增强大模型框架MemoRAG

据智源研究院官方消息，北京智源人工智能研究院与中国人民大学高瓴人工智能学院联合推出基于长期记忆的下一代检索增强大模型框架MemoRAG，旨在推动RAG技术从仅能处理简单QA任务向应对复杂一般性任务拓展。

MemoRAG提出“基于记忆的线索生成——基于线索指引的信息获取——基于检索片段的内容生成”这一全新的RAG模式，实现了复杂场景条件下(尤其是“模糊查询表述”、“高度非结构化知识”)的精准信息获取。在这一全新模式下，MemoRAG对于司法、医疗、教育、代码等现实场景中的领域知识密集型任务的处理展示出了极高潜力。MemoRAG的技术报告已在ArXiv公开，代码也已开源。（品玩快讯）

心流2.0版本新增发现版块，发力AI Native高质量内容化

9 月 19 日，大模型应用产品——AI助手心流上线2.0版本，新增“首页精选内容”和“发现”版块，以智能推荐能力为用户提供AI Native（AI原生）的高质量图文内容和问答，旨在帮用户解决工作生活中的困惑和难题。目前心流官网和APP版本已同步更新。

据了解，心流此次发布的2.0版本涵盖效率工具、饮食休闲、旅游兴趣、运动保健、家居健康等各个百科门类，用户可以通过首页或发现版块，图文并茂的获取生活和工作中所需的高质量内容，也可通过AI问答的方式向心流提问。同时，心流APP版本上线智能语音对话能力，用户可以用语音的方式向心流提问和交流。（界面新闻）

阿里国际发布最新版多模态大模型Ovis

阿里国际AI团队宣布发布多模态大模型Ovis。据介绍，Ovis能够在数学推理问答、物体识别、文本提取和复杂任务决策等方面展现出色表现。例如，Ovis可以准确回答数学问题，识别花的品种，支持多种语言的文本提取，甚至可以识别手写字体和复杂的数学公式。Ovis 1.0、1.5的数据、模型、训练和推理代码都已全部开源，可复现。Ovis1.6系列中的Ovis1.6-Gemma2-9B也已开源权重。（36氪）

APUS岐黄大模型发布，引领医疗行业进入AI时代

日前，全球化人工智能企业麒麟合盛网络技术股份公司（以下简称：APUS），宣布推出其研发成果——APUS岐黄（医疗）大模型，此举不仅彰显了APUS在医疗健康领域内的人工智能技术实力，同时也预示着医疗行业即将迎来一波新的数字化变革浪潮。

APUS岐黄大模型是在APUS自主研发的拥有2100亿参数的通用大模型基础上，通过精确的剪枝技术优化而成。此模型经过6000亿高质量医学知识数据的深度学习训练，历时约三个月完成。借助APUS岐黄大模型，患者能够享受更为便捷与个性化的医疗服务。无论是在线咨询服务还是远程诊疗，“岐黄大模型”都能确保用户获得及时而专业的响应。对于那些居住在偏远地区或是行动受限的患者而言，这意味着他们也能享受到与城市居民相当的医疗服务质量。

未来，APUS还将持续增加对AI医疗产品的研发投入，致力于构建一个开放共享、合作共赢的智慧医疗生态系统，让AI医疗为健康护航。（界面新闻）

复旦大学：提出创新革新性提示词交易模式

复旦大学多媒体与智能安全团队提出了一种创新的提示词交易（PBT）场景和在线定价机制，以实现消费者、平台和卖家的利润最大化。

PBT 系统包含平台、消费者和提供各种类别提示词的卖家，平台作为数据交易经纪人聚合提示包，消费者付款后，平台收取部分奖励作为服务补偿，剩余支付给卖家。选择质量未知的提示词类别问题建模为组合多臂老虎机（CMAB）问题，通过贪婪搜索策略选择最高质量的类别，目标是在 T 次迭代中最大化所选类别的总估计质量。引入三阶段层级 Stackelberg（HS）游戏来找到最优激励策略，将消费者、平台和卖家分别视为一、二、三级领导者，通过逆向推导得出最优激励策略。定义了各方的利润函数，并通过定理和证明得出各方的最优策略。更好地适应未来的买方市场。研究人员认为这一模式有望重塑AI内容创作生态，提高创作效率。（ITSoul）

小鹏汽车加速端到端自动驾驶落地深化与阿里云AI算力合作

9 月 19 日，小鹏汽车董事长何小鹏驾驶“全球首款AI汽车”P7+亮相2024云栖大会，这款车搭载了业内领先的端到端大模型。据了解过去2年，小鹏汽车与阿里云共建的AI算力规模提升超4倍。何小鹏表示，将继续深化与阿里云的AI算力合作，加速推动端到端大模型拓展自动驾驶上限，提升下限。

今年5月，小鹏汽车就在国内率先实现端到端自动驾驶量产上车，并在全国范围内迅速落地。业界普遍认为，未来端到端智驾的算力需求还将进一步扩大，上亿元投入仅是智驾算力的入场券。为进一步保持先发优势，小鹏汽车宣布每年投入35亿元用于研发，其中7亿元用于算力训练，还将与阿里云持续深化合作，加速推动端到端大模型落地（格隆汇）

上海交大&腾讯开源SaRA：兼顾原始生成和下游任务

SaRA是一种针对预训练扩散模型的高效微调方法。通过微调预训练扩散模型中的无效参数，赋予模型对下游任务的处理能力。SaRA能够显著节省计算显存开销与代码复杂度，仅修改一行训练代码即可实现微调过程。该方法的核心创新在于：参数重要性分析、稀疏低秩训练、渐进式参数调整策略、非结构化反向传播策略。SaRA在多个下游任务上进行了广泛的实验验证，包括基模型能力提升、下游数据微调、图像定制化、可控视频生成等。实验结果表明SaRA不仅能够提升基础模型在原始任务的生成能力，在下游任务中，能兼顾下游任务的学习以及预训练先验的维护，实现优越的模型微调效果。（AI生成未来）

国际资讯

马斯克脑机接口获批，失明者有望重见光明

近日，马斯克旗下脑机接口公司Neuralink宣布，其旨在恢复视力的实验性植入设备“Blindsight”，已获得美国食品药品监督管理局（FDA）的突破性医疗器械认证。

Blindsight 通过侵入式的方式植入大脑，通过外部电信号直接刺激视觉皮层，使失明者产生光感（感知光在视野中的具体位置）。在失明者将光感位置信息反馈给研究人员后，研究人员会再次释放设计组合好的电刺激信号，从而在患者视野范围内形成影像图形。Neuralink的创新在于使植入物无线化，并增加了植入电极的数量。马斯克此前就曾表示，Neuralink 的短期目标是帮助瘫痪者实现意念打字功能，未来还将可以实现让瘫痪者行走、让盲人看见，并最终实现“人机共生体。”

这次Blindsight 的突破性医疗器械认证，不但是Neuralink 迈出的重要一步，也使得其可以更早地获得FDA的支持，从而加速其研发和市场审批过程。据悉，“突破性设备认定”（Breakthrough Device Designation）是FDA 为某些具有潜在突破性医疗治疗、诊断或监测功能的医疗器械提供的一种特殊认证。通常情况下，这些设备可以治疗或诊断危及生命的疾病。（头部科技）

高通回应欧洲法院反垄断处罚：不同意该判决，我们一直遵守欧盟竞争法

针对欧洲法院于 9 月 18 日作出对高通滥用市场支配地位的反垄断裁定，并将罚款金额定为约2.387亿欧元一事，9 月 19 日上午，高通发言人回应称，高通对该判决和委员会的决定表示尊重性的不同意，并“认为我们一直遵守欧盟竞争法”。

9 月 18 日，欧洲第二高等法院“欧盟普通法院”肯定了欧盟委员会于2019年对高通的反垄断处罚，并将罚款金额减少到238,732,659欧元（约合2.655亿美元，18.8亿元人民币），低于此前委员会对高通处罚的 2.42亿欧元。该处罚主要是因为高通在 2009 年- 2011 年期间以低于成本的价格将其基带芯片组销售给两家客户，以遏制竞争对手英国手机软件公司Icera。

针对新的Icera诉讼，法院认为，欧盟委员会通过提供直接和间接证据证实了这一裁决，对高通的相关反垄断裁决有效，但关于罚额方面，法院认为，委员会偏离其 2006 年准则规定的方法。因此，在行使其无限管辖权时，法院将高通公司的罚款金额降至2.387亿欧元。（钛媒体AGI）

OpenAI任命前Coursera高管Leah Belsky为教育总经理

9 月 19 日，OpenAI 宣布任命 Leah Belsky 为其首位教育总经理，表明其致力于将其人工智能产品扩展到更多学校和教室。

曾就职于 Coursera 公司担任高管的 Belsky 将负责扩大 OpenAI 与教育界的关系，包括 K-12、高等教育和继续教育。Belsky 将帮助在教育过程中实施 OpenAI 的解决方案。她的新职位是处理 OpenAI 与学校之间的关系，并与内部团队合作制定产品、政策和营销方案。这种跨职能方法旨在与大学建立联盟，并为教育应用开发 AI 解决方案。

2022 年推出 ChatGPT 后，该产品受到了学生的广泛关注，许多学生在课程中使用了该工具。为此，OpenAI于 5 月推出了ChatGPT Edu，这是一个专为教育机构打造的版本，附带附加功能和定价选项。Belsky 的任命恰逢 OpenAI 与全球学术机构日益加强的合作。一些采用 ChatGPT Edu 的机构包括牛津大学、亚利桑那州立大学和哥伦比亚大学。

与此同时，OpenAI 计划于 10 月与顶尖大学的校长和教务长举行会议。根据公告，此次会议将围绕如何将人工智能适当地融入教学和研究展开讨论。此举符合 OpenAI 支持教育工作者在教育机构中应用人工智能最佳实践的目标。(鞭牛士)

“ 终结者”雏形将登场，英伟达预测未来 2-3 年机器人领域迎来“GPT-3 时刻”

据外媒 9 月18 日报道，英伟达高级科学家 Jim Fan 预测，未来 2-3 年内，机器人领域相关研究会出现重大突破，不过他也坦言机器人想要进入日常生活，还需要更长的时间。

在接受采访时，Fan 表示他期待机器人领域迎来一个“GPT-3 时刻”—— 即基础机器人模型取得突破，其影响力可与 GPT-3 在语言处理领域的影响相媲美。他认为，理论上，一台能力出众的人形机器人能够执行人类所能完成的任何任务，并预测人形机器人硬件的生态系统将在两到三年内准备就绪。

英伟达在开发机器人人工智能时采用了三种数据类型的结合：互联网数据、模拟数据和真实世界机器人数据。Fan 博士强调了每种方法的优势与不足，并认为它们的结合是成功的关键。英伟达正在研发诸如“Eureka”等技术，该技术利用语言模型生成机器人训练的奖励函数，实现自动化流程。

除了现实世界，范的团队还在研究用于视频游戏等虚拟环境的 AI 代理。他发现这些领域之间存在相似之处，并致力于开发一种长期内能同时控制虚拟和实体代理的统一模型。(IT之家)

OpenAI与T-Mobile合作开发AI客户体验平台

据外电报道，T-Mobile 和 OpenAI 将构建一个由人工智能代理驱动的新客户服务系统。

客户服务已成为生成式人工智能的主要商业用途之一，与编码和营销并列。T-Mobile 正在创建一个名为 IntentCX 的客户服务平台，该平台将借鉴 OpenAI 的技术，包括 OpenAI 的 API 和其最新的 o1 模型。这些公司表示，该模型在分析客户服务电话记录和识别可以更好解决的痛点方面已经显示出良好的前景。

OpenAI 首席执行官 Sam Altman 在 T-Mobile 活动上表示：“我们对下一代模型感到兴奋的众多事情之一就是我们可以为个性化做些什么。”他指出，o1 模型尚处于早期阶段，未来几年将得到显著改进。“但即使在接下来的几个月里，随着我们从 o1 预览版转向 o1，您也会看到它变得更好。”(鞭牛士)

OpenAI ChatGPT 新增自动模式，基于提示词复杂度灵活选择合适 AI 模型

据报道，OpenAI 面向所有用户在多种设备上，为 ChatGPT 推出了“Auto”自动模式，用户切换选择 Auto 之后，会自动根据用户输入的提示词复杂程度，自动选择最合适的 AI 模型：对于复杂的提示，它会选用最先进的模型，而对于较简单的提示，则采用更快的模型以节省时间。

许多用户反馈表示，在大多数情况下，他们更倾向于与最先进的模型进行交互。然而，在某些特定场景下，能够选择优化速度被视为一项有价值的功能。（IT之家）

Fal.ai获a16z等投资者2300万美元融资，专注于媒体生成AI模型

Fal.ai（“Features and labels”的缩写）是一个面向开发者的平台，专注于AI生成的音频、视频和图像。9 月19 日该公司宣布获得了2300万美元的融资，投资者包括Andreessen Horowitz（a16z）、Black Forest Labs联合创始人Robin Rombach，以及Perplexity首席执行官Aravind Srinivas。