专栏名称: AI科技大本营

为AI领域从业者提供人工智能领域热点报道和海量重磅访谈；面向技术人员，提供AI技术领域前沿研究进展和技术成长路线；面向垂直企业，实现行业应用与技术创新的对接。全方位触及人工智能时代，连接AI技术的创造者和使用者。

高考作文热议人工智能；Qwen 2 登顶 Hugging Face | AI 头条

AI科技大本营 · 公众号 · · 2024-06-07 21:27

正文

整理 | 王启隆

出品 | AI 科技大本营（ID：rgznai100）

一分钟速览新闻点！

高考作文聚焦人工智能，引发教育与科技融合新思考
阿里云 Qwen2 正式开源，登顶 Hugging Face 榜首！
快手 AI 视频生成模型“可灵”震撼发布
Chrome 要更卡了？谷歌在 Chrome 浏览器内置 Gemini Nano 大模型
微软、OpenAI 和 NVIDIA 将被同时进行反垄断调查
“创意避风港” Cara 应用爆红，50 万艺术家为防 AI 抓取原创内容集体出走
OpenAI 已解散的“超级对齐团队”论文揭示 AI 模型内部运作机制
OpenAI 官方回应《对人工智能提出警告的权利》联名公开信
Meta 计划推出 WhatsApp功能
专家团队揭示 MMLU 基准测试错误，推出 MMLU-Redux 提升 AI 评估准确性
“AI 程序员” Devin CEO 最新访谈：估值 20 亿美元，赋能部分企业完成了数千小时项目
谷歌新论文揭示：开放性是实现超级人工智能的关键

全球 AI 要闻

高考作文聚焦人工智能，引发教育与科技融合新思考

今日，2024 年全国高考语文科目落下帷幕，其中新课标 I 卷的作文题目迅速成为社会关注的热点。作文材料指出，随着互联网技术的飞速发展与人工智能的广泛应用，人们能够以前所未有的速度获取知识、找到问题的答案。这一现象引发了对于未来学习方式、问题解决机制乃至人类智慧发展路径的深刻思考。作文要求考生在体验了信息时代便捷的同时，探讨在这一背景下，人类面临的问题是否真的会越来越少。

阿里云 Qwen2 正式开源，登顶 Hugging Face 榜首！

阿里云在 AI 领域投下震撼弹，正式宣布 Qwen2 系列大型语言模型的面世，并同步在 Hugging Face 及 ModelScope 平台上开源共享。此次升级包含了从 Qwen2-0.5B 至 Qwen2-72B 在内的五个不同规模的预训练与指令微调模型，展示了阿里云在自然语言处理技术的最新突破。 Qwen2 的上下文处理能力最大支持扩展至 128K tokens，还引入了对 27 种新语言的高质量数据训练，极大地拓宽了其应用范围和国际化视野。

尤为引人注目的是，Qwen2-72B 模型发布仅两小时后，Hugging Face 首席执行官 Clément Delangue 即刻发推宣告，该模型已荣登其平台开源大模型性能榜单首位，超越了先前的领头羊，包括性能卓越的 Llama3-70B。这标志着 Qwen2 系列不仅在多语言支持、代码及数学能力上显著增强，更在综合评测中展现出了前所未有的优越性能。

GitHub： https://github.com/QwenLM/Qwen2

Hugging Face： https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f

快手 AI 视频生成模型“可灵”震撼发布

近日，国内互联网巨头快手正式推出其自主研发的视频生成大模型——“可灵”。作为对国际顶尖水平的对标之作，该模型在技术实现采用 OpenAI Sora 的 DiT 架构，彰显了快手在 AI 技术创新的强劲实力。

“可灵”不仅能够创造出长达 2 分钟、高分辨率的流畅视频内容，还独有模拟现实物理特性的高级功能，使得生成视频中的运动表现更为自然合理。目前，用户可通过快影 APP 抢先体验 720P 视频生成，未来竖版视频生成也将开放，为内容创作者提供更多可能。

此外，快手同步上线了“AI 舞王”等创新应用，让“可灵”技术快速触达广大用户群体，标志着这一前沿技术从实验室走向市场的飞跃。

Chrome 要更卡了？谷歌在 Chrome 浏览器内置 Gemini Nano 大模型

近日，Google Chrome 浏览器迎来重大更新，宣布内置 Gemini Nano 大模型。Gemini Nano 作为 Gemini 系列中最高效的模型版本，专为现代桌面和笔记本电脑设计，可在本地运行，无需服务器支持，为网站和网络应用提供无缝的 AI 驱动体验。以往，大型 AI 模型的应用受限于模型体积庞大及需单独下载的不便，但 Chrome 的新举措通过浏览器内置 API，直接集成包括大语言模型（LLMs）在内的 AI 模型，解决了这一难题。这意味着，开发者无需部署或管理自己的 AI 模型，即可享受 AI 带来的便利。

官方表示："我们正开发的 Web 平台 API 和浏览器特性旨在将 AI 模型直接融入浏览器，使内置 AI 成为可能。Gemini Nano 让您的网站或应用在不承担大型模型部署与管理的情况下，实现 AI 功能。"

OpenAI 已解散的“超级对齐团队”论文揭示 AI 模型内部运作机制

近日，OpenAI 发布了一篇备受关注的研究论文，揭示了其大语言模型 ChatGPT 背后的运作机制。据悉，这项研究由已解散的“超级对齐”团队完成，旨在解决人工智能带来的潜在风险。论文中，研究人员提出一种逆向工程 AI 模型的方法，通过识别模型中代表特定概念的模式，来揭示其内部运作原理。

论文链接： https://cdn.openai.com/papers/sparse-autoencoders.pdf

微软、OpenAI 和 NVIDIA 将被同时进行反垄断调查

联邦贸易委员会（FTC）和 DOJ 目前正在讨论由谁来以反垄断为由调查微软、OpenAI 和 NVIDIA 之间的合作关系。今年 1 月， FTC 开始调查科技公司对小型 AI 公司投资的潜在反垄断问题。该机构向 Alphabet、亚马逊、Anthropic、微软和 OpenAI 发出了信函。谷歌母公司 Alphabet 和亚马逊都是 Anthropic 的投资者。微软向 OpenAI 投资了数十亿美元，并将其技术深度整合到自己的服务中，这引起了人们对潜在反竞争行为的担忧。两家机构都在努力确定管辖权，这使得正式调查程序被推迟。目前，三家公司对此事都未予置评。

“创意避风港” Cara 应用爆红，50 万艺术家为防 AI 抓取原创内容集体出走

在 Meta 旗下 Instagram 平台宣布利用用户内容训练 AI 模型后，艺术家群体中掀起了一股向新兴社交应用 Cara 迁移的浪潮。Cara 承诺打造一个尊重创作者权益的平台，通过自动附加 "NoAI" 标签保护艺术家作品，防止被人工智能抓取用于训练，即便这一措施更多在于表达立场而非法律约束。这一创新举措迅速吸引了大量用户，短短数日内用户量激增三倍，突破 30 万大关，跃居美国 App Store 社交网络类榜首，超越了 Twitter、Discord 等知名应用。随后，该应用在今天正式突破了 50 万用户大关。

尽管面临服务器崩溃的技术挑战和高昂的运维成本——每月需支付 13,500 美元以维持数据库运行，创始人 Jingna Zhang 表示，她已自掏腰包支持该项目超过一年，将其视为尊重创意者权利的热情项目。为应对突发流量和确保服务稳定，团队紧急升级服务器七次，并在社交媒体上发起众筹。

OpenAI 官方回应《对人工智能提出警告的权利》联名公开信

6 月 4 日发布的《对人工智能提出警告的权利》的公开信，是人工智能行业员工就人工智能的危险的一次公开发声，11 名现任与前 OpenAI 员工、两名谷歌 DeepMind 员工在这封信上签了名。

对此，OpenAI 公司官方声明内容如下：

我们为自己能提供能力最强、最安全的人工智能系统而感到自豪，并坚信我们能以科学的方法应对风险。鉴于 AI 技术的重要性，我们认同公开信中的内容，如何通过严肃的讨论，对于更好推进 AI 技术发展至关重要。

我们将继续接触各国政府、民间社会和世界各地的其他社区，共同营造和谐的 AI 环境。包括匿名诚信热线、由董事会成员和公司安全领导者参与的安全与安保委员会（ Safety and Security Committee）在内，都是监管 AI 的有效手段。OpenAI 指出在必要的保障措施到位之前，公司不会发布新的 AI 技术。公司重申支持政府监管，并参与人工智能安全自愿承诺。

对于报复行为的担忧，发言人证实，公司已解除了所有前员工的非贬损协议，并从标准离职文件中删除了此类条款。

Meta 计划推出 WhatsApp功能

近日，科技巨头 Meta 计划推出 WhatsApp 功能，包括为印度和新加坡的企业提供人工智能助手，以及在英语市场制作广告的人工智能工具。6 月 6 日，Meta 表示，正在为巴西、印度、印度尼西亚和哥伦比亚的 WhatsApp 企业用户推出 Meta Verified 计划，并最终将扩展到更多国家。这项服务的订阅计划起价为每月 14 美元。该公司还在其面向企业的消息服务中添加更多功能，并允许企业使用其 API 通过应用程序内的电话为客户提供服务。（TechCrunch）

专家团队揭示 MMLU 基准测试错误，推出 MMLU-Redux 提升 AI 评估准确性

在 6 月 6 日发布的一篇名为《Are We Done with MMLU?》的论文中，来自爱丁堡大学、罗马一大、巴里理工大学等多所高校及机构的国际研究团队，对广受欢迎的 Massive Multitask Language Understanding (MMLU) 基准测试中存在的错误进行了深入分析与揭露。该团队指出，尽管 MMLU 被广泛采用以评估大语言模型（LLMs）的能力，但其包含的诸多基准真实错误（ground truth errors）却模糊了模型的真实性能。

研究中一个显著例子是病毒学子集中的问题，其中 57% 被发现存在错误。为解决这一问题，团队提出了一种全面的错误识别框架，并引入新颖的错误分类法。基于此，他们创建了 MMLU-Redux——一个包含 30 个 MMLU 学科领域内 3,000 个经过人工重新注释问题的子集。使用 MMLU-Redux 进行的实验结果显示，与最初报告的模型性能指标存在显著差异，强调了修订 MMLU 错误问题的必要性，以增强其作为未来评估基准的实用性和可靠性。因此，为了进一步提升数据质量与精确度，团队开放 MMLU-Redux 接受更多注解贡献，呼吁学术界和工业界共同参与，推动人工智能评估标准的精确化与透明化。

高考作文热议人工智能；Qwen 2 登顶 Hugging Face | AI 头条

正文

请到「今天看啥」查看全文