专栏名称: AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
目录
相关文章推荐
爱可可-爱生活  ·  【[80星]r1-ktransformers ... ·  18 小时前  
爱可可-爱生活  ·  【[165星]wild-card-ai/ag ... ·  17 小时前  
王开东  ·  少年情怀总是诗 ·  2 天前  
王开东  ·  少年情怀总是诗 ·  2 天前  
量子位  ·  阶跃Agent生态首曝光:手机汽车IoT机器 ... ·  2 天前  
命里有票  ·  用DeepSeek和豆包分别计算了一个日期问 ... ·  2 天前  
命里有票  ·  用DeepSeek和豆包分别计算了一个日期问 ... ·  2 天前  
51好读  ›  专栏  ›  AI科技大本营

高考作文热议人工智能;Qwen 2 登顶 Hugging Face | AI 头条

AI科技大本营  · 公众号  ·  · 2024-06-07 21:27

正文


整理 | 王启隆
出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!

  • 高考作文聚焦人工智能,引发教育与科技融合新思考

  • 阿里云 Qwen2 正式开源,登顶 Hugging Face 榜首!

  • 快手 AI 视频生成模型“可灵”震撼发布

  • Chrome 要更卡了?谷歌在 Chrome 浏览器内置 Gemini Nano 大模型

  • 微软、OpenAI 和 NVIDIA 将被同时进行反垄断调查

  • “创意避风港” Cara 应用爆红,50 万艺术家为防 AI 抓取原创内容集体出走

  • OpenAI 已解散的“超级对齐团队”论文揭示 AI 模型内部运作机制

  • OpenAI 官方回应《对人工智能提出警告的权利》联名公开信

  • Meta 计划推出 WhatsApp功能

  • 专家团队揭示 MMLU 基准测试错误,推出 MMLU-Redux 提升 AI 评估准确性

  • “AI 程序员” Devin CEO 最新访谈:估值 20 亿美元,赋能部分企业完成了数千小时项目

  • 谷歌新论文揭示:开放性是实现超级人工智能的关键


全球 AI 要闻

高考作文聚焦人工智能,引发教育与科技融合新思考

今日,2024 年全国高考语文科目落下帷幕,其中新课标 I 卷的作文题目迅速成为社会关注的热点。作文材料指出,随着互联网技术的飞速发展与人工智能的广泛应用,人们能够以前所未有的速度获取知识、找到问题的答案。这一现象引发了对于未来学习方式、问题解决机制乃至人类智慧发展路径的深刻思考。作文要求考生在体验了信息时代便捷的同时,探讨在这一背景下,人类面临的问题是否真的会越来越少。

阿里云 Qwen2 正式开源,登顶 Hugging Face 榜首!

阿里云在 AI 领域投下震撼弹,正式宣布 Qwen2 系列大型语言模型的面世,并同步在 Hugging Face 及 ModelScope 平台上开源共享。此次升级包含了从 Qwen2-0.5B 至 Qwen2-72B 在内的五个不同规模的预训练与指令微调模型,展示了阿里云在自然语言处理技术的最新突破。 Qwen2 的上下文处理能力最大支持扩展至 128K tokens,还引入了对 27 种新语言的高质量数据训练,极大地拓宽了其应用范围和国际化视野。

尤为引人注目的是,Qwen2-72B 模型发布仅两小时后,Hugging Face 首席执行官 Clément Delangue 即刻发推宣告,该模型已荣登其平台开源大模型性能榜单首位,超越了先前的领头羊,包括性能卓越的 Llama3-70B。这标志着 Qwen2 系列不仅在多语言支持、代码及数学能力上显著增强,更在综合评测中展现出了前所未有的优越性能。

GitHub: https://github.com/QwenLM/Qwen2

Hugging Face: https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f

快手 AI 视频生成模型“可灵”震撼发布

近日,国内互联网巨头快手正式推出其自主研发的视频生成大模型——“可灵”。作为对国际顶尖水平的对标之作,该模型在技术实现采用 OpenAI Sora 的 DiT 架构,彰显了快手在 AI 技术创新的强劲实力。

“可灵”不仅能够创造出长达 2 分钟、高分辨率的流畅视频内容,还独有模拟现实物理特性的高级功能,使得生成视频中的运动表现更为自然合理。目前,用户可通过快影 APP 抢先体验 720P 视频生成,未来竖版视频生成也将开放,为内容创作者提供更多可能。

此外,快手同步上线了“AI 舞王”等创新应用,让“可灵”技术快速触达广大用户群体,标志着这一前沿技术从实验室走向市场的飞跃。

Chrome 要更卡了?谷歌在 Chrome 浏览器内置 Gemini Nano 大模型

近日,Google Chrome 浏览器迎来重大更新,宣布内置 Gemini Nano 大模型。Gemini Nano 作为 Gemini 系列中最高效的模型版本,专为现代桌面和笔记本电脑设计,可在本地运行,无需服务器支持,为网站和网络应用提供无缝的 AI 驱动体验。以往,大型 AI 模型的应用受限于模型体积庞大及需单独下载的不便,但 Chrome 的新举措通过浏览器内置 API,直接集成包括大语言模型(LLMs)在内的 AI 模型,解决了这一难题。这意味着,开发者无需部署或管理自己的 AI 模型,即可享受 AI 带来的便利。

官方表示:"我们正开发的 Web 平台 API 和浏览器特性旨在将 AI 模型直接融入浏览器,使内置 AI 成为可能。Gemini Nano 让您的网站或应用在不承担大型模型部署与管理的情况下,实现 AI 功能。"

OpenAI 已解散的“超级对齐团队”论文揭示 AI 模型内部运作机制

近日,OpenAI 发布了一篇备受关注的研究论文,揭示了其大语言模型 ChatGPT 背后的运作机制。据悉,这项研究由已解散的“超级对齐”团队完成,旨在解决人工智能带来的潜在风险。 论文中,研究人员提出一种逆向工程 AI 模型的方法,通过识别模型中代表特定概念的模式,来揭示其内部运作原理

论文链接: https://cdn.openai.com/papers/sparse-autoencoders.pdf

微软、OpenAI 和 NVIDIA 将被同时进行反垄断调查

联邦贸易委员会(FTC)和 DOJ 目前正在讨论由谁来以反垄断为由调查 微软、OpenAI 和 NVIDIA 之间的合作关系。今年 1 月, FTC 开始调查科技公司对小型 AI 公司投资的潜在反垄断问题。该机构向 Alphabet、亚马逊、Anthropic、微软和 OpenAI 发出了信函。谷歌母公司 Alphabet 和亚马逊都是 Anthropic 的投资者。微软向 OpenAI 投资了数十亿美元,并将其技术深度整合到自己的服务中,这引起了人们对潜在反竞争行为的担忧。两家机构都在努力确定管辖权,这使得正式调查程序被推迟。目前,三家公司对此事都未予置评。

“创意避风港” Cara 应用爆红,50 万艺术家为防 AI 抓取原创内容集体出走

在 Meta 旗下 Instagram 平台宣布利用用户内容训练 AI 模型后,艺术家群体中掀起了一股向新兴社交应用 Cara 迁移的浪潮。Cara 承诺打造一个尊重创作者权益的平台,通过自动附加 "NoAI" 标签保护艺术家作品,防止被人工智能抓取用于训练,即便这一措施更多在于表达立场而非法律约束。这一创新举措迅速吸引了大量用户,短短数日内用户量激增三倍,突破 30 万大关,跃居美国 App Store 社交网络类榜首,超越了 Twitter、Discord 等知名应用。随后,该应用在今天正式突破了 50 万用户大关。

尽管面临服务器崩溃的技术挑战和高昂的运维成本——每月需支付 13,500 美元以维持数据库运行,创始人 Jingna Zhang 表示,她已自掏腰包支持该项目超过一年,将其视为尊重创意者权利的热情项目。 为应对突发流量和确保服务稳定,团队紧急升级服务器七次,并在社交媒体上发起众筹。

OpenAI 官方回应《对人工智能提出警告的权利》联名公开信

6 月 4 日发布的《对人工智能提出警告的权利》的公开信,是人工智能行业员工就人工智能的危险的一次公开发声,11 名现任与前 OpenAI 员工、两名谷歌 DeepMind 员工在这封信上签了名。

对此,OpenAI 公司官方声明内容如下:

我们为自己能提供能力最强、最安全的人工智能系统而感到自豪,并坚信我们能以科学的方法应对风险。鉴于 AI 技术的重要性,我们认同公开信中的内容,如何通过严肃的讨论,对于更好推进 AI 技术发展至关重要。

我们将继续接触各国政府、民间社会和世界各地的其他社区,共同营造和谐的 AI 环境。包括匿名诚信热线、由董事会成员和公司安全领导者参与的安全与安保委员会( Safety and Security Committee)在内,都是监管 AI 的有效手段。OpenAI 指出在必要的保障措施到位之前,公司不会发布新的 AI 技术。公司重申支持政府监管,并参与人工智能安全自愿承诺。

对于报复行为的担忧,发言人证实,公司已解除了所有前员工的非贬损协议,并从标准离职文件中删除了此类条款。

Meta 计划推出 WhatsApp功能

近日,科技巨头 Meta 计划推出 WhatsApp 功能,包括为印度和新加坡的企业提供人工智能助手,以及在英语市场制作广告的人工智能工具。6 月 6 日,Meta 表示,正在为巴西、印度、印度尼西亚和哥伦比亚的 WhatsApp 企业用户推出 Meta Verified 计划,并最终将扩展到更多国家。这项服务的订阅计划起价为每月 14 美元。该公司还在其面向企业的消息服务中添加更多功能,并允许企业使用其 API 通过应用程序内的电话为客户提供服务。(TechCrunch)

专家团队揭示 MMLU 基准测试错误,推出 MMLU-Redux 提升 AI 评估准确性

在 6 月 6 日发布的一篇名为《Are We Done with MMLU?》的论文中,来自爱丁堡大学、罗马一大、巴里理工大学等多所高校及机构的国际研究团队,对广受欢迎的 Massive Multitask Language Understanding (MMLU) 基准测试中存在的错误进行了深入分析与揭露。该团队指出,尽管 MMLU 被广泛采用以评估大语言模型(LLMs)的能力,但其包含的诸多基准真实错误(ground truth errors)却模糊了模型的真实性能。

研究中一个显著例子是病毒学子集中的问题,其中 57% 被发现存在错误。为解决这一问题,团队提出了一种全面的错误识别框架,并引入新颖的错误分类法。基于此,他们创建了 MMLU-Redux——一个包含 30 个 MMLU 学科领域内 3,000 个经过人工重新注释问题的子集。使用 MMLU-Redux 进行的实验结果显示,与最初报告的模型性能指标存在显著差异,强调了修订 MMLU 错误问题的必要性,以增强其作为未来评估基准的实用性和可靠性。因此,为了进一步提升数据质量与精确度,团队开放 MMLU-Redux 接受更多注解贡献,呼吁学术界和工业界共同参与,推动人工智能评估标准的精确化与透明化。







请到「今天看啥」查看全文