专栏名称: AI科技大本营

为AI领域从业者提供人工智能领域热点报道和海量重磅访谈；面向技术人员，提供AI技术领域前沿研究进展和技术成长路线；面向垂直企业，实现行业应用与技术创新的对接。全方位触及人工智能时代，连接AI技术的创造者和使用者。

英伟达市值超越苹果；高考监考用上 AI；智谱 AI 开源 GLM-4-9B 模型赶超 Llama 3 | AI 头条

AI科技大本营 · 公众号 · · 2024-06-06 15:20

正文

整理 | 王启隆

出品 | AI 科技大本营（ID：rgznai100）

一分钟速览新闻点！

英伟达市值超过苹果，跃居世界第二
高考监考都用上 AI
智谱 AI Open Day：升级清言 App、发布 GLM-4 开源模型、新一代 MaaS 平台
腾讯混元发布开源加速库，生图时间缩短 75%
社交媒体热议：Adobe 用户协议更新引发隐私争议
字节发布“几乎完美接近人类”的文本到语音（TTS）模型
台积电正式换帅，新董事长锐评 OpenAI 芯片计划
Stability AI 开源 Stable Audio Open 音乐生成模型
开源 AI 程序员智能体 SWE-agent 新版本性能翻倍
Arm 宣称 2025 年或将有超 1000 亿台 Arm 设备驱动智能未来
Google AI 概览功能使用率骤减，医疗保健领域亦受波及
Mistral 推出高效模型微调工具，助力企业定制 AI 应用

全球 AI 要闻

英伟达市值超过苹果，跃居世界第二

科技巨头英伟达（NVIDIA）市值再创新高，超越苹果，跃居全球价值第二大的公司。截至最近交易日，这家图形处理单元（GPU）和人工智能（AI）计算领域的领头羊企业，其市值已飙升至 3.01 万亿美元，紧随市值 3.15 万亿美元的微软之后。此次市值飞跃标志着英伟达在过去一年多的时间里实现了惊人的增长，从 2023 年 5 月首次突破 1 万亿美元市值大关，再到今年 2 月跨过 2 万亿美元门槛，接连超越了亚马逊和 Alphabet 等科技巨擘。

英伟达的股票在周三交易中上涨 5%，收于每股 1224.4 美元的历史新高，市值一夜之间增长了约 1480 亿美元。公司计划于 6 月 7 日进行股票分割，比例为 1 拆 10，这一举措预计将提高股票的流动性和对散户投资者的吸引力。

英伟达在 AI 领域的主导地位进一步巩固了其市场价值，据 CNBC 报道，英伟达的人工智能加速器占据了 70% 至 95% 的人工智能芯片市场份额，凸显出其在推动全球 AI 革命中的核心作用。

高考监考都用上 AI

今年广东高考将引入 AI 监考，新增智能巡查分析系统，实时监控考试情况。提前作答，左右偏头，向后偏头，站立，传递可疑物品，携带可疑物品，手放桌下都能被监控出来。AI 筛选并保存关键片段，然后对于考场登记的考场记录会进行人工回放，回放工作量降低。

智谱 AI Open Day：升级清言 App、发布 GLM-4 开源模型、新一代 MaaS 平台

6 月 5 日，智谱 AI Open Day 在北京 UCCA Lab 艺术空间举行，以 “Through GLM, to the NEXT-Gen” 为主题，全面展示了智谱在大模型技术上的最新进展及应用。活动发布了清言 App 的多智能体协作系统「清流」，以及 MaaS 大模型开放平台 bigmodel.cn 的最新更新。新一代 GLM-4-9B 模型能力提升 40%，支持 26 种语言及百万 tokens 长文本处理，并首次开源视觉模型 GLM-4V-9B。智谱 AI CEO 张鹏表示，2024 年是 AGI 元年，AI 技术进入新阶段。清言 App 已有 30 万个智能体活跃，提供多种生产力工具。MaaS 平台支持 LoRA 和 FPFT 微调，降低大模型使用成本，赋能多个行业。

腾讯混元发布开源加速库，生图时间缩短 75%

6 月 6 日，腾讯发布针对腾讯混元文生图开源大模型（以下简称为混元 DiT 模型）的加速库，让推理效率大幅提升，生图时间缩短 75%。混元 DiT 模型的使用门槛也大幅降低。用户可以基于 ComfyUI 的图形化界面，使用腾讯混元文生图模型能力。同时，混元 DiT 模型已经部署至 Hugging Face Diffusers 通用模型库中，用户仅用三行代码即可调用混元 DiT 模型，无需下载原始代码库。

代码： https://github.com/Tencent/HunyuanDiT

模型： https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

社交媒体热议：Adobe 用户协议更新引发隐私争议

昨日，Adobe 对其用户协议进行了修订，其中一项条款尤为引人注目：“明确我们有权通过自动及人工方式访问您的内容，用于例如内容审核等目的。”此番改动迅速在用户社区中激起千层浪，特别是因为不同意该条款的用户将无法继续使用 Adobe 软件，此举遭遇了广泛的批评与反对。

一条相关推文的转发量逼近 400 万，揭示了公众对此的强烈反应。用户和隐私倡导者担忧，该条款背后的含义可能远不止于内容审核，暗示 Adobe 可能意图利用用户创建的设计、图片等数据来训练其 AI 模型，而用户在未明确同意的情况下，实质上失去了对自己作品使用的控制权。

字节发布“几乎完美接近人类”的文本到语音（TTS）模型

字节跳动发布了 Seed-TTS，一款革命性的文本到语音（TTS）模型，其生成的语音质量之高，几可乱真，彻底模糊了人声与合成语音之间的界限。不同于传统技术，Seed-TTS 无需繁复的训练流程，仅需少量语音样本，即可克隆出既自然又充满表现力的声音，为读小说、影视配音等行业带来革新。

Seed-TTS 的核心优势在于其对语音特征的精细控制，涵盖情感、语调及多种说话风格，让用户能够按需定制理想中的语音效果。更令人振奋的是，通过直接编辑文本内容，系统就能即时调整生成的语音，实现前所未有的灵活性和创造性。

研究团队还介绍了 Seed-TTS 的自蒸馏方法，用于语音因子分解，以及通过强化学习增强模型的稳健性、模仿真实度与可控性。此外，他们推出了非自回归变体 Seed-TTS DiT，采用全扩散架构，无需依赖预估的音素时长，实现了端到端的语音生成，不仅在客观评价上表现优异，在主观聆听测试中也赢得了高度赞誉，尤其是在语音编辑方面展现了巨大潜力。

演示链接： https://bytedancespeech.github.io/seedtts_tech_report/

台积电正式换帅，新董事长锐评 OpenAI 芯片计划

据 6 月 5 日的报道，台积电新上任的董事长魏哲家在年度股东大会后评论了 OpenAI 首席执行官 Sam Altman 想要进军芯片制造领域的计划，称之为“过于激进”。魏哲家的这一评价是在业界持续流传 OpenAI 计划不仅涉足芯片设计，还要参与芯片制造的背景之下做出的。OpenAI 的这一雄心勃勃的计划还包括与包括阿联酋政府在内的投资者进行谈判，意图筹集 5 万亿至 7 万亿美元的资金来重塑全球半导体行业，这一数额巨大，甚至超过了某些国家的 GDP。

Stability AI 开源 Stable Audio Open 音乐生成模型

全球领先的 AI 创新企业 Stability AI 今日震撼发布了一项开源壮举—— Stable Audio Open 音乐生成模型，该模型以其独特的 text2audio 扩散技术，正重塑音乐与声音设计的未来。这一开创性模型不仅能够单次生成长达 47 秒的音频片段，还涵盖了从激昂鼓点、悠扬乐器旋律到细腻环境声音及专业配音的全方位创作能力，为用户开辟了一条前所未有的音乐创意路径。

开源链接： https://huggingface.co/stabilityai/stable-audio-open-1.0

开源 AI 程序员智能体 SWE-agent 新版本性能翻倍

“开源版 Devin” SWE-agent 的最新版本 0.6.0 发布，性能实现了重大飞跃，整体运行速度提升至原来的 2 倍，并已在与 GPT4o 的计时测试中证实。这版本优化了 Docker 内通信与环境配置，如快速通信默认设置与稀疏克隆技术。更新还包括 Web UI 体验升级，如 Markdown 支持与滚动优化，同时修复了多项问题，确保跨平台稳定性，特别是解决了 MacOS 下的代理错误。此版本还赋予用户更多控制选项，如配置日志导出的开关，标志着 SWE-agent 在效率与用户体验方面迈出了重要一步。

英伟达市值超越苹果；高考监考用上 AI；智谱 AI 开源 GLM-4-9B 模型赶超 Llama 3 | AI 头条

正文

请到「今天看啥」查看全文