5月31日 AI 头条｜iOS 18 AI 功能将升级，Siri 智能度提升

硅星GenAI · 公众号 · · 2024-05-31 18:01

正文

划重点：

iOS 18 AI 功能将升级，Siri 智能度提升
Altman 计划将 OpenAI 重组为盈利性公司
OpenAI 重启机器人团队，联合多方回归老赛道
百度发布AI原生应用橙篇，赋能用户全能创作
Suno3.5版本模型已向所有人开放
阿里中科大合推虚拟试衣技术ViViD 轻松实现视频换衣
Gartner 预测2024年人工智能芯片收入将达到712亿美元
快手上线自研文生图大模型可图，参数规模达10亿级
Cartesia发布低延迟语音生成模型Sonic

资讯详情：

iOS 18 AI 功能将升级，Siri 智能度提升

据 AppleInsider 报道，苹果近日公布了部分iOS 18 的功能升级，主要围绕 AI 功能。

在 iOS 18 中，苹果将提升 Siri 的响应生成能力，该框架能考虑到联系人、公司、日程活动、地点、日期等信息，让回复更加准确和贴切。此外 Siri 的语音将会显得更加自然。此外用户还可以通过 Siri 快速获取近期通知的概览。

Altman 计划将 OpenAI 重组为盈利性公司

据 The Information 报道， OpenAI CEO Sam Altman 正计划将 OpenAI 重组为盈利性公司。

据OpenAI 的一些投资者表示，他们希望 Altman 获得股权方案，以确保他的利益与公司业务保持一致。报道称， Altman 之所以拥有这一想法，是因为公司需要为投资者提供激励措施，以吸引大量资金。若公司不具有营利性的性质，就无法为投资者提供激励措施，从而无法达到“吸引 1000 亿美元资金”的预期目标。

OpenAI 重启机器人团队，联合多方回归老赛道

据 The Information 报道，OpenAI 已正式重启其机器人团队，将联合多个团队共同发展。

据悉，OpenAI 将会联合Figure AI、1X Technologies 和 Physical Intelligence等多家机器人初创公司共同研发 AI 机器人。目前 OpenAI 已经开始招聘相关工程师，将负责与其他公司合作训练相关AI模型。

百度发布AI原生应用橙篇，赋能用户全能创作

百度近日举办2024百度移动生态万象大会，在大会上，百度宣布发布综合性AI原生应用橙篇。

百度表示，橙篇可利用AI技术，帮助用户对超大量、超多格式、超长内容的文件进行深入理解、精准总结与即时问答。橙篇还支持超长篇幅的长文生成、深度编辑以及多模态的自由创作，极大地丰富了用户的内容创作手段。

Suno3.5版本模型已向所有人开放

据 Suno 官方消息，:Suno的最新3.5版本模型已经向所有人开放，这个版本的改进包括:可以制作4分钟的歌曲，创建最长2分钟的歌曲扩展，以及显著改进的歌曲结构。

此前，Suno宣布将推出全新功能，可以将任何声音创作成歌曲。这项新功能能够将日常生活中的各种声音转化为音乐，为音乐创作带来了全新的可能性。用户只需敲击出节奏，Suno会自动捕捉并与之“和弦”，将这些声音转换为音乐作品。首个示例便是将敲击浇水壶的声音转化为迷幻摇滚音乐，展示了这项技术的强大和创意潜力。

阿里中科大合推虚拟试衣技术ViViD 轻松实现视频换衣

据 Github 页面显示，阿里巴巴与中国科学技术大学联手推出了一款名为ViViD的新框架，旨在革新虚拟试衣体验。

ViViD基于先进的扩散模型技术，能够实现视频中人物衣物的实时替换，从而生成自然且逼真的视频效果。ViViD的推出解决了以往视频试衣中难以保持时间一致性和图像质量的难题。它由三大核心组件构成:服装编码器、姿势编码器以及时间模块。这些组件协同工作，不仅可以精确提取衣物细节的语义特征，还能对人物姿势进行编码，并确保整个视频在时间线上的连贯性。

Gartner 预测2024年人工智能芯片收入将达到712亿美元

据 Gartner 预测，由于企业应用需求的增长，对人工智能处理器的需求将推动2024年全球AI芯片的预计收入增长33%，达到712亿美元。这一趋势预计将在2025年进一步增长近920亿美元。

Gartner 预计，2024年出货的电脑中有22% 将是人工智能电脑，而到2026年底，100% 的企业电脑购买将是人工智能电脑。人工智能电脑的一个特点是它们配备了神经处理单元（NPU），使其能够在后台持续运行人工智能任务的同时，电脑能够更长时间、更安静、更凉爽地运行。

快手上线自研文生图大模型可图，参数规模达10亿级

快手近日宣布，自研文生图大模型可图已经在近日正式开放，支持文生图和图生图两类功能，可用于 AI 创作图像以及 AI 形象定制。

用户可通过“可图”微信小程序和网页版使用。据界面新闻报道，这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称，“可图”大模型的参数规模达十亿级，这些数据来自开源社区、快手内部构建和自研 AI 技术合成，覆盖了常见的千万级中文实体概念，还引入强化学习和奖励模型技术（RLHF），解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

Cartesia发布低延迟语音生成模型Sonic

Cartsia AI 近日宣布，推出名为 Sonic 的低延迟语音生成模型，该模型具备快速的推理速度和超低的延迟时间。

据 Cartsia AI 表示，Sonic 的延迟仅为135毫秒，能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音，Sonic 即可模仿说话者的韵律、语调和声音特征，并且可以调节音调、速度、情感、发音和速度。

今日重点论文：

5月31日 AI 头条｜iOS 18 AI 功能将升级，Siri 智能度提升

正文

请到「今天看啥」查看全文