专栏名称: 硅星GenAI
比一部分人更先进入GenAI。
目录
相关文章推荐
北京厚朴中医  ·  厚朴电子日历 | 早 ·  昨天  
北京厚朴中医  ·  周六直播 | 闲话假期综合征 ·  昨天  
设计诗designer  ·  Studio8丨艺术之旅 ·  4 天前  
设计诗designer  ·  Studio8丨艺术之旅 ·  4 天前  
51好读  ›  专栏  ›  硅星GenAI

8月14日 AI 头条|谷歌正式发布Pixel 9 系列手机,AI 加持,799美元起售

硅星GenAI  · 公众号  ·  · 2024-08-14 21:14

主要观点总结

本文介绍了谷歌、xAI、ChatGPT等公司发布的新产品、新技术及功能更新,包括Pixel 9系列手机、Grok-2测试版、GPT-4o模型、Gemini Live服务、Pixel Studio应用、Melodio音乐平台、快手AI对话应用飞船以及谷歌的Call Notes AI功能等。同时,还介绍了针对金融领域信息提取的论文和评估大型语言模型在解决实际问题时能力的ToolSandbox评估框架。

关键观点总结

关键观点1: 谷歌发布Pixel 9系列手机,搭载Tensor G4芯片和AI技术Gemini

谷歌正式推出Pixel 9系列手机,包括Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL以及折叠屏手机Pixel 9 Pro Fold四款。全系搭载Tensor G4芯片,并配备了AI技术Gemini。Pixel 9价格为799美元起,Pixel 9 Pro和Pixel 9 Pro XL的起售价分别为999美元和1099美元。

关键观点2: xAI发布Grok-2测试版,性能超越Claude 3.5 Sonnet和GPT-4-Turbo

xAI宣布推出Grok-2测试版,包含Grok-2和Grok-2 mini两款模型。Grok-2具有聊天、编码和推理等功能,其性能在测试中超过了Claude 3.5 Sonnet和GPT-4-Turbo。目前正在进行测试,所有用户均可体验Grok-2 mini模型,付费用户可以提前体验Grok-2的效果。

关键观点3: ChatGPT使用最新版本GPT-4o模型进行更新

ChatGPT已更新为使用最新版本的GPT-4o模型。新模型似乎能够进行更细致的推理,并给出更详细的解释。

关键观点4: 谷歌发布Gemini Live服务,允许用户通过语音与大型模型交互

谷歌推出了一项名为Gemini Live的生成式对话服务,允许用户通过语音与大型模型交互。该服务目前仅支持英文,且仅限于Gemini Advanced订阅用户。

关键观点5: 谷歌发布Pixel Studio应用,用于图像生成

谷歌发布了一款新的图像生成应用程序Pixel Studio,该应用将预装在Pixel 9设备上。用户可以根据提示创建图片,并进行事后编辑。

关键观点6: 昆仑万维发布全球首个AI流媒体音乐产品Melodio

昆仑万维发布了全球首个AI流媒体音乐平台Melodio,以及AI音乐商用创作平台Mureka。两款产品均搭载昆仑万维的新款自研DiT架构音乐大模型Skymusic 2.0。

关键观点7: 快手发布AI对话应用飞船,提供全方位AI陪伴功能

快手推出了一款AI对话应用飞船,旨在提升用户的生活质量和工作效率。用户可以通过文字或语音进行交流,并获得娱乐、角色定制等体验。

关键观点8: 谷歌推出Call Notes AI功能,摘录通话内容

谷歌在Pixel 9系列手机发布会上宣布推出Call Notes AI功能。该功能可以调用AI来摘录通话内容,帮助用户方便地处理重要信息。

关键观点9: 论文介绍金融领域信息提取新技术和评估大型语言模型的框架

两篇最新论文分别介绍了金融领域信息提取的新技术和评估大型语言模型在解决实际问题时能力的框架。其中一篇论文提出了一种新的方法HybridRAG,结合了知识图谱和向量检索增强生成技术,以提高金融文件中的信息提取准确性。另一篇论文介绍了ToolSandbox评估框架,用于评估工具辅助下的大型语言模型的能力。


正文

划重点:
  • 谷歌正式发布Pixel 9 系列手机,AI 加持,799美元起售

  • xAI 发布 Grok-2 测试版,性能超越 Claude 3.5 Sonnet 和 GPT-4-Turbo

  • ChatGPT 低调更新, 已使用最新版本GPT-4o 模型

  • 谷歌发布 Gemini Live 服务,和用户通过语音交互

  • 谷歌发布图片生成应用 Pixel Studio,将预装在 Pixel 9 系列手机上

  • 昆仑万维发布全球首个AI流媒体音乐产品Melodio

  • 快手发布新款 AI 对话应用 飞船,提供全方位 AI 陪伴功能

  • 谷歌推出 Call Notes AI 功能:本地运行,摘录通话内容

资讯详情:
谷歌正式发布Pixel 9 系列手机,AI 加持,799美元起售
谷歌今天凌晨举办新品发布会,正式推出 Pixel 9 系列手机,包括Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL,以及折叠屏手机Pixel 9 Pro Fold四款。
谷歌 Pixel 9 系列全系搭载 Tensor G4 芯片,此外Pixel 9 / Pro 配备 6.3 英寸 OLED 直屏配备6.3英寸直屏,而Pixel 9 Pro XL配备6.8英寸直屏。谷歌还宣布Pixel 9 系列手机全面搭载了自家研发的 AI 技术 Gemini,并推出了一系列全新的 AI 功能。
售价方面,Pixel 9价格为799美元起,而Pixel 9 Pro和Pixel 9 Pro XL的起售价分别为999美元和1099美元。
xAI 发布 Grok-2 测试版,性能超越 Claude 3.5 Sonnet 和 GPT-4-Turbo
品玩8月14日讯,马斯克旗下 AI 公司 xAI 今天宣布,推出Grok-2 测试版。其中包含两款模型,分别是 Grok-2 和 Grok-2 mini。
xAI 表示,Grok-2 是其在前一型号 Grok-1.5 的基础上向前迈出的重要一步,具有聊天、编码和推理等前沿功能。同时,xAI还推出了 Grok-2 mini,它是 Grok-2 的一个小而强大的版本。通过访问 X 上的实时数据,Grok-2 可以总结出当日新闻,同时支持中文以及文生图等功能,其图片生成功能由Flux.1模型提供支持。
Grok-2 的早期版本此前已"sus-column-r"的代号在 LMSYS 排行榜上进行了测试 。测试显示,其性能超过了 Claude 3.5 Sonnet 和 GPT-4-Turbo。
Grok-2 和 Grok-2 mini 目前正在𝕏上进行测试,所有用户均可以体验Grok-2 mini 模型,而付费用户可以提前体验到Grok-2 的效果。xAI还将在本月晚些时候通过企业 API 提供这两种型号。
ChatGPT 低调更新, 已使用最新版本GPT-4o 模型
据 ChatGPT 官方消息,ChatGPT已在上周进行更新,使用最新版本的GPT-4o 模型。
据悉,该版本是OpenAI 根据用户反馈而更新的一个版本。新模型似乎能够进行更细致地分步推理,并给出更详尽的解释。OpenAI 的一位发言人表示,模型的推理过程并没有发生变化,ChatGPT 在描述其推理时主要是响应用户的特定提示。在正式公告之前,很多用户就已经注意到,ChatGPT 的表现似乎有所提升。
OpenAI 表示,他们正在努力寻找更好的方式来衡量和传达模型在行为上的改进。
谷歌发布 Gemini Live 服务,和用户通过语音交互
据 9to5Google 报道,谷歌在 Pixel9 系列手机发布会上宣布,推出一项名为 Gemini Live 的生成式对话服务,允许用户通过语音和大模型交互。
用户可以通过 Gemini 页面右下角进入 live 界面,并通过麦克风进行交流。谷歌为 Gemini 增加了十种声音进行交流。谷歌表示,用户甚至可以按照自己的节奏说话,或在回答中途打断并提出澄清性问题,就像在人类对话中一样。
当前 Gemini Live 服务仅支持英文,且仅面向Gemini Advanced 订阅用户开放。
谷歌发布图片生成应用 Pixel Studio,将预装在 Pixel 9 系列手机上
据 The Verge 报道,谷歌今日凌晨在Pixel 9 发布会上发布了一款新的图像生成应用程序 Pixel Studio,该软件将会预装到每台Pixel 9 设备上。
Pixel Studio 与苹果即将推出的 Image Playground 应用程序非常相似,用户可以根据提示创建图片。用户可以事后编辑图片,使用提示框添加或减少元素,改变图片的感觉或风格。
据悉, Pixel Studio 应用采用本地运行生成,基于谷歌自己的 Imagen 3 模型,主要生成艺术风格的图片。
昆仑万维发布全球首个AI流媒体音乐产品Melodio
据昆仑万维官方消息,昆仑万维正式发布全球首个AI流媒体音乐平台Melodio,并同步推出AI音乐商用创作平台Mureka。
两款产品均搭载昆仑万维新款自研DiT(Diffusion Transformer)架构音乐大模型Skymusic 2.0,这是业内首个能够持续稳定生成特定风格歌曲的AI音乐大模型。相较于上一代模型,Skymusic 2.0支持500字以上的歌词输入,生成长达6分钟双声道立体声歌曲,在伴奏质量与配器丰富度等领域有着大幅提升,成为AIGC音乐大模型领域最新SOTA。
快手发布新款 AI 对话应用 飞船,提供全方位 AI 陪伴功能
据快手官方消息,快手今日推出 AI 对话应用飞船,为用户提供个性化对话体验。
官方介绍称,飞船(Kraft)智能助手 App 是一款基于先进 AI 技术的互动软件,旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流,解答疑问、获得娱乐、进行创作和角色定制等。
用户在飞船平台上扮演“船长”角色,名为快快的 AI 少女领航员引导用户体验,飞船基于快手自研大模型“快意”,更侧重于虚拟陪伴,拥有快速的回复速度和逼真的语音体验。
谷歌推出 Call Notes AI 功能:本地运行,摘录通话内容
在今天凌晨的发布会上,谷歌正式公布了全新的 Call Notes 功能,该AI功能将会在 Pixel 9 系列手机中实装。
Call Notes 功能隶属于 Call Assist 工具集,可以调用 AI 来摘录用户的通话内容,如果用户在没有纸笔的情况下,想要梳理通话内容或者想要记录某个电话号码,该功能可以非常方便地处理重要信息。用户只需要打开 Google Phone 应用程序,点击联系人,就能看到最近一次的通话摘要,而且可以直接复制相关内容。如果摘要中没有你需要的信息,你可以展开视图,显示完整的通话记录。
谷歌强调, Call Notes 功能均在本地存储和处理,相关数据不会发送至云端。
今日重点论文:






请到「今天看啥」查看全文