专栏名称: 机器学习算法与Python学习
作为沟通学习的平台,发布机器学习与数据挖掘、深度学习、Python实战的前沿与动态,欢迎机器学习爱好者的加入,希望帮助你在AI领域更好的发展,期待与你相遇!
目录
相关文章推荐
51好读  ›  专栏  ›  机器学习算法与Python学习

谷歌版Her抢跑!一键召唤Gemini,全球52亿终端被颠覆

机器学习算法与Python学习  · 公众号  ·  · 2024-08-15 11:08

正文

新智元报道

谷歌版Her,抢先OpenAI登场了?谷歌语音模型Gemini Live,即将在全球30亿安卓和22亿iOS设备中上线。虽然现场演示依旧小翻车了一下,但谷歌下定决心不等了,一心截胡OpenAI,还要对打苹果!

就在刚刚「谷歌制造」的主题演讲中,谷歌宣布推出语音模式Gemini Live。不久后,Gemini Live就会在Gemini移动应用程序中上线。
此外,在这次演讲中,谷歌还详细展示了Gemini会如何更深入地集成到安卓、应用程序和新的Pixel设备中。在一口气发布的Pixel 9系列手机中,谷歌也探索了「AI+手机」的新样态:Gemini、安卓、Pixel的融合,会孵化出怎样的端侧AI产品形态。

谷歌的「Her」,也来了

根据谷歌介绍,Gemini Live是一款全新的移动对话体验。


如果我们想要头脑风暴一下,根据自己的技能和学历能找到什么样的工作,Gemini可以立刻跟我们实时对话。
与OpenAI一样,谷歌的语音功能,同样可以让用户以自然的对话语言和它交流,它的回应也用的是真人般的声音和节奏。

请听下面这个音频,几种男声和女声的音色都很自然

为了让我们拥有最自然的体验,谷歌一口气推出了10种声音; 还支持免提功能;还支持随时打断、更改话题。没错,OpenAI的语音能做的,它都有。

重新定义AI助手

在这次演讲中,谷歌表示:通过Gemini,他们重新构想了个人助手对人类真正有用的意义——更自然、对话式、更直观。

Gemini会跟所有谷歌应用程序和工具集成,完成大大小小的任务。 而在未来几周,谷歌还会推出全新的扩展功能,包括Keep、Tasks、Utilities和YouTube Music。


一键召唤Gemini

现在,Gemini已经完全融入了安卓的用户体验。

如果正在使用YouTube,可以向Gemini询问有关视频的问题。比如,假设我们正在为出国旅行做攻略,刚看完一个旅游视频博客,点击「询问此视频」,让它列出视频中出现的所有餐馆、添加到谷歌地图中,Gemini就会一一照做。
再看下图,Gemini生成的图像,可以直接拖放到Gmail和Google Messages中。

基于Imagen 3打造,2秒生图

谷歌还推出了一款全新的AI生图应用——Pixel Studio。仅需要几个提示词,就能生成一幅精美的图片。

同时,Imagen 3的技术报告也出炉了( 地址: https://arxiv.org/pdf/2408.07009


首款AI手机,每月要氪20刀

谷歌一共发布了四款AI手机——Pixel 9、Pixel9 Pro、Pixel9 Pro XL,以及二代折叠屏Pixel 9 Pro Fold。

在Pixel 9系列新机上,一定不能错过AI加持的拍照能力。
谷歌表示,图像处理算法——HDR+pipeline,已完全重建,可以让拍摄的照片有更好的对比度、阴影、曝光、锐化、色彩等。
以下是Pixel 9系手机新增的AI图像编辑能力:

Add Me







请到「今天看啥」查看全文