在最新的 Google I/O 大会上,Google 宣布一系列令人瞩目的更新和新功能,引发广泛的关注。
这些新功能涉及到人工智能在多个领域的应用,让我们来看看与 OpenAI 发布会相比,谷歌到底有哪些新动向,以及是否能够成为 AI 未来之王。
1. Google 搜索增强功能
扩展了 AI 概览功能,增加了先进的规划能力,并通过 AI 优化搜索结果的组织。
用户现在还可以通过视频提问,允许 Google 搜索分析视频内容并提供有用的 AI 概览,使搜索更加直观且高效。
2. 搜索的多步推理
允许 Gemini 对问题进行分解并加速研究过程。
利用 Gemini,Google 搜索可以通过代理执行多个步骤,比如规划、维护和更新旅行行程,从而为用户提供更为周到的服务和支持。
3.
Project Astra
Project Astra 可以实时观察和听到用户的操作。
这意味着用户可以与 AI 进行更加直观和自然的互动,这在未来的人机交互中可能会发挥重要作用。
4. AI teammates
AI teammates ,可以在 Workspace 中回答电子邮件、会议和其他数据相关的问题。
这项功能不仅可以提高工作效率,还可以减轻用户的工作负担,是 Google 在智能办公领域的重要突破。
5. Google Veo
这是一款视频生成模型,可以根据文本、图像和视频提示生成高质量的 1080P 视频。
这将为用户创作视频提供更多可能性,为多媒体内容创作带来更多灵感。
6. Gemini 1.5 Pro 更新
这个更新带来了巨大的 2M 上下文窗口扩展,以及在编程、逻辑推理和图像理解方面的性能增强。
需要注意的是,目前预览版中已经支持高达 10M 的上下文窗口。
7.
Imagen 3
这是 Google 下一代的文本生成图像模型。
相较于前代,Imagen 3 在细节描绘、文本生成和自然语言理解方面都有显著提升,能够创造出更加精细和自然的图像。
8.
VideoFX
这是一款文本到视频的工具,配备了全新的“故事板”界面,支持用户逐场景创作视频,并且可以添加背景音乐。
这个工具目前在美国为选定的创作者提供“私人预览”,以测试其功能和表现。
9.
Gemini Live
这项新功能允许用户几乎实时地与 Gemini 进行交谈,
它使得与 AI 的对话更加流畅和自然,仿佛与真人交流一样。
10. Gemini 1.5 Flash
这是一款新的轻量级 AI 模型,专为速度和效率进行了优化,具有 1M 令牌的上下文窗口。
这使得 Gemini 1.5 Flash 在处理速度和反应时间上更具优势,适合需要快速响应的应用场景。
11.
Gemma 2
作为 Google 的下一代开源模型,Gemma 2 能够在单个 TPU 或 GPU 上运行。
这种模型的灵活性和可扩展性使其成为开发者和研究人员的理想选择,特别是在资源受限的情况下。
12. Gems
Gemini Advanced 订阅者很快就能够根据简单的文本描述创建称为“Gems”的定制化角色,类似于 ChatGPT 的 GPTs。
这为用户提供创建个性化 AI 体验的可能,使得交互更加个性化和富有吸引力。
综上所述,Google 在本次 Google I/O 大会上推出一系列令人印象深刻的人工智能功能和更新,
展示其在 AI 领域的强大实力。
尽管与 OpenAI 发布会相比,两者都展示了许多令人期待的新功能,但谁才是 AI 未来之王,还有待时间的检验和市场的选择。
但可以肯定的是,Google 在人工智能领域的持续创新和突破,将为未来的智能化生活带来更多可能性和惊喜。
如果你想要第一时间获取AI应用的深入分析和实操经验,不要忘记关注
AI小岛
。