专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
爱可可-爱生活  ·  【[85星]VideoRAG:超长视频理解与 ... ·  11 小时前  
爱可可-爱生活  ·  【[2k星]Homebox:为家庭用户打造的 ... ·  2 天前  
爱可可-爱生活  ·  【[413星]llmchat:最直观的统一A ... ·  2 天前  
宝玉xp  ·  Lex Fridman ... ·  2 天前  
爱可可-爱生活  ·  【The End of Search, ... ·  2 天前  
51好读  ›  专栏  ›  人工智能学家

狙击OpenAI 谷歌发布Gemini 2.0 一切为了智能体

人工智能学家  · 公众号  · AI  · 2024-12-12 17:04

正文

来源:网易科技AGI

12月2日消息, 没等到OpenAI12连炸结束,谷歌直接正面硬刚 ,正式发布 Gemini 2.0 系列 AI 模型首个版本 Gemini 2.0 Flash。据谷歌称,其速度较上一代提升两倍,并超越 1.5 Pro 专业版。新模型支持多模态输入与输出,包括文本、图像、音频、视频的原生生成,同时提供强大的工具调用能力,如 Google 搜索、代码执行及第三方函数集成。

比起功能上的提升, 谷歌直接将 Gemini 2.0定义为:为新智能体时代构建的下一代模型 ,或许更值得关注。Deepmind CEO Demis Hassabis 也表示:“2025 年将是 AI 智能体的时代,Gemini 2.0 将是支撑我们基于智能体工作的最新一代模型。”

Gemini 2.0 Flash 的开发者实验版现已上线,支持多模态输入及文本输出功能。早期合作伙伴还可试用文本转语音及图像生成等高级功能。全面版本计划于 2024 年 1 月推出,支持更多模型尺寸及场景。


不止大模型,全新功能 Deep Research 今日起也将向 Gemini Advanced 用户开放。该功能支持高级推理与长上下文理解,用于复杂主题研究及报告撰写。同时,AI Overviews 将借助 Gemini 2.0 的能力,扩展至更复杂问题与多语言适配,进一步提升用户体验。(网易科技/袁宁)
以下为Google&AIphabet CEO Sundar Pichai 的寄语:


信息是人类进步的基石。26 年来,我们始终专注于我们的使命 —— 整合全球信息,供大众使用,让人人受益。这也是我们持续拓展人工智能前沿领域的原因。我们整合来自世界各地的信息,并通过多样化的输出方式,让这些信息触手可及,真正为您所用。


正是基于这个愿景,我们在去年年底推出了 Gemini 1.0。作为首个原生多模态模型,Gemini 1.0 和 1.5 在多模态和长上下文处理方面取得了重大进展,能够理解跨越文本、视频、图像、音频和代码等多种形式的信息,并处理更为庞大的信息。


现在,数百万开发者正在基于 Gemini 进行开发。Gemini 也正在帮助我们自己重新构想所有的产品——包括我们拥有 20 亿用户的 7 款产品——并打造新的产品。NotebookLM 就是个很好的例子,它展示了多模态和长上下文能够为人们带来什么,以及为什么如此受大家喜爱。


在过去一年里,我们在持续开发更多智能体模型,这也意味着它们可以更好地理解周围的世界,提前思考多个步骤,并在您的监督下代表您行动。


今天,我们很高兴推出了为新智能体时代构建的下一代模型:Gemini 2.0,这是我们迄今为止最强大的模型。凭借在多模态方面的新进展——例如原生图像和原生音频的输出以及原生工具使用—— Gemini 2.0 使我们能够构建新的 AI 智能体,从而让我们离构建通用助手的愿景更进一步。


今天,我们将 2.0 开放给开发者以及受信任的测试人员。我们也正在积极推进将其整合到我们的产品中,率先从 Gemini 和 Search 开始。从今天开始,Gemini 2.0 Flash 体验版模型将对所有 Gemini 用户开放。同时,我们还推出了 Deep Research 的新功能,它运用高级推理和长上下文处理能力,承担研究助手的角色,帮助您探索复杂的主题并撰写报告。该功能自今日起对 Gemini Advanced 用户开放。


Search 无疑是受到人工智能影响最深远、变革最显著的产品。如今,AI Overviews 已触达 10 亿用户,该功能使用户能够提出全新的问题类型,迅速成为 Search 有史以来最受欢迎的功能之一。接下来,我们会将 Gemini 2.0 的高级推理能力融入 AI Overviews,以攻克更复杂的主题和多步骤问题,包括高等数学方程、多模态查询和编码。我们本周已经在小范围进行了测试,并计划于明年年初在更大范围推出。同时,我们还计划明年将 AI Overviews 功能面向更多国家开放,适配更多语言。


2.0 的进展得益于我们所特有的长达 10 年全栈式 AI 创新研究的投入。它基于我们定制的硬件第六代 TPU Trillium 构建而成。TPU 为 Gemini 2.0 的训练和推理提供 100% 算力支持,今天 Trillium 也全面向用户开放,以便他们能够基于此进行开发。


如果说 Gemini 1.0 是整合和理解信息,那么 Gemini 2.0 能够让信息更加有用。我非常期待 Gemini 2.0 时代的无限可能!


阅读报告全文,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库 是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。 目前拥有超过8000 篇重要资料。 每周更新不少于100篇世界范围最新研究 资料 欢迎扫描二维码或访问 https://wx.zsxq.com/group/454854145828 进入。



截止到11月25日 ”未来知识库”精选的100部前沿科技趋势报告

  1. Air Street Capital《2024 年人工智能现状报告》

  2. 未来今日研究所:2024 技术趋势报告 - 广义计算篇

  3. 科睿唯安中国科学院 2024 研究前沿热度指数报告

  4. 文本到图像合成:十年回顾

  5. 《以人为中心的大型语言模型(LLM)研究综述》

  6. 经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版

  7. 波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告

  8. 理解世界还是预测未来?世界模型的综合综述

  9. Google Cloud CSA2024 AI 与安全状况调研报告

  10. 英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施

  11. 花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告

  12. 国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景

  13. 国际可再生能源署 IRENA2024 年全球气候行动报告

  14. Cell: 物理学和化学 、人工智能知识领域的融合

  15. 智次方 2025 中国 5G 产业全景图谱报告

  16. 未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇

  17. Deepmind:AI 加速科学创新发现的黄金时代报告

  18. PitchBookNVCA2024 年第三季度全球风险投资监测报告

  19. 德科 2024 年未来全球劳动力报告

  20. 高工咨询 2024 年协作机器人产业发展蓝皮书

  21. 国际能源署 IEA2024 年全球能源效率报告

  22. 基因慧基因行业蓝皮书 2024 - 2025

  23. 普华永道 PwC2024 全球经济犯罪调查英国报告 - 智对风险直面挑战

  24. 中国互联网协会 2024 面向未来网络的数字孪生城市场景应用白皮书

  25. 中移智库 2024 先进感知新技术及新应用白皮书

  26. 智次方研究院 2025 中国 AIoT 产业全景图谱报告

  27. 未来今日研究所:2024 技术趋势报告 - 人工智能篇

  28. 国际电联:迈向衡量数字经济的通用框架的路线图

  29. 联合国粮食与农业组织:2024 年世界粮食安全和营养状况

  30. 大语言模型综述

  31. 李飞飞等,AI 智能体:探索多模式交互的前景综述

  32. 哈尔滨工业大学 - ChatGPT 调研报告

  33. 2024《美国核部署战略报告》最新文件

  34. 清华大学:AIGC 发展研究 3.0 发布版 b 版

  35. OpenAI:2024 年 OpenAI o1 大模型技术报告

  36. Verizon2024 年世界支付安全报告

  37. 皇家学会哲学学报 从复杂系统角度评估人工智能风险

  38. 复旦大学 大模型 AI 代理的兴起和潜力:综述

  39. 经合组织 OECD2024 年气候行动监测报告

  40. Wevolver2024 年边缘人工智能现状报告 - 探索各行业边缘 AI 应用动态

  41. 2024 全球人形机器人产品数据库报告 - 人形机器人洞察研究 BTIResearch

  42. 《全球金融稳定报告》 把舵定航 不确定性、人工智能与金融稳定

  43. 瑞士洛桑联邦理工学院 《人工智能中的 - 创造力:进展与挑战》

  44. 《你所需要知道的理 - 论:人工智能、人类认知与决策》牛津大学最新 53 页报告

  45. 世界经济论坛 新兴技术时代的网络弹性导航:应对复杂挑战的协作解决方案 2024

  46. ADL 理特咨询 2024 汽车出行未来展望报告

  47. 2024 中国硬科技创新发展白皮书 - 开辟未来产业新赛道

  48. 科学时代的大语言模型中的人工智能

  49. Gartner2025 年重要战略技术趋势报告

  50. CBInsights2024 年第三季度全球人工智能投融资状况报告

  51. TrendHunter2025 年全球趋势报告 - 全行业顶级创新和变革趋势前瞻

  52. 天津大学 2024 大模型轻量化技术研究报告

  53. 欧洲海洋局 2024 导航未来报告将海洋置于更广泛的地球系统中第六版

  54. 美国安全与新兴技术中心 2024 AI 生成代码的网络安全风险研究报告

  55. 国际原子能机构 2024 年世界聚变展望报告

  56. 复旦大学 2024 大语言模型的能力边界与发展思考报告

  57. 安盛 AXA2024 年气候与生物多样性报告气候过渡计划路线图

  58. YouGov2024 美国公众对人工智能 AI 的态度调研报告

  59. 麦肯锡中国报告:《中国与世界》完整版

  60. 麦肯锡全球研究所 2024 下一代竞技场报告 - 重塑全球经济的 18 个新兴行业领域

  61. Project Sid,一个旨在模拟多智能体交互以研究 AI 文明的项目

  62. 德国研究与创新专家委员会 德国研究创新与科技成果报告

  63. 2024 年欧洲关键产业的科技重塑研究报告

  64. 智能体专题报告之二 - 智能体时代来临具身智能有望成为最佳载体

  65. ActivateConsulting 2025 年顶级技术和媒体发展趋势报告







请到「今天看啥」查看全文