专栏名称: 天翼智库
天翼智库是中国电信研究院战略发展研究所承办的面向公众的智库研究信息发布平台,为您提供最新信息通信行业发展动态、政策观察、产业分析和战略洞察等。
目录
相关文章推荐
小新说车  ·  在日本卖疯的车,中国用1/3的价格造出来了 ·  12 小时前  
第一电动汽车网  ·  11.99万,深蓝S05升级高速NOA,定向 ... ·  昨天  
宝马客  ·  全新宝马M5旅行版MotoGP™安全车亮相泰国 ·  3 天前  
第一电动汽车网  ·  7.98万起售,银河L6能打过带智驾的比亚迪 ... ·  3 天前  
研讯社  ·  智能化,弹性最大的环节! ·  3 天前  
研讯社  ·  智能化,弹性最大的环节! ·  3 天前  
51好读  ›  专栏  ›  天翼智库

【大模型周报第102期】谷歌发布Gemini 2.0的首个版本Gemini 2.0 Flash

天翼智库  · 公众号  ·  · 2024-12-30 07:00

正文

本期总览

【人工智能治理与行业政策】关键词: 人形机器人、新质生产力

12月4日, 重庆市出台支持具身智能机器人产业创新发展若干政策措施 ,重点攻关具身大模型生态体系相关技术,形成一批产业化成果。

12月5日, 杭州发布《杭州市人形机器人产业发展规划(2024—2029年)》 ,从15个方面提出重点举措,加快构建人形机器人整机研发、设计、制造、应用的一体化创新体系和全产业链生态。

12月6日, 安徽省发布《安徽省人形机器人产业发展行动计划(2024—2027年)》 ,明确提出到2027年构建安徽省人形机器人产业的“23456”创新体系和产业生态。

12月9日, 中共中央政治局会议强调以科技创新引领新质生产力发展。 会议重点指出,推动科技创新和产业创新融合发展;以科技创新引领新质生产力发展,建设现代化产业体系。

【前沿技术进展】关键词: 情绪识别、训练加速、强化学习

12月5日, 谷歌发布新一代视觉语言模型PaliGemma 2 ,不仅具备图像分析能力,可以生成图像描述并回答有关照片中人物的问题,同时能够识别人物并解读其情绪,例如高兴或悲伤。

12月10日消息, Meta推出开源可扩展且高性能的数据加载工具SPDL ,通过提升数据加载效率,加快AI训练速度。SPDL工具采用多线程技术,在常规Python解释器中(未启用free-threading选项)实现高吞吐量,资源占用更低,并兼容Free-Threaded Python。

12月10日, 北京交通大学研究团队推出O1-CODER编码任务模型, 并开源所有源代码、精选数据集及衍生模型。其策略是结合强化学习(RL)与蒙特卡洛树搜索(MCTS),让模型能够不断生成推理数据,从而提升System-2能力。

【产品应用创新】关键词: 多模态大模型、视频生成、量子芯片

12月6日起,OpenAI连续召开发布会,发布多款产品更新。如 上线完整版o1大模型 ,在速度、性能和准确性上有显著提升,新增多模态输入功能,并推出200美元/月的ChatGPT Pro订阅服务; 正式发布Sora ,拥有Re-cut、Remix、Storyboard等多个功能,提升创作效率和编辑能力; 推出Canvas更新 ,向所有用户开放,可在其中运行Python代码,并整合到定制的GPT模型中。

12月10日, 谷歌推出全新量子芯片Willow ,共105个量子比特,在不到5分钟内完成超算需10-25年完成的任务。Willow成功突破量子纠错瓶颈,实现误差率指数级下降。Willow标志着量子计算商业化的重要一步,未来可在药物研发、核聚变等领域产生革命性影响。

12月11日, 谷歌发布Gemini 2.0的首个版本Gemini 2.0 Flash ,具备原生多模态输入输出能力,性能比1.5 Pro快两倍。新功能包括空间理解、视频理解、实时音视频流输入、原生工具调用、自定义第三方函数等。同时推出三个AI智能体原型:通用大模型助手Project Astra、浏览器助手Project Mariner、编程助手Jules。

【产业市场竞合】关键词: AI+国防、人工智能中心、AI视觉

12月4日, 美国国防科技公司Anduril公司宣布和OpenAI建立战略合作伙伴关系 ,双方将共同开发用于国家安全任务的人工智能解决方案,包括改进反无人机系统(CUAS)及其实时探测、评估和应对潜在致命空中威胁的能力。

12月5日消息, 英伟达将在越南设立人工智能中心, 加码布局东南亚市场。英伟达与越南电信及移动运营商Viettel集团合作,通过建设人工智能基础设施、增加越南人工智能专家数量和支持人工智能初创企业来推动越南的人工智能发展。

12月6日消息, 美国硅谷AI视觉领域企业Luma AI完成千万美元融资 。主要由亚马逊、AMD等四家欧美投资企业或基金,老股东A16Z等继续加码,此次融资主要用于加速视觉人工智能基础模型和产品的开发。

【业内专家观点】关键词: AI智能体、产业生态

12月5日消息, 红杉合伙人Konstantine Buhler在接受采访时表示,2025年起AI智能体将进入“群体协作”时代 ,多个智能体协作或对抗,完成复杂任务;医疗和教育等领域将成为关键战场。

12月9日消息, 清华大学刘知远教授团队发现并提出大模型的密度定律(Densing Law) :模型能力密度随时间呈指数级增长,2023年以来能力密度约每100天翻一倍。密度定律推论包括:模型推理开销随时间指数级下降,模型能力密度加速增长,端侧智能有巨大潜力,无法依靠模型压缩算法增强模型能力密度,模型高性价比有效期不断缩短。

趋势洞察

1. 以原生多模态大模型为底层能力的自主Agents将成为行业下一赛点

一是原生双向多模态大模型可以整合不同模态信息实现多模态输入输出,大幅提升Agents自主多模态交互能力。如谷歌12月11日发布新模型Gemini 2.0和AI Agent产品,Gemini 2.0是第一个实现原生多模态输入输出的模型, 具备原生的用户界面操作(像人一样操作电脑界面)、多模态推理(文字、图片、视频、声音)、长上下文理解、复杂指令遵循和规划、组合函数调用、原生工具使用(直接调用Google搜索、代码执行等工具)等能力,以及更低的延迟。 二是行业内头部企业的模型能力优化朝适配提升智能体自主性方向演进,企业竞争焦点从单一模型性能比拼到模型+多智能体产品的系统级比拼升级。 如谷歌指出Gemini 2.0是面向智能体时代(Agentic era)的大模型,并推出三个新的AI智能体原型:通用大模型助手Project Astra、浏览器助手Project Mariner、编程助手Jules,展示智能体如何在不同场景下,基于Gemini 2.0的上述能力,用多模式理解现实/虚拟世界、完成复杂任务。相较之前,谷歌新发布的AI智能体具有更强的主动性和行动力,能在用户监督下代表用户主动采取行动。目前AI智能体被公认为大模型行业的下一个赛点,而谷歌或将引领本轮竞争的焦点和方向。

2. 多地发布机器人产业发展支持政策,或催化国产机器人产业进入扩张期

一是人形机器人产业政策从中央到地方日渐完善。中央政府 强调发挥新质生产力作用,以人形机器人、人工智能为代表的未来产业投入有望超前布置, 12月9日召开的中共中央政治局会议强调,要以科技创新引领新质生产力发展,建设现代化产业体系。多地政府 立足各地优势和特色,相继出台相关机器人产业政策,推动机器人产业向更高层次发展,如12月6日, 安徽省发布《安徽省人形机器人产业发展行动计划(2024—2027年)》 ,明确提出到2027年构建安徽省人形机器人产业的“23456”创新体系和产业生态;12月5日, 杭州发布《杭州市人形机器人产业发展规划(2024—2029年)》 ,从15个方面提出重点举措,加快构建人形机器人整机研发、设计、制造、应用的一体化创新体系和全产业链生态;12月4日, 重庆市出台支持具身智能机器人产业创新发展若干政策措施 ,重点攻关具身大模型生态体系相关技术,形成一批产业化成果。 二是人形机器人行业将从产业形成期过渡到扩张期,发展显著提速。 英伟达、华为、特斯拉等巨头加码布局、重大投融资事件密集发生、结合政策推动下, 中国电子信息产业发展研究院旗下赛迪顾问预测 ,“十五五”时期我国机器人产业规模预计将增长至4000亿元左右,人形机器人下游应用需求持续打开, 将由资源拉动转为市场驱动,预计到2030年增长至861亿元。

3. AI+国防市场或成下一个千亿级市场

一方面,AI巨头加速布局国防市场,推动AI技术与国家安全深度融合。如OpenAI与国防科技公司Anduril达成合作, 将共同开发和部署用于国家安全任务的先进人工智能解决方案; Meta向美国政府机构和国防承包商开放其Llama模型 ,用于国家安全应用; Anthropic与数据分析公司Palantir和亚马逊网络服务合作 ,为美国情报和国防机构提供Claude系列AI模型等。 另一方面,全球国防科技独角兽企业涌现,并获得大规模融资。 美国国防科技公司Anduril今年8月完成由Founders基金和Sands风投联合领投的15亿美元F轮融资, 企业估值达140亿美元,较2022年底获得15亿美元E轮融资后的85亿美元估值增长69%; 德国国防科技公司Helsing今年7月在由General Catalyst领投的融资中筹集约4.87亿美元, 创下欧洲国防科技公司融资记录,企业估值达54亿美元。 未来,人工智能技术在军事领域的应用具备广阔发展空间。 根据国际战略研究所(IISS)发布的报告,到2030年,超过30%的军事平台将实现一定程度的自主性,这将极大地改变战争的形态和战术执行的方式。 调研机构Market.us Scoop数据显示, 2024年全球AI+国防市场规模为98亿美元(约合712亿元人民币),2027年将突破千亿大关,飙升至144亿美元( 约合1047亿元人民币 ),年复合增长率达13.7%。

每周一场景:会务预定

1. 场景简介

AI会务预定是利用人工智能技术来优化会议安排和管理的工具,能够通过智能化和自动化手段,提高会议室预定的效率和便捷性。核心功能包括智能日程安排、会议室预订、实时通知与提醒、以及数据分析等。

传统会务预定主要依靠人工安排会议,因此存在以下痛点和难点:

预约流程繁琐: 传统的会议室预定流程较为复杂,需要手动管理,容易出错,信息不透明,尤其是在大型企业中,多个部门可能同时需要使用同一间会议室,难以避免预定冲突。

资源分配不合理: 传统会议室管理中经常出现会议室资源分配不合理的情况,如一些部门或员工可能无法及时预订到合适的会议室,而部分会议室却存在闲置现象。企业缺乏对会议室使用情况的全面统计和分析数据,难以做出关于会议室资源优化配置的决策。因此,会议室的使用效率不高,存在资源浪费的问题。

2. 大模型赋能

智能化管理: 会务预定可实时监测会议室的使用情况,并根据会议规模和需求,快速推荐合适的会议室,自动调整会议室的配置和设备,自动化处理会议安排,减少人工干预的需求;智能化匹配和管理会议,提高会议安排的整体效率,实现会议室资源的高效管理和利用。

日程提醒: 会务系统能够与用户的日历无缝集成,实现智能化的日程管理和调整功能,用户可以更好地管理和调整会议日程。大模型还可以通过自动通知和提醒功能,完成对参会人员签到等工作,确保人员准时参加,规范会议流程、提升会议效率。

个性化和精准推荐: 大模型能够根据用户的偏好和历史行为,提供个性化的会议安排建议,推荐最适合的会议时间和地点,不仅提升用户体验,还提高会议人员的参与度和满意度。

会议数据分析与优化: 大模型能够自动收集和整理会议数据,生成详细的会议统计报告,帮助用户了解会议室使用模式,分析会议室的使用情况;可重新评估会议室的用途,优化资源配置。同时也可分析参会者的出席率、签到时间分布等,优化会议流程,为未来活动规划提供参考。

3. 产品&解决方案

华为云会议盘古助手: 基于文字智能、语音智能和多模态智能等多种能力,大幅提升会前、会中、会后等环节的多个场景的工作效率。会前支持会议智能预约、会议通知自动推送;会中的智能对话能力支持50+精细化会控功能,可实时回顾会议内容和关键点评;在会议结束后,盘古助手可根据识别记录的内容进行智能分段,并生成实时会议记录和智能摘要。

飞书智能会议预约: 飞书的智能会议预约系统通过自动化会议安排、协调参会人员时间、实时同步日历等功能,解决传统会议安排中的人工协调耗时、时间冲突和重复预订等问题。飞书允许用户通过订阅同事日历,查找共同空闲时间,在日历视图中查找和预定会议室,并提前发送日程邀请,确保参会者能够及时了解会议安排并做好准备;在会议中实现会议纪要自动生成、实时字幕和智能转写,帮助用户高效整理和管理会议内容。

朗歌会议预约系统: 用户可通过PC端、移动端等多种方式在朗歌智能会议应用平台上随时了解会议室的当前状态并进行预约。邮件和短信通知预约会议室或取消预约,支持会议签到、会议临时预定/取消/延时等功能,提升会议组织效率及体验,让参会人员的沟通更加顺畅高效。会议室预约软件注重人机交互设计,图形化操作界面,采用灵活的系统部署方案,可提供云平台部署和本地服务器部署,支持系统远程升级及维护,降低使用成本。

4. 应用实例: 中国海洋大学西海岸校区部署朗歌会议预约系统

朗歌在中国海洋大学西海岸校区心理咨询中心共部署10多台会议门牌一体机,搭配会议预约管理系统。该心理咨询中心还开设通识课、举办知识讲座、开展心理测量等服务,用户可通过移动端或PC端登陆进行提前预约,在门牌一体机上面显示当天的会议安排情况以及场地使用时间等,最大程度利用会议室中的空间资源。

会议预约系统可通过网络一键发送会议信息、会议主题等相关信息至所有参会人员,参与者无论身在何处都能收到信息,沟通精准高效。会议预定后,会议日程与会议主题等会议信息会马上传达到咨询室门前的显示屏以及综合显示屏上,无需人工录入,显著增强学校信息化推进工作流程的规范化,进一步提升学院办公自动化水平。


本文作者

赵明明







请到「今天看啥」查看全文