专栏名称: 天翼智库
天翼智库是中国电信研究院战略发展研究所承办的面向公众的智库研究信息发布平台,为您提供最新信息通信行业发展动态、政策观察、产业分析和战略洞察等。
目录
相关文章推荐
芋道源码  ·  通俗易懂地说说DeepSeek的原理 ·  3 小时前  
Java编程精选  ·  微信+DeepSeek来了! ·  19 小时前  
芋道源码  ·  解析JSON的这 6 种方案,真香! ·  2 天前  
Java编程精选  ·  SpringCloud远程调用为啥要采用HT ... ·  4 天前  
51好读  ›  专栏  ›  天翼智库

【大模型周报第98期】OpenAI宣布ChatGPT搜索功能正式上线

天翼智库  · 公众号  ·  · 2024-11-20 07:00

正文

本期总览

【人工智能治理与行业政策】关键词:监管立法、水印、多模态数据集

11月5日至10日,毕马威中国在第七届中国国际进口博览会期间发布 《人工智能(AI)国际金融监管初探》 报告。报告指出,目前金融监管机构对人工智能的整体立法不活跃,各国和地区根据整体性政策与要求在各自领域进行规范。但随着上位法和人工智能专门法规的出台,相关金融监管机构正在酝酿针对人工智能的监管要求。

10月28日, 普林斯顿大学王梦迪团队提出蛋白水印方法FoldMark ,旨在嵌入水印信息对AI蛋白生成进行版权验证和生成结构的追踪。FoldMark通过两个阶段嵌入水印:首先预训练水印编码器和解码器,然后通过微调生成模型,使其既能生成高质量的蛋白质结构,又能嵌入水印信息。实验结果表明,FoldMark在16位水印代码下,能以接近100%的准确率从编码的蛋白质结构中恢复出水印信息。

11月1日,上海市经济和信息化委员会、上海市文化和旅游局、上海广播电视台印发 《上海市超高清视听产业发展行动方案》 。《方案》显示,上海市将建立以超高清视频、三维声等数字资产为主的多模态语料库,支撑AI大模型训练发展,并打造基于数智化XR增强技术的直播云渲染平台。

【前沿技术进展】关键词: 人类反馈强化学习、智能机器人、多模态大模型

11月1日, 字节跳动豆包大模型团队与香港大学公开联合提出RL/RLHF框架HybridFlow。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种RL算法,显著提升训练吞吐量,降低开发和维护复杂度。HybridFlow在运行各种RL(HF)算法时,吞吐量相较SOTA基线提升1.5至20倍。

11月1日, Meta提出全新后训练范式 Constrained Generative Policy Optimization(CGPO),通过引入“混合评审机制”(Mixture of Judges, MoJ)与高效的约束优化器,克服模型训练过程中的奖励欺骗行为和极端多目标优化问题,显著提升RLHF在多任务环境中的表现。

10月31日, Meta公布机器人触觉感知能力相关的多项研究成果 ,主要包括Meta Sparsh、Digit 360、Meta Digit Plexus、PARTNR基准等。Meta Sparsh是基于AI的触觉编码器,可利用AI的自我监督学习能力实现跨场景触觉感知;Digit 360是高精度传感器,部署在机器人手指上,支持振动、温度等多重感知能力;Meta Digit Plexus是开放性平台,能整合多种传感器,使机器人能更全面感知周围环境,实时对接AI大脑进行反应;PARTNR基准是用于评估人机协作能力的测试框架。

11月5日, 腾讯混元开源Hunyuan3D-1.0大模型 ,这是首个同时支持文字和图像生成的3D开源大模型。Hunyuan3D-1.0采用DiT(Diffusion Transformer)架构,引入多视角扩散模型和前馈重建模型结合的两阶段生成方法,在保证质量和可控的基础上,10秒即可生成3D资产。

【产品应用创新】关键词: AI搜索、模型部署

11月1日, OpenAI宣布ChatGPT搜索功能正式上线 。ChatGPT搜索功能将使用来自网络的最新信息来回答问题,同时提供相关来源链接。该功能覆盖ChatGPT的网页版、手机和桌面应用。OpenAI计划继续改进搜索,特别是在购物和旅游等领域。

10月31日, 知乎直答正式上线“专业搜索”功能, 引入维普论文库、公开英文论文和知乎精选等专业内容源,通过严格筛选和过滤机制,确保提供的内容专业、可信。通过“专业搜索”,用户可搜索特定概念或问题,访问论文原文,使用全文精读等功能,一站式提升查阅和阅读文献资料效率。

11月5日, 昆仑万维天工AI发布最新版本的AI高级搜索功能 ,在数据和信源的时效性、权威性、质量、相关性,以及内容索引丰富度等方向进行全方位升级,针对用户在复杂问题解决、金融投资、科研学术、文档分析等多领域的需求,带来专业优化和流畅体验。

11月1日, Anthropic宣布Claude AI推出桌面平台客户端 ,Claude AI 客户端定位AI搜索引擎,主打语音搜索,用户也可以令其写作文章邮件、解决数学问题、判断语法错误、分析文档内容等。目前相关客户端处于测试状态,支持Windows、macOS、iOS平台。

10月31日, 百川智能发布一站式解决方案 ,帮助企业高效经济地私有化部署大模型。方案包含全链路优质通用训练数据、Baichuan4-Turbo和Baichuan4-Air两款模型,以及全链路领域增强工具链,支持企业将专有数据与全链路优质通用训练数据混合使用,对Baichuan4-Turbo和Baichuan4-Air两款模型进行调优和性能增强,实现高达96%的多场景可用率。

【产业市场竞合】关键词: 国家安全、医疗行业、智能汽车

11月5日, Meta宣布将Llama系列模型向美国政府机构和从事国家安全的承包商开放, 以支持国家安全应用。甲骨文、微软、Scale AI等公司与Meta达成合作,帮助推动Llama系列模型应用于各类国家安全任务中。Meta还向英国、加拿大、澳大利亚和新西兰的政府机构和承包商提供Llama模型。

11月2日, 华西医院联合华为数据存储发布“华西黉医”医学大模型。 720亿参数级的全自主知识产权的“华西黉医”医学大模型,集成10余类通用模型和50余类垂域模型,融合110万条医患对话集、1600余份共识指南、150余部权威教材、100余部医学政策法规、3.5PB原始影像数据和250余万的病历数据。

10月30日, 赛轮思宣布以生成式AI赋能雷诺下一代多模态虚拟车载伴侣Reno 。雷诺汽车将利用由生成式AI驱动的Cerence Chat Pro,进一步提升Reno能力,包括与用户进行有趣闲聊、随时响应任何指令与疑问等。

趋势洞察

1. AI治理与行业应用结合愈发紧密

一是各行业加快推出符合行业特性的AI治理规范标准及技术方案,应对AI深化应用带来的安全风险及监管挑战。 金融领域 正结合上位法和人工智能专门法规完善监管要求,生物安全领域则通过嵌入水印信息这一技术方案进行AI蛋白的版权验证和生成结构追踪。 二是各应用领域的跨行业合作和信息共享成为推动AI治理发展的重要动力。 不同行业之间通过共享最佳实践、经验教训和监管要求,可以相互学习、相互借鉴,共同推动AI治理的完善和发展。如 2023年韩国成立跨行业人工智能联盟 ,聚集汽车、机器人等10个主要行业的400余家企业,旨在推动AI技术跨行业价值链开展合作,联盟专设负责法律法规的政策小组委员会,以促进AI治理跨行业的合作和创新。

2. 机器人多模态感知能力正向触觉领域拓展,或进一步激发高质量触觉数据需求

近日, Meta公布包括传感器、编码器、平台及测试框架在内的一套大模型触觉感知相关研究成果 ,旨在让机器人通过触觉方式进一步理解和操作外界物体。 触觉感知技术推动机器人抓取和操作能力发展,将促进机器人行业应用。 如Meta的Digit 360配备超18种传感功能,能捕获小至1毫牛顿的力,感知振动、热量和气味,使机器人精准感知目标物品位置和状态,将促进机器人在工业领域中准确抓取易碎、易变形物品;在医疗领域中更好理解患者身体情况并提供个性化康复方案;在日常生活中完成剥水果、穿衣服等精细操作。 触觉感知技术将催生触觉数据需求,相关数据集构建将面临挑战。 一方面,传感器形式更多样,标注方式和内容不统一。如各类传感器在形状、照明和凝胶标记等方面各不相同,导致数据集兼容性、可扩展性不足。另一方面,触觉数据结构更复杂,技术和设备要求高。如Meta为训练机器人理解物体软硬、是否滑手等属性,将数据收集分为力量预测、滑移检测、姿态估计3个阶段。采集相关数据,需配备对应触觉传感器和相关系统,将导致成本上升。

3. AI搜索赛道竞争白热化,细化搜索场景或成突围关键

当前AI搜索已成为国内外搜索龙头企业、大模型企业竞相争夺的新战场,AI搜索大战进入白热化阶段。 据不完全统计,目前已有 十多家企业 布局AI搜索赛道,国外如谷歌、微软、Perplexity等,国内如百度、360、搜狗、秘塔等, OpenAI、Anthropic 等全球领先的大模型企业的加入将加剧AI搜索领域竞争。 在搜索领域竞争日益激烈的当下,专业化、细分化搜索场景或成突围关键。 相较于通用AI搜索,垂类AI搜索能够基于更高质量数据,精准满足用户特定搜索需求,提升搜索效率和用户体验。如夸克升级高考AI搜索,引入权威官网、院校招生简章等专业信息源,凭借专业化高考信息服务吸引大量用户,在6月高考季,高考AI搜索使用量 超1亿次 为增强竞争优势,入局企业纷纷加注专业化、细分化AI搜索 ,如 昆仑万维天工AI升级金融投资专业AI搜索、科研学术专业AI搜索;知乎直答上线“专业搜索”功能;OpenAI表示将重点围绕购物、旅行等领域继续改进AI搜索。

每周一场景: 应急指挥

1. 场景简介

《关于深化智慧城市发展 推进城市全域数字化转型的指导意见》提出,推进城市精准精细治理,深化“一网统管”建设,推动城市规划、建设、管理、运维全过程各环节数据融通,整合状态感知、城市运行、应急指挥等功能。应急指挥指利用AI大模型技术对突发事件、灾害事故、公共安全事件等进行实时监控、数据分析和决策支持的过程。

传统的应急指挥主要依靠人工与信息系统协同,传递事件并进行决策,存在以下痛点难点:

数据查询难、更新不及时: 数据分散在各自独立的数据库,查询麻烦,且更新、传输慢,数据统计需要手动调取,决策者难以快速、方便地获得最新数据。

决策缺乏参考: 决策者仅凭借自身经验和逻辑判断进行决策,无法参考类似历史案例、无法预知可能的事态走向。

2. 大模型赋能

实时数据监测及应急事件预警: 大模型基于自然语言处理(NLP)技术,可以解析非结构化数据、提取关键信息。并且能整合来自不同来源的数据,如气象数据、交通监控、社交媒体信息等,对各项数据进行实时监测和分析,系统可以及时发现潜在风险因素,并向决策者发出预警,从而采取及时应对措施,将风险扼杀在萌芽状态。

学习历史案例,提供决策参考: 大模型基于深度学习技术,可以分析历史应急事件案例,学习不同情况下的有效应对策略、识别出不同事件之间的模式和关联性,并根据实际情况提供决策参考。

决策支持信息更易查: 大模型赋能后,决策者可通过自然语言查询决策所需信息,相较于传统的应用信息系统的查询方式,更加简单、快捷、直观。

动态预案实时更新: 基于传感器实时回传数据及大模型实时分析,大模型能随着事件发展动态调整预案,提供实时更新的处置建议,有助于指挥者根据最新情报做出更加精准的决策。

多场景模拟与决策优化: 大模型可以模拟不同的应急响应场景,评估各种预案效果,帮助决策者选择最优应对策略。

3. 产品&解决方案

(1) 国家城安院、深圳城安院“城安”大模型

“城安”大模型依托国产大模型进行增强式训练,涵盖深圳市城市安全大数据库中来自应急、交通、住建、消防等2300亿余条各行业安全相关数据,含风险点及危险源数据400余万个、现有法律法规200余部、事故案例5000余篇等,构建强大应用技术服务底座,深化应急行业智能化需求。主要功能包括:

监测预警: 整合视频智能算法,形成算法超市,对加油站异常行为、道路积水、建筑施工等异常事件进行智能监测预警。

智能问数: 通过自然语言的对答形式,智能访问业务系统数据资源;自动使用可视化图表方式,呈现用户需要的数据结果。

辅助决策: 对事故报告、应急预案、法律法规进行智能化推理和解析,为同类型企业精准化推送以往历史事故原因,形成预警单;为突发事件快速推送各成员单位救援职责,形成指令卡。

(2)叙简科技应急指挥平台

叙简科技应急指挥平台防汛专题能够打通防汛各部门之间的业务数据壁垒,从汛前准备、汛期监测预警到汛情联动处置等方面,全面提升城市防汛防台能力和汛情应急处置能力。同时,结合银杏大模型的水利防汛大模型,可以智能辅助生成洪水调度方案,结合数字孪生与水利一张图,打造水利部门的指挥“智脑”,进一步提升指挥效率和指挥能力。

(3)“久安”大模型

“久安”大模型吸收危险化学品、煤矿、森林火灾和安全生产执法等业务领域海量专业知识,依托国产大模型和应急云基础算力进行增强训练,能够从大量视频监控中自动筛选危化企业厂区人员聚集、工贸企业作业场所粉尘积聚、强降雨地区城市内涝等安全风险,帮助基层执法人员轻松实现拍照识别隐患和制作检查清单,智能辅助危化品和森林火灾应急处置,满足应急管理人员问知识、问数据、问图像、问视频等多种需求,有效提升应急指挥中,监测预警、监管执法、应急救援和智慧决策方面的科技支撑能力。

4. 应用实例

“高度复杂、碎片化程度高、跨领域”一直是交通行业数智化升级路上的首要痛点。由中科视语、西安市雁塔区政府、西安未来人工智能计算中心联合打造的参数规模千亿级的“秦岭·秦川交通大模型”,面向智慧交通领域,为西安及其周边地区打造智慧交通创新支点。模型结合西安当地海量开放场景下的交通生态数据、中科视语的原创先进算法以及西安未来人工智能计算中心昇腾AI的强大算力,为路网监测、应急指挥、养护管理、公众出行等智慧交通全场景带来数智化变革。

以秦岭·秦川交通大模型为技术能力基座,上层构建了数据治理平台和视图智能分析平台。其中,数据治理平台负责数据采集、数据组织、数据接入、数据服务、数据处理、数据治理,为功能实现提供数据支持;视图智能分析平台内置全目标分析、人脸及车辆识别、缺陷检测、V2X预警、档案管理、流媒体分析等多种算法,能够采集道路表观病害数据并进行道路损坏预警、集合路网数据和城市交通特性数据,辅助应急指挥等功能,帮助管理者提升交通应急管理、态势研判的综合能力。


本文作者

王晓娣







请到「今天看啥」查看全文