专栏名称: 天翼智库
天翼智库是中国电信研究院战略发展研究所承办的面向公众的智库研究信息发布平台,为您提供最新信息通信行业发展动态、政策观察、产业分析和战略洞察等。
目录
相关文章推荐
阿里开发者  ·  一文讲清Nvidia GPU和阿里云GPU异构机型 ·  4 小时前  
阿里开发者  ·  K8S异常诊断之俺的内存呢 ·  19 小时前  
阿里开发者  ·  破解 vLLM + DeepSeek ... ·  昨天  
51好读  ›  专栏  ›  天翼智库

【大模型周报第101期】美国商务部工业和安全局(BIS)发布出口管制的 “强化版” 新规

天翼智库  · 公众号  ·  · 2024-12-20 07:00

正文

本期总览

【人工智能治理与行业政策】关键词: 政府监管、出口管制、智能制造、产业生态

11月20日, 美国人工智能安全研究所宣布成立国家安全人工智能风险测试工作组(TRAINS) ,该工作组汇集美国政府各部门的合作伙伴,旨在识别、衡量和管理快速发展的人工智能技术对国家安全和公共安全的新影响。

11月22日, 工信部等十二部门联合印发《5G规模化应用“扬帆”行动升级方案》 ,提出加快培育新终端,推动基于5G的智能机器人、智能移动终端、云设备等研发应用,鼓励融合5G的XR业务系统、裸眼3D、智能穿戴、智能家居等产品创新发展。

11月22日, 天津市发布《关于支持天津市大模型应用生态基地建设发展政策措施》 ,力争到2026年,形成高质量数据开放、应用场景丰富、头部企业集聚、大模型能力领先的人工智能产业生态,为天津经济高质量发展注入新的动力。

12月2日, 美国商务部工业和安全局(BIS)发布出口管制的“强化版”新规 ,进一步限制中国人工智能和先进半导体的发展,对24种半导体制造设备、3种用于开发或生产半导体的软件工具以及高带宽存储器(HBM)实施新的出口管制。

12月2日, 工业和信息化部公开征求对《国家智能制造标准体系建设指南(2024)》(征求意见稿)(以下简称《指南》)的意见 《指南》明确,到2026年,制修订100项以上国家标准、行业标准,构建适应新型工业化发展的智能制造标准体系。

【前沿技术进展】关键词: 模型压缩、数据共享、RAG、去中心化训练

11月19日, 美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA ,通过减少LLM冗余并降低信息层精度来为模型“瘦身”,“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供与未压缩版本几乎一样准确而微妙的性能。

11月22日消息, 英伟达推出自动化数据生成系统DexMimicGen ,该系统可基于少量人类演示,合成类人机器人的灵巧手运动轨迹,解决训练数据集的获取难题。同时,随着DexMimicGen生成数据量的增加,机器人策略表现也显著提升。

11月25日, Anthropic开源模型上下文协议(MCP) ,旨在实现LLM应用程序与外部数据源和工具之间的无缝集成。MCP为AI Agent系统安全、高效地访问各种数据源提供统一方式,包括数据库、云存储、业务工具和开发环境,甚至直接与计算机的操作系统和硬件交互。

11月26日, 微软宣布将推出知识索引GraphRAG的全新迭代版本LazyGraphRAG ,核心亮点在于极低的使用成本,其数据索引成本仅为现有GraphRAG的0.1%。此外,LazyGraphRAG引入全新的混合数据检索方法,大幅提升生成结果的准确性和效率。

11月28日, 月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake ,Mooncake围绕超大规模KVCache缓存池展开,通过分阶段方式逐步开源高性能的KVCache多级缓存Mooncake Store,同时针对各类推理引擎和底层存储/传输资源进行兼容。

11月30日, Prime Intellect团队开源全球首个去中心化训练的10B参数大模型INTELLECT-1 ,模型训练由美欧亚三大洲、五个国家,同时使用112台H100 GPU完成。测试结果表明,模型在存在严重带宽限制和节点波动情况下,依然能维持训练收敛性和高计算利用率。

【产品应用创新】关键词: 3D生成、AI Agent、多模态大模型、智能眼镜

11月21日消息, 宝可梦GO团队宣布推出大规模地理空间模型LGM ,通过大规模机器学习理解,连接全球数百万个场景,实现对地理位置的智能理解和互动。LGM结合视觉定位系统VPS,利用用户扫描数据创建详细的3D地图,推动AR眼镜和机器人等领域的突破。

11月25日消息, 谷歌云发布商用AI Agent市场 。面向企业用户,提供个性化选择,简化部署流程,并支持免费试用。面向开发者和合作伙伴提供技术工具、市场资源和激励计划,推动AI Agent解决方案开发。目前上架19款产品,已有多个知名企业成功部署。

11月26日, Hugging Face宣布推出SmolVLM AI视觉语言模型(VLM) ,仅有20亿参数,用于设备端推理。官方表示其优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM数据集、训练配方和工具均在Apache 2.0许可证下发布。

11月28日, 苹果模块化智能眼镜专利申请公布 。该眼镜支持添加音频设备、替换镜框等配件;支持虚拟现实、增强现实及混合现实功能,满足不同需求的定制化用户体验。用户可根据需求调整功能组件,如高分辨率显示或长续航,以适应不同使用场景。

12月3日, 李飞飞的World Labs推出首个“空间智能”模型 ,实现从一张图生成3D世界,可用于实时渲染、生成可互动的虚拟环境,改变游戏、电影和VR的发展。该模型结合了生成式AI与3D技术,可以为创作者提供全新的创意工作流,并推进空间智能的应用。

12月3日, 亚马逊云科技(AWS)在re:Invent大会上发布自研Amazon Nova系列6款大模型 ,包括Micro、Lite、Pro、Premier四个版本的语言模型,以及图像生成模型Canvas、视频生成模型Reel,这些模型均支持自定义微调和蒸馏。AWS还将在明年推出“语音转语音”模型和“任意转任意(Any-to-Any)”多模态模型。

12月4日, 谷歌旗下DeepMind发布大型基础世界模型Genie 2 ,能够根据用户输入的文本描述和图像,实时生成交互式的三维场景,人或AI Agent均可通过键鼠操作,进入这个新创建的世界并与之互动。该模型可用于训练和评估具身Agent。

【产业市场竞合】关键词: AI搜索、AI芯片、人才流动、AI联盟

11月21日, 搜狗输入法推出和升级AI搜索、AI快查等重要功能 ,该功能基于腾讯混元大模型技术支持,实现“输入即搜索”,在学习、办公、社交等场景中应用,用户可免费使用全部AI服务。

11月22日消息, OpenAI考虑开发浏览器,与谷歌竞争 。OpenAI最近与Condé Nast、Redfin、Eventbrite和Priceline等网站和应用开发商合作商讨,考虑开发一款与其聊天机器人结合的网络浏览器,以增强搜索功能。

11月29日, AI芯片初创公司Tenstorrent获7亿美元投资,亚马逊创始人贝索斯参投 ,旨在挑战英伟达在AI芯片市场的领导地位,计划开发价格亲民的GPU替代品,采用开源技术和常见组件,避免高成本组件的使用,从而提高成本效率。

12月3日, 中国电信与华为、中兴等成立AI联盟 。在中国电信“2024 数字科技生态大会”期间,TeleAI宣布与包括华为、中兴、亚信科技等在内的19家合作伙伴发布中国电信人工智能开发者产业联盟计划,加快推动人工智能产业发展,提升技术能力与应用水平。

12月4日, 三名谷歌Vision Transformer作者官宣加入OpenAI 。三名来自谷歌DeepMind苏黎世办事处的资深研究科学家Xiaohua Zhai(翟晓华)、研究科学家Lucas Beyer和Alexander Kolesnikov加入OpenAI,在谷歌DeepMind工作期间,三人曾共同参与ViT等重要研究,之后将一起建立OpenAI苏黎世办事处,从事多模态AI研究。

【业内专家观点】关键词: 智能机器人、AGI、强化学习

11月23日, 黄仁勋在香港科技大学强调,有且仅有三种机器人有望大规模量产 :汽车、无人机、人形机器人,其中人形机器人因适应人类环境而潜力最大。大湾区因同时具备机电技术和人工智能技术优势而拥有独特机遇。

11月29日, Yann LeCun推翻之前观点,宣布AGI将在5到10年内实现 。2023年12月,Yann LeCun认为人类水平的AI至少需要10到20年才能实现。一年过去,Yann LeCun改口,表示AGI将在5到10年内实现,但坚持认为现有的大语言模型(LLM)无法成为通向AGI的路径。

11月29日, 前OpenAI联合创始人Andrej Karpathy表示AI尚未实现真正的强化学习 。AI本质是统计数据模型,并非超越人类的智慧,主要通过模仿数据标注员来生成答案。AI存在局限性,包括随机性、非推理性和数据偏差,无法进行复杂推理和理解问题。目前RLHF虽然提升AI性能,但仍处于初期阶段。

趋势洞察

1. 美出口管制持续加强,我国云计算和人工智能企业需要提前应对

自2022年10月首次实施全面出口管制以来 ,美国不断升级对华半导体出口的限制,逐步扩大受控物项范围、更新实体清单,并增加对特定地区和公司的出口限制。 近日, 美国商务部发布新的出口管制措施 对半导体设备、AI芯片市场关键产能存储芯片HBM、EDA等软件工具以及半导体投资围追截堵,进一步加强对半导体制造设备、先进计算、超级计算领域相关物项的出口管制。此外, 当选总统特朗普将加强美国AI领域的领导地位,重塑全球AI产业格局。 在上一任期内,特朗普政府已把人工智能置于国家安全战略的重要位置,特朗普此轮任期预计将持续到2029年,覆盖AGI关键窗口(2026年到2029年)。如媒体援引消息人士报道,当选总统特朗普正考虑在白宫设立一个新职位,负责协调人工智能(AI)事务。 预计云计算将可能成为未来出口管制的重点。 尽管芯片是出口管制的核心,但我国企业可以与云服务商签订租赁协议从而访问受控芯片,规避出口管制。如 科大讯飞通过使用云服务供应商和与第三方签订租赁协议 ,来使用其他公司的计算机集群训练数据集,在无需物理上自身占有芯片的情况下获得足够算力。美国国会下属的美中经济与安全审查委员会(USCC)在其年度报告中已提及国内企业此策略,未来或成出口管制重点方向之一。

2. “世界模型”的实现路径或按大语言模型-多模态模型-空间智能模型推进

人类对人工智能的终极需求是可以理解世界、模拟世界并与之交互。 Meta首席AI科学家Yann LeCun认为,“世界模型”是实现这一目标的新方法,将定义人工智能的未来 。他指出,世界模型是能够理解三维世界如何运作的模型,可执行多模态预测。 目前大语言模型(LLM)加速向多模态模型(LMM)升级发展,但仍是实现世界模型的过渡性产物 。其上下文长度、Transformer架构、序列处理及注意力机制等底层表示均为一维,并不能真正理解三维世界。 业界已经开始探索空间智能的的软硬件基础,向模拟世界迈进 。多家公司发布图生3D模型,如OpenAI的Sora追求极致的视觉真实感,用扩散模型(DiT)编织时空连续性; 李飞飞团队的World Labs在12月3日发布空间智能模型 ,专注于空间的几何精确性; 谷歌DeepMind紧随其后发布Genie 2 ,创造具有可控性交互的动态世界。世界模型是人工智能实验室目前追求的宏大构想,在创建多样化3D环境、加速智能体研究和具身智能等应用方面具有极大潜力。

3. 大模型去中心化训练技术为我国解决超大规模大模型训练算力资源分散与错配问题提供新选择

大模型去中心化训练指不依赖单一中心服务器或数据存储中心,而是在多个节点(如设备或数据拥有者)上进行联合训练的方法,相较中心化训练,去中心化训练能够整合零散算力,与模型规模急剧增长、算力愈发紧缺的大模型时代具有更强的适配性。 国内外研究团队陆续开启大模型去中心化训练方法探索,这一技术由研发走向落地。 清华团队创立的NetMind.AI推出去中心化计算平台NetMind Power ,挖掘全球闲置算力资源、收集数千张显卡,为用户提供经济高效的AI算力服务; Prime Intellect团队开源全球首个去中心化训练的10B参数大模型INTELLECT-1 ,模型训练由美欧亚三大洲、五个国家,同时使用112台H100 GPU完成,且在各大洲实现83%的高总体计算利用率。 当前我国智算存在算力资源分散、供需错配等问题 。一方面,我国算力资源分散严重,信通院研究数据显示,我国各类算力提供主体超过5000家,Top10算力提供主体仅运营30%算力资源;另一方面,市场上流通的GPU数量与智算中心数量间未形成良性匹配,大量集群实际使用率不足60%,导致算力供需错位问题。未来,我国超大规模大模型训练可借鉴INTELLECT-1训练思路,将训练任务拆分并分配至全国各地中小型算力节点上,以协同合作提升整体算力利用率。

每周一场景:公文写作

1. 场景简介

公文写作是指利用自然语言处理等AI技术,通过对海量公文样本数据的挖掘和分析,准确把握公文写作的基本规律和格式要求,从而高效生成各类符合要求的公文内容。中国信通院指出,政府公文写作是内部事务中任务量大、机械性高的事项之一,将大模型等智能化工具应用于公文写作,能够将公务员从繁复的文案工作中解放出来,使其更加投入到创造性的工作中。

传统公文写作主要依靠人工撰写,因此存在以下痛点和难点:

耗时较长,工作效率低下: 公文种类多样,不同文种格式要求各异,写作所需信息来源繁杂且分散,加重人工撰稿、审稿负担,导致工作效率低下。据华为研究,公文起草前需进行海量资料查找,平均耗时3-5天;公文撰写面临“提笔难”、语言组织耗时长等问题,平均耗时1-2周。且写作完成后,需经过多轮审稿和校对,以确保内容的准确性和格式的规范性。

难以满足个性化写作需求: 各政府部门、不同层级及岗位对于公文撰写往往具有独特的风格偏好,包括文本的语气、遣词造句等,在有限的个人经验和写作时间限制下,撰写人员难以做到充分思考、精准捕捉并满足这些个性化需求。

2. 大模型赋能

自动化内容生成、润色,提升写作效率: 基于高质量语料库的训练,大模型能够高效生成各类公文,撰写人员只需输入文章标题、关键词、主要内容、篇幅等核心信息,大模型即可快速构建公文提纲,并填充相应内容、形成完整文章。同时,大模型能够对已生成内容进行续写、扩写、润色等多方式调整,并支持自动校对功能,能够检测并纠正文本中的语法错误、标点符号错误等,进一步提升文本质量。

智能化排版,保证文本的规范性: 大模型素材库中内置丰富的公文模板,涵盖通报、公告、声明、请示、批复等多种公文格式,支持撰写人员一键排版,将文本内容快速转换为规范的公文格式。此外,允许撰写人员自定义模板,自行设置字体、字号、行间距、段落格式等排版参数,以满足不同类型公文的排版要求。

个性化定制,根据需求进行灵活配置: 针对特色化公文,即具有特定领导或部门风格的公文,可通过引入行业领域特定语料库、用户反馈迭代优化等方式对大模型进行微调,从而使模型“学会”多种细腻的表达方式,生成符合实际应用场景需求的文章。

智能化审核,减轻审核人员负担: 公文审核中,大模型能够对内容导向风险进行识别,通过对党内法规、最新政策等的学习,自动对敏感词、政治固有表述、领导人姓名/职位等政治类信息进行校验,规避可能出现的意识形态偏差等潜在风险,大幅减轻人工审核的负担。

3. 产品&解决方案

浪潮云海若政务大模型: 基于百万级公文知识库训练,能够深入理解并掌握公文结构、语言风格、常用词汇和短语,具备内容智能生成、写作工具箱、智能审核、智能检索、智能对比、智能查重六大功能,为用户提供决议、决定、命令等15种国标公文及通用文稿的智能化写作。此外,支持对公文内容进行多版本对比,快速定位修订内容,并提供颜色标注、差异分析等工具。目前,海若政务大模型能够实现毫米级生成响应时间,有效采纳率为75%,书写工作量降低60%。

致远·方寸公文大模型: 致远互联携手方寸智能公司推出国内首个公文大模型,使用上亿量级高质量公文领域数据和数百万公文知识库、上百位公文专家组成的公文专家调优数据集训练得到,涵盖智能检索、智能写作、智能审核、智能排版四大公文处理核心功能,能够实现15种国际公文类型和9种事务公文的自动生成,支持用户对生成内容进行续写、扩写、改写等二次编辑操作。在智能审核方面,支持校对政治错误、字词错误等6大类、38小类错误,字词校对平均准召率在85%以上,政治审校准确率达99%。

新华妙笔大模型写作助手: 由新华通讯社与博特智能公司基于妙笔大模型联合研发的公文写作AIGC平台,内置妙笔AI工具、妙笔学习、妙笔文库三大核心版块。其中,妙笔AI工具支持AI写作、AI校对、AI续写、AI润色等功能,高效助力公文创作;妙笔学习提供全面、专业的内部资料学习,支持智能搜索问答、会议政策学习等;妙笔文库为用户提供40类范文搜索、18类素材搜索、28种公文模板,满足多样化写作需求。

4. 应用实例: 基于盘古政务大模型的福田政务智慧助手小福

深圳市福田区政务服务数据管理局携手华为云,基于盘古大模型打造福田政务智慧助手小福,深度结合政务专业知识、城市信息模型及视频联网平台等资源,学习全区3000+份政策文件、10万+条政务服务流程文本,对接50万+产业空间数据,在城区智能推介、办公智能写作、经济智能调度等场景落地应用,实现工作效率提升约30%。

在公文写作方面,面向公务人员提供全流程写文辅助,如支持公务人员通过对话的方式,输入主题、关键词、公文提纲、范例、岗位职责等关键信息点,快速生成符合撰写人员意图的公文初稿,实现分钟级的公文起草;提供智能校对功能,能够自动对文本中的错误内容进行快速识别和校对,确保公文文章的准确性和严谨性;在公文批示环节,具备公文摘要自动生成能力,从而为领导批示提供辅助参考。得益于智慧助手的赋能,公务人员公文拟稿周期缩短为1-2天,有效提升政务办公效率。








请到「今天看啥」查看全文