专栏名称: 科技晶选
招商计算机与互联网团队:勤奋、专注、深入,希望带给您思想与逻辑的启发!
目录
相关文章推荐
51好读  ›  专栏  ›  科技晶选

【华西计算机】周观点:AI应用加速落地,推理算力井喷在即

科技晶选  · 公众号  ·  · 2024-12-29 19:50

正文

请到「今天看啥」查看全文


本周观点



一、算力:大模型更新需要强大算力支撑,推理算力井喷在即
字节跳动近期在上海举办的火山引擎Force原动力大会,CEO谭待表示字节跳动的豆包模型日均 token 使用量截至 2024 年12 月中旬已超 4 万亿,短短七个月间增长 33 倍。这一惊人的数据背后,是AI技术在各行业广泛应用所带来的对算力的巨大需求。无论是智能客服的即时响应、图像生成的精美画面,还是海量数据的深度分析,每一项AI应用的背后都离不开强大的算力支持。根据大成未来产业研究, 相关专家指出,OpenAI o1-preview的 token 消耗量通常是 GPT-4 的 2-5 倍,网页版更高。这意味着,为了支持  OpenAI o1-preview的推理,需要构建更大规模的算力集群,这将对数据中心建设和运营带来新的挑战。根据游方AI, 市场调研机构IDC预测,我国智能算力年复合增速为33.9%,其中训练算力占比将下滑至27.4%,推理算力占比将上升到72.6%。这一变化反映了AI应用从模型训练向应用推理的转变,推理算力的需求正在逐渐超过训练算力。我们认为目前阶段,高性能 GPU 仍然是最佳选择,但未来 3-5 年内,高性价比的国产 AI 芯片有望占据市场。

二、大模型:国产模型引领,各应用场景迈向新高度
2024年,大模型的缩放定律依然有效。全球大模型井喷式发展,无论是语言、视觉、声音还是多模态大模型,都在依据缩放定律进行快速迭代升级。在2023年初野蛮生长期的“百模大战”之后,行业在2024年经历了一场大浪淘沙,行业竞争格局从分散走向“收敛”。咨询机构弗若斯特沙利文指出,中国目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、云计算巨头及人工智能创业公司主导。 目前国产大模型占据了闭源大模型主观评测榜单的大半壁江山。其前20名中共有15款国产大模型,占比75%,包括豆包通用模型pro、百度ERNIE 4.0 Turbo、阿里巴巴Qwen-Max、智谱华章GLM-4-Plus、阶跃星辰Step 2等。 12月27日,OpenAI 正式宣布,OpenAI将转型为公共利益公司(public benefit corporation),将会采用更为传统的公司架构。在新架构下,包括微软在内的股东将直接持有公司股权,而不是仅享有未来利润分配权的股份。根据声明,若重组完成,公益企业(盈利部门)将负责 OpenAI 的运营和业务,而该非营利部门将聘请领导团队和员工,在医疗保健、教育和科学等领域开展慈善性项目。

投资建议



受益标的


微信小店相关产业链: 微盟集团、光云科技、有赞集团、壹网壹创、天地在线、青木科技等。

AI 金山办公、润达医疗、新致软件、开普云、彩讯股份、科大讯飞、焦点科技、万兴科技、维海德。

机器人: 能科科技、麦迪科技。

豆包AI相关产业链: 润泽科技、乐鑫科技、润欣科技、中科蓝讯、翱捷科技、世纪天鸿、汉仪股份;

华为相关产业链: 软通动力、润和软件;

端侧AI: 寒武纪、海光信息、中科曙光、博士眼镜、亿道信息、云天励飞、天健股份、星宸科技。

NV 链: 远东股份、淳中科技、麦格米特。



风险提示



市场系统性风险、科技创新政策落地不及预期、中美博弈突发事件


盈利预测与估值



资料来源:wind、华西证券研究所

注:朗新科技(与通信联合覆盖)、金山办公(与中小盘联合覆盖)、指南针(与非银联合覆盖)。


正文




1.AI应用加速落地, 推理算力井喷在即

2025年将成为算 力爆发元年,推理算 力井喷在即

字节跳动近期在上海举办的火山引擎 Force原动力大会,CEO谭待表示字节跳动的豆包模型日均 token 使用量截至 2024 年 12 月中旬已超 4 万亿,短短七个月间增长 33 倍。这一惊人的数据背后,是AI技术在各行业广泛应用所带来的对算力的巨大需求。无论是智能客服的即时响应、图像生成的精美画面,还是海量数据的深度分析,每一项AI应用的背后都离不开强大的算力支持。根据大成未来产业研究,相关专家指出, OpenAI o1-preview的 token 消耗量通常是 GPT-4 的 2-5 倍,网页版更高。 这意味着,为了支持  OpenAI o1-preview 的推理,需要构建更大规模的算力集群,这将对数据中心建设和运营带来新的挑战。根据游方AI,市场调研机构IDC预测,我国智能算力年复合增速为33.9%,其中训练算力占比将下滑至27.4%,推理算力占比将上升到72.6%。 这一变化反映了AI应用从模型训练向应用推理的转变,推理算力的需求正在逐渐超过训练算力。我们认为目前阶段,高性能 GPU 仍然是最佳选择,但未来 3-5 年内,高性价比的国产 AI 芯片有望占据市场。


端侧AI产业链竞争激烈,技术创新成为关键竞争力!

2024年,大模型的缩放定律依然有效。全球大模型井喷式发展,无论是语言、视觉、声音还是多模态大模型,都在依据缩放定律进行快速迭代升级。在2023年初野蛮生长期的“百模大战”之后,行业在2024年经历了一场大浪淘沙,行业竞争格局从分散走向“收敛”。咨询机构弗若斯特沙利文指出,中国目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、云计算巨头及人工智能创业公司主导。 目前国产大模型占据了闭源大模型主观评测榜单的大半壁江山。其前20名中共有15款国产大模型,占比75%,包括豆包通用模型pro、百度ERNIE 4.0 Turbo、阿里巴巴Qwen-Max、智谱华章GLM-4-Plus、阶跃星辰Step 2等。 12月27日,OpenAI 正式宣布,OpenAI将转型为公共利益公司(public benefit corporation),将会采用更为传统的公司架构。在新架构下,包括微软在内的股东将直接持有公司股权,而不是仅享有未来利润分配权的股份。根据声明,若重组完成,公益企业(盈利部门)将负责 OpenAI 的运营和业务,而该非营利部门将聘请领导团队和员工,在医疗保健、教育和科学等领域开展慈善性项目。


投资建议

受益标的:

微信小店相关产业链: 微盟集团、光云科技、有赞集团、壹网壹创、天地在线、青木科技等

AI: 金山办公、润达医疗、新致软件、麦迪科技、开普云、彩讯股份、科大讯飞、焦点科技。

多模态: 万兴科技、维海德。

机器人: 能科科技、麦迪科技。

豆包AI相关产业链: 润泽科技、乐鑫科技、润欣科技、中科蓝汛、翱捷科技、世纪天鸿、汉仪股份;

华为相关产业链: 软通动力、润和软件。

端侧AI:寒武纪、 海光信息、中科曙光、博士眼镜、亿道信息、云天励飞、天健股份、星宸科技。

NV链:远东股份、 淳中科技、麦格米特。


2.本周热点内容
2.1. 2025 年将成为算力爆发元年,推理算力井喷在即

字节跳动近期在上海举办的火山引擎 Force原动力大会,CEO谭待表示字节跳动的豆包模型日均 token 使用量截至 2024 年 12 月中旬已超 4 万亿,短短七个月间增长 33 倍。这一惊人的数据背后,是AI技术在各行业广泛应用所带来的对算力的巨大需求。无论是智能客服的即时响应、图像生成的精美画面,还是海量数据的深度分析,每一项AI应用的背后都离不开强大的算力支持。随着AI技术不断渗透到人们生活和工作的方方面面,算力需求如同火山喷发般迅猛增长,成为推动产业发展的强劲动力。2025年将成为算力爆发元年,国产算力时代即将拉开帷幕。

(一)豆包MAU仅次于ChatGPT,豆包大模型日均tokens使用量超过4万亿

根据钛媒体,今年11月全球月活跃用户排行榜显示,豆包App的MAU已接近6000万,仅次于OpenAI的ChatGPT,位列全球第二。字节跳动正式发布了豆包视觉理解模型、豆包3D生成模型,以及全面升级的豆包通用模型pro、音乐模型和文生图模型等。
山引擎总裁谭待宣布,豆包视觉理解模型输入价格仅为0.003元/千tokens,1块钱可处理284张720P的图片,比行业价格便宜85%。字节跳动的视觉理解模型定价为每 千tokens 0.003 元,相较于行业平均价格降低了 85%。如此亲民的价格,让更多企业和开发者能够轻松触达先进的 AI 技术。以往高昂的算力成本曾是许多企业应用 AI 的 “拦路虎”,而如今,字节跳动通过技术创新和优化,将算力成本降至前所未有的低水平。这不仅使得中小企业能够借助 AI 提升竞争力,还将加速 AI 技术在各个领域的普及,进一步激发算力需求,形成良性循环,推动整个产业规模的持续扩大。

事实上,在与美国OpenAI的竞争中,从模型层,到软硬件协同推进,字节跳动已站稳AI大模型头部地位。今年11月的全球月活跃排行榜上,豆包App的MAU(月活跃用户数)接近6000万,仅次于OpenAI的ChatGPT,位列全球第二;截至目前, 豆包大模型日均tokens使用量超过4万亿 ,发布7个月以来增长超过33倍。同时,根据钛媒体,字节跳动旗下创作工具剪映和CapCut,全球月活跃用户也已超过8亿,并且在2024年实现收入增长超100%,总收入接近100亿元。张楠表示,即梦愿景是:“想象力世界的相机”。另外,字节跳动在 AI 人才投入、算力投入、基于扣子的Agent智能体、MaaS等 AI 软硬件领域的服务都进行全方位布局。

“我觉 得局部会有一些竞争,但这不是关键,最关键是你能不能把这些东西做好,能把成本做低,能不能把方案、落地应用做好,这样企业和用户能够用起来。我们年初发 布大模型,但是你很少听到业界有谁用起来、用得很好,而5月份豆包发了之后,我们首先把成本做了很大降低,效果也做了很大提升,其实这半年大家才能看到更多市场上反馈模型的声音,在To b的领域,大家都是有竞争,也有合作的,我觉得很正常,主要还是大模型价值非常大,空间也非常大,然后还在增长。”谭待强调,火山引擎就朝着做中国大模型领域、新的技术变革第一名进行发展。
根据和讯股票,字节跳动在2024年的资本开支高达800亿元人民币,用于数据中心基础设施建设等算力相关领域。这一巨额投入彰显了字节跳动对算力产业的坚定信心,也预示着算力产业即将迎来新一轮的高速发展期。字节跳动的积极布局,犹如一颗投入湖中的巨石,将在行业内激起千层浪。其他互联网大厂势必密切关注这一动态,为保持在数字时代的竞争力,极有可能纷纷跟进,加大自身在算力领域的资本开支。这将汇聚成一股强大的资本洪流,推动算力卡、数据中心、电气配套等产业链各环节加速发展,迎来全新的发展机遇。
(二)国内算力布局不断提升
近年来,我国算力规模不断提升,智能算力发展受到高度重视。2022年我国基础设施算力规模达到180 EFlops,位居全球第二。2023年我国智能算力规模达427 Eflops,预计到2027年将达到 1117.4 EFlops。
根据IDC相关统计数据测算,2022年中国通用算力规模达54.5 EFLOPS,智能算力规模达259.9 EFLOPS,预计到2027年通用算力规模将达到117.3 EFLOPS,智能算力规模将达到 1117.4 EFLOPS®。据工信部相关统计数据,截止2022年底,我国对外提供的公共基础算力规模超18EFLOPS,为公众提供服务的数据中心机架数达81.8万个,比2021年末净增8.4万个。

整体而言,算力规模与数据中心数量、部署规模和区域分布密切相关。算力规模越大,相应的数据中心数量越多,分布越广泛;同时,数据中心的分布和部署规模也会影响算力的供给质量和应用效率。如果数据中心分布合理,算力供给类型和规模符合市场需求,可更好地提高算力资源的利用效率,否则或导致算力资源的浪费
结合“东数西算”工程数据枢纽及数据中心布局和由IDC统计的服务器出货量及预测数据来看,京津冀地区、长三角地区和粤港澳地区仍然是未来几年内服务器需求占据前三的地区,其中京津冀地区对服务器需求占据所有数据枢纽和数据中心首位;西部地区由于数据枢纽和数据中心规划对服务器需求有所增加,但总体相较东部地区需求规模尚小,不足其他三个地区的十分之一。

2.2.大模型:国产模型引领,各应用场景迈向新高度
2024年,大模型的缩放定律依然有效。全球大模型井喷式发展,无论是语言、视觉、声音还是多模态大模型,都在依据缩放定律进行快速迭代升级。
2024年大模型已经达到了2万亿参数规模。按照现在的技术路径和认知,无疑大模型将会在明年继续变大,有可能达到50万亿甚至更高。这种大模型训练起来一个中等规模的城市电量也许都不够。
在2023年初野蛮生长期的“百模大战”之后,行业在2024年经历了一场大浪淘沙,行业竞争格局从分散走向“收敛”。根据全景财经,咨询机构弗若斯特沙利文指出,中国目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、云计算巨头及人工智能创业公司主导。
一方面,中国大模型创业公司在2024年形成了相对稳定的“六小虎”格局,智 谱AI、月之暗面、MiniMax、百川智能、零一万物和阶跃星辰在投资机构一轮又一轮的资金加持下,迅速成长为AI独角兽。其中,智谱AI、月之暗面、百川智能均已跻身估值“200亿俱 乐部”,这一速度是上个时代“AI四小龙”们所望尘莫及的,显示了大模型时代技术演进与融资历程的加快。另一方面,中国的传统互联网巨头们也在表演“大象起舞”。百度是最早布局大模型的大厂,今年11月举行的百度世界2024大会上,百度首席技术官王海峰透露大模型产品文心一言的用户规模已达到4.3亿。动作稍慢的腾讯和字节跳动今年也在全力加大对大模型的投入,腾讯在今年5月推出了基于混元大模型的AI助手APP腾讯元宝,字节跳动也凭借着流量投放的优势让旗下的AI大模型应用“豆包”活跃用户数在短时间超越一众竞争对手。

智源研究院12月19日发布了FlagEval“百模”评测结果,今年国产大模型与海外大模型战况焦灼。在其闭源大模型评测能力总榜中,字节跳动的豆包通用模型pro拿到主观评测最高分,OpenAI的o1-mini拿到客观评测最高分;多模态模型评测总榜前三名依次是OpenAI的GPT-4o、字节跳动的豆包视觉理解模型、Anthropic的Claude 3.5 Sonnet。
(一)豆包大模型

在权威机构智源研究院的最新评测中,豆包大模型在重点考察语言模型中文能力的主观评测中排名第一,在多模态的视觉理解、视频生成、图像生成三个赛道均排名全球第二。

以豆包用户青睐的AI语音为例,豆包大模型在ASR和超自然的TTS音色上下了狠功夫,通过超拟人达到类似和真人对话的效果,从而有了差异化竞争力。

豆包战略研究负责人周昊表示:“英语口语练习是大家很喜欢的教育场景。用户反馈说,豆包的发音、词汇量、句型都远远超过他自己。通过豆包实时语音通话功能,和豆包一来一回练英语,毫不尴尬,也省了请老师辅导的开销。”

由此可见,豆包大模型崭露头角,并非偶然。

12月18日,火山引擎FORCE大会举行,豆包大模型公开亮点:1)更强模型,更低成本。2)更易落地。

根据科技头条,秉持“好的模型就是要让每一家企业都用得起”的理念,豆包大模型上线之初,就将通用模型的行业定价降低了99%,拉开了大模型集体降价的序幕。豆包大模型在新上架的视觉理解模型上,再次祭出降价打法:每千tokens的价格为0.003元,比行业平均定价低了85%,相当于一块钱可以处理284张720P的图片;同时,火山引擎额外提供更高的初始流量,RPM达到了15000次,TPM达到120万。

价格战并非豆包大模型的本意,只是技术创新带来的结果,是一个正反馈的良性循环。

抖音集团副总裁李亮表示:“豆包大模型通过技术创新来降低成本,在算法、软件工程和硬件方案上做了非常多优化,3厘/千tokens的定价也有可观的毛利,而且这是一步到位的透明价格,并不是‘刊例价+折扣’的玩法。”

事实上,技术降本一直是豆包大模型的底色。

譬如,新一代的火山引擎GPU实例,通过vRDMA 网络,支持大规模并行计算和P/D分离推理架构,显著提升训练和推理效率,降低成本。再譬如,新推出的EIC弹性极速缓存,能够实现GPU直连,使大模型推理时延降低至1/50;成本降低20%。

豆包大模型推崇的是良性竞争。“对于企业级市场来说,商业模式是建立在可持续发展的基础上,任何商品必须是盈利的,不能靠补贴来降价。如果降价是亏损的,规模越大亏得越多,这就不是合理的商业模式。”谭待如是说。

良性竞争之下,视觉理解进入大浪淘沙阶段,由于门槛降低令更多开发者涌入,刺激更多的应用创新,从而催生繁荣的AICG生态。

第二点是更容易落地,根据科技头条,豆包大模型已经与八成主流汽车品牌合作,汽车行业日均tokens消耗增长了50倍,稳坐汽车行业大模型服务商第一梯队;接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。

豆包大模型落地离不开HiAgent、扣子、火山方舟三大平台的支持,借此第三方企业才可以快速提升AI能力与AI应用开发效率。

以HiAgent为例,定位为低代码平台,大幅降低了基于大模型开发AI应用的门槛,扩大了受众范围,加速AI普惠。

火山引擎副总裁张鑫表示:“如果把豆包大模型比作 Android,那么HiAgent就是企业调度系统能力开发应用的SDK(软件开发工具包)。”

通俗易懂地说,开发者可以像拼乐高一样搭建AI应用。此背景下,HiAgent上线7个月,成为火山引擎增长最快的企业服务产品之一,客户涉及华泰证券、宁德时代、浙江大学等不同领域的佼佼者。更为重要的是,迭代至1.5版之后,HiAgent提供100种行业的开发“样板间”,企业一键复刻,可以使用模板轻而易举地开发AI应用。由此一来,解决了低代码平台“专业客户看不上,小白客户不会用”的传统痛点。

另外,扣子平台 拥有100万个活跃开发者,发布超过200万个智能体;火山方舟的全域AI搜索,将企业的信息、业务和用户需求紧密结合,帮助企业实现“发现更多,推荐更准,搜索无限可能”。

值得一提的是,豆包大模型也在对内赋能。

这其中,AIGC应用即梦表现得可圈可点,借助其制作的科幻短剧《觉醒》,成为首部单日点赞破40万的AI短剧。工信部信息通信经济专家委员会委员盘和林在接受媒体采访时表示:“即梦AI目前在国内(视频)生成领域,还是比较领先的。”这意味着,即梦大大降低了短剧的创作门槛以及影视创作的试错成本。总而言之,豆包大模型采用高举高打的策略,围绕“数据、场景、生态”全面迭代,一跃成为大模型时代的领先者。

(二)百度智能云推出文心大模型精调服务

大模型精调服务可以让企业根据特定的业务需求和数据来训练大模型,从而提升模型在实际业务中的使用效果。这种精调服务特别重要,因为通用大模型虽然具备强大的理解、生成、逻辑和记忆能力,但在实际应用中可能无法完全满足企业的需求,比如行业特殊性、内容生成定制化需求、数据隐私与安全等。

百度智能云推出了文心大模型的最新旗舰版ERNIE 4.0 Turbo的精调服务。这项服务允许企业通过有监督精调(Supervised Fine-Tuning)的方式,针对具体任务构建输入输出,使模型的表现与专业人员的能力对齐,满足企业在行业特殊性、内容生成定制化需求以及数据隐私与安全方面的要求。

ERNIE 4.0 Turbo 是百度智能云6月28日推出的最新旗舰大模型,基于百度自研的超大规模语言模型技术构建,具备出色的综合效果,适用于广泛的复杂任务场景。根据聚大模型前言公众号,ERNIE 4.0 Turbo 模型的精调服务支持企业利用自身的业务数据进行定制化训练,成功案例:如百度文库、百度电商以及医疗行业的应用中已经展现出了显著的成效。在百度文库中,经过ERNIE 4.0 Turbo模型的精调,论文大纲和PPT生成等复杂场景的优质内容率提升了15%;在电商领域,问答优质率提升了45%,同时增加了用户观看时长和成单转化率;在医疗行业,AI医生助理的病历质量提升了超过45%,患者服务数量提升了1.5倍。

目前,百度智能云千帆平台已经支持ERNIE 3.5、ERNIE Speed、ERNIE Lite、ERNIE Tiny、ERNIE Character等六款文心大模型的精调,累计精调出2.1万个模型,服务超过千家企业的核心业务场景。
(三)阿 里云Qwen2.5再登开源大模型王座

2023 年 8 月,通义首次开源后迅速引起全球开发者的关注和热议,短短一年时间内,阿里云大模型又迎来了重要升级。

在 9 月 19 日的云栖大会上,CTO 周靖人宣布:通义千问发布新一代开源模型 Qwen2.5,开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型 Qwen-Max 全方位升级,性能已经逼近 GPT-4o。

通义千问凭借不断迭代的技术和丰富的应用场景,迅速崛起为开发者的热门选择,尤其是在中文社区中引发了广泛关注。这次发布,模型不仅展现出更强大的代码、数学和语言处理能力,还拥有领先的多模态处理和视觉智能,使其成为当前 AI 技术领域的佼佼者。

Qwen2.5 系列是一个超级 AI 模型「百宝箱」,涵盖了多个尺寸的 大语言模型、多模态模型、数学模型和代码模型。 每个尺寸都有基础版本、指令跟随版本和量化版本,总计上架了 100 多个模型 ,刷新了业界纪录。

相比上一代模型,它在训练中使用了更多的训练数据、更大的模型规模,并进行了更深入的人类对齐,最终实现了智能水平的飞跃。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准测试中,Qwen-Max 的表现已经接近GPT-4o,尤其是在数学能力和代码能力上,甚至超越了 GPT-4o。

(四)基座大模型GLM-4-Plus引领智谱全模型家族

GLM-4-Plus 在各大语言文本能力数据集上获得了与 GPT-4o 及 405B Llama3.1 相当的水平。作为智谱最新旗舰模型,在语言理解、逻辑推理、指令遵循、长文本输出方面都有较大突破。

在最新的 SuperBench 大模型评测中,GLM-4-Plus 位列世界前三,打破此前国外模型垄断前三甲的局面。

新基座大模型 GLM-4-Plus 成为智谱全模型家族坚实的能力底座,在代码计算、数据分析、图像/视频特征识别等领域均实现性能的大幅提升,及成本的大幅下降。内测期间,来自金融、互联网、企服、教育等各行业伙伴用 GLM-4-Plus,完成信息抽取、机器翻译、智能体辅助教育等不同的任务。

1)机器翻译更加准确:GLM-4-Plus 系列语言模型在保持了高效响应和快速tokens输出的同时,对垂直行业、国际新闻和科技信息等多个场景都体现了准确的翻译能力。

2)时序问答和多轮对话

在数十秒的视频中,GLM-4V-Plus 可以准确理解并感知时间,精准定位到事件发生的时刻,同时也可以针对单个视频进行多轮对话问答,在视频理解的基础上结合上下文理解指代问题(他们->两辆红色车),进行更丰富的任务处理。

(五)阶跃星辰Step-2位列国产基座大模型第一

半年时间,阶跃星辰从万亿参数的语言大模型出发,迅速完成了语言模型和多模态模型的齐头并进。在 Step-2 万亿参数大模型的加持下,Step-1.5V 多模态模型在图像感知和理解能力上全面提升,并具备出色的视频理解能力。

它能准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪。除此之外,Step-1.5V 有着非常可观的推理能力,能根据图像内容进行解答数学题、编写代码、创作诗歌等高级推理任务。基于这款模型,阶跃星辰还在 C 端智能助手「跃问」上线了智能视觉搜索功能「拍照问」,用户可以即拍即问,比如拍美食图计算卡路里、拍场景学习英文单词等等。如果说 Step-1.5V 的发布,标志了阶跃星辰在极短的时间内实现了从图像理解到视频理解的跨模态升级,那么新发布的 Step-1X 图像生成大模型,则代表了阶跃星辰在推动多模态理解和生成一致性的技术路线上也有了重要进展。

Step-1X 采用全链路自研的 DiT(Diffusion Models with transformer)模型架构,支持 600M、2B、8B 三种不同的参数量,能够满足不同场景的需求。并且 Step-1X 具备强大的语义对齐和指令跟随能力,还针对中国元素和文化进行了深度优化,更具中国风格。这也是 Step-1X 区别于其他模型的重要特色。

除了在基座模型层面布局全面、快速迭代之外,阶跃星辰在产品化上步伐同样迅速:智能助手「跃问」和 AI 开放世界平台「冒泡鸭」,是阶跃星辰面向 C 端用户推出的两款产品。基于 Step 系列通用大模型的强大能力,「跃问」能准确地描述和理解图像中的文字、数据、图表等信息,不仅能出色地完成内容创作、逻辑推理、数据分析等任务,也能满足人们在生活场景中的各种需求,比如可以拍图介绍文物古迹背后的历史知识、帮忙制订旅游攻略、辅助健康管理等等。


3.国外大模型技术不断更迭
3.1.国外在高难度任务处理上具有领先性

10月SuperCLUE基准测评涵盖了16个代表性国外大模型。国内大模型金牌平均线为10月测评中取得金牌的4个国内大模型的平均值。

OpenAI和Anthropic的模型在中文环境仍然是全球最好的大模型。其中,o1-preview取得总分75.85分,有较大领先优势。Claude 3.5 Sonnet(20241022)和ChatGPT-4o-latest表现相当,均有超过70分的表现。国内大模型金牌平均线稍落后于ChatGPT-4o-latest。与此相比,Gemini系列和Llama系列模型则在中文场景下表现相对较弱。

在指令遵循、高阶推理、计算、逻辑推理、代码能力上,海外模型有较大领先性。在文科属性较强的任务上,国内外模型表现相当。

在中文高难度Hard任务(高阶推理和精确指令遵循)上,o1-preview大幅领先。排名第二档的Claude 3.5 Sonnet(20241022)和ChatGPT-4o-latest有超过50分的表现,其余国内外模型均低于50分。

(一)ChatGPT12天进化论

OpenAI 年末的12天连续Devday更新终于落幕,总结起来,本次更新包括:o1正式版、Sora、Canvas。

其中,o1正式版确实提升很大,Sora则是增加了不少对AI生成视频进行更改的产品模式,Canvas可以被视为OpenAI第一次挑战AI工作台的产品尝试。其次,相对还有些看点的是:和苹果的深度合作,视频通话功能,以及o1-mini的强化微调。

o1-mini的强化微调在专业领域潜力很大,微调简单提升明显。视频通话功能则是那个让人惊艳的“HER”正式上线。和苹果的深度合作对OpenAI来讲也是件大事,更站稳了在AI行业的一哥地位。还有一些产品,包括“Projects”项目功能、o1 图像输入和4o高级语音API正式开放、ChatGPT Search 升级和给GPT打电话 的功能。

发布会最后一天公布新产品GPT-o3。一举打破AI发展陷入瓶颈的怀疑,各项性能直奔AGI而去。

从能力上看,o1确实比Preview版本有了比较大的进步。它在国际数学奥林匹克预选赛题目(AIME 2024)、编程能力测试(CodeForces)方面都比o1- preview提升了50%。在处理复杂问题时的重大错误率降低了34%。

它还能根据题目的难易程度调节处理时间,这使得用户等待时间下降超过50%。更重要的是o1也能支持多模态识别了。这让它的实用性暴增。医生可以用它分析医学影像,工程师能让它帮忙看图纸,设计师还能让它提供创意建议。但它的价格也相当贵,只有200美元的ChatGPT Pro版订阅用户才能享受无限使用,其他普通20美元订阅用户仅能享受每日20次使用权限。

第二大亮点Sora,为用户提供了类似专业视频编辑软件的时间轴界面。用户可以在时间轴上添加多个场景卡片。用户可以将多个提示词串联起来,系统会自动处理场景之间的过渡效果。

除此之外,OpenAI还提供了Remix、Blend和Loop三个专业工具。换掉视频中的元素,或者混合两个视频,还能自动补全做无限循环视频。

第三大亮点:Canvas,因为Canvas已经进化成了集智能写作、代码协作和AI智能体为一体的一套完整工作台。它显示出了OpenAI超越Chatbot的产品野心。

作为写作助手,可以提供编辑意见。编程功能上,Canvas则通过内置的WebAssembly Python模拟器,创造了一个几乎无延迟的编程环境。它还展现出了理解代码意图的能力。与近期更新的Cursor和Devin一样,它上线了定制化AI智能体的能力。它可以完成一系列操作,帮你给朋友们发圣诞信。

Canvas的这三个维度并不是孤立运作的。在实际使用中,它们往往会相互配合,这种无缝的集成使Canvas成了一个多功能AI驱动的创作工作室原型。

另外,对于此次o1-mini强化微调,改变了过去微调只是通过增加专业数据的逻辑,而是对具有推理能力的模型进行强化学习方向的微调。引导模型在面对复杂问题时有更深刻的思考能力。现在,仅需“几十个例子”甚至12个例子,就能够让模型有效学会特定领域的推理。根据OpenAI的研究数据,经过强化微调的o1mini模型,其测试通过率比传统的o1模型高出24%,相比未经过强化微调的o1mini则提升了整整82%。

以及高级视频语音模式,在GPT-4o的演示中,OpenAI的工作人员就能和4o视频通话,可以看到我们实时的手机屏幕内容,或者根据相机里的实时画面和我们聊天或解答问题。

以及ChatGPT和Apple Intelligence达成合作都同样给用户带来惊喜。

最大的惊喜还是GPT-o3的诞生,OpenAI用o3向业界证明:Scaling Law未死。o3 是 o1的下一个版本。在9月份o1发布后仅3个月后,这一新版本在编码、数学以及 ARC-AGI 基准测试等多个基准上就大幅超过了 OpenAI 此前的 o1 模型。

OpenAI选择强化推理这个范式转变成功了。人工智能的发展没有任何放缓的迹象。Scaling Law依然有效。虽然o3进行一次低算力计算的成本高达20美元,高算力甚至可能高达3000美元,要使用在现阶段几乎是不可能的。但算力会降低,Scaling Law会延续。3个月,两个顶尖模型,OpenAI在这12天的最后一天又让我们感受到了2022年末到2023年初从ChatGPT到GPT4那段时间AI扑面而来的速度。也许正如之前参与开发了o1的 OpenAI科学家Noam Brown在采访中说的一样,“2024年,OpenAI是在实验,而2025年就是全速前进的一年。”OpenAI 12天的发布会,过程波折,完美收工。

12月27日,OpenAI 正式宣布,OpenAI将转型为公共利益公司(public benefit corporation),将会采用更为传统的公司架构。在新架构下,包括微软在内的股东将直接持有公司股权,而不是仅享有未来利润分配权的股份。根据声明,若重组完成,公益企业(盈利部门)将负责 OpenAI 的运营和业务,而该非营利部门将聘请领导团队和员工,在医疗保健、教育和科学等领域开展慈善性项目。

(二)DeepSeek-V3 正式发布

12月28日,全新系列模型 DeepSeek-V3 首个版本上线并同步开源。根据DeepSeek官方公众号,DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

DeepSeek-V3在以下几个领域有了新突破:

百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。

长文本:长文本测评方面,在DROP、FRAMES 和 LongBench v2 上,DeepSeek-V3 平均表现超越其他模型。

代码:DeepSeek-V3 在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型,并在工程类代码场景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。

数学:在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。

中文能力:DeepSeek-V3与Qwen2.5-72B 在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识 C-SimpleQA 上更为领先。

DeepSeek-V3生成速度提升至3倍,通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从20 TPS 大幅提高至60 TPS,相比 V2.5 模型实现3倍的提升,为用户带来更加迅速流畅的使用体验。

API服务价格调整:随着性能更强、速度更快的 DeepSeek-V3 更新上线,模型 API 服务定价也将调整为每百万输入tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出 tokens 8 元,以期能够持续地为大家提供更好的模型服务。与此同时,全新模型设置长达 45 天的优惠价格体验期:即日起至 2025 年 2 月 8 日,DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入 tokens 0.1 元(缓存命中)/ 1 元(缓存未命中),每百万输出 tokens 2 元,已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。

开源权重和本地部署:DeepSeek-V3 采用 FP8 训练,并开源了原生 FP8 权重。得益于开源社区的支持,SGLang 和 LMDeploy  第一时间支持了 V3 模型的原生 FP8 推理,同时 TensorRT-LLM 和 MindIE 则实现了 BF16 推理。此外,为方便社区适配和拓展应用场景,提供了从 FP8 到 BF16 的转换脚本。


4.本周行情回顾

4.1.行业周涨跌及成交情况

本周市场平稳上涨,计算机位列第29位。 本周沪深300指数上升1.36%,申万计算机行业周跌幅4.25%,低于指数5.61个pct,在申万一级行业中排名第29位。

2024年初至今申万计算机行业涨幅在申万一级31个行业中排名第11名。 年初至今申万计算机行业累计上涨8.79%,在申万一级31个行业中排名第11位,沪深300上涨16.02%,低于指数7.23个百分点。

4.2.个股周涨跌、成交及换手情况

本周计算机板块下降。 319只个股中,39只个股上涨,275只个股下跌,5只个股持平。上涨股票数占比12.23%,下跌股票数占比86.21%。行业涨幅前五的公司分别为: 指南针、财富趋势、雷柏科技、淳中科技、道通科技。跌幅前五的公司分别为:经纬恒润-W、海天瑞声、福昕科技、博睿数据、万兴科技。

从周成交额的角度来看,浪潮信息、中科曙光、紫光股份、同花顺、光环新网位列前五。从周换手率的角度来看,创识科技、汇金科技、依米康、兆日科技、赢时胜位列前五。

4.3.核心推荐标的行情跟踪
本周板块整体呈现普遍上涨的情况下,我们的8只核心推荐标的全部下跌。其中跌幅最小的为中科创达,跌幅为0.53%。跌幅最大的为用友网络,跌幅为8.06%。

4.4.整体估值情况
从估值情况来看,SW计算机行业PE(TTM)从2018年低点37.60倍升至70.27倍,2010-2024年历史均值56.09倍,行业估值高于历史中枢水平。


5.本周重要公告汇总

麒麟信安:关于获得政府补助的公告

湖南麒麟信安科技股份有限公司(以下简称“公司”)于近日收到政府补助款项人民币430.75万元,属于与收益相关的政府补助款项。


金桥信息:关于以集中竞价交易方式首次回购公司股份的公告

2024年12月23日,公司实施了首次回购,根据《上市公司股份回购规则》《上海证券交易所上市公司自律监管指引第7号——回购股份》等相关规定,现将首次回购公司股份情况公告如下:公司通过集中竞价交易方式首次回购股份7.24万股,已回购股份占公司总股本的比例为0.02%,成交的最高价为13.92元/股,最低价为13.67元/股,已支付的总金额为99.89万元。上述回购进展符合既定的回购股份方案。


新北洋:关于新北转债赎回实施暨即将停止转股的重要提示性公告: 新北洋信息技术股份有限公司发布公告,提醒投资者关于新北转债即将停止转股及赎回的相关事宜。新北转债的最后转股日为2024年12月26日,之后未转股的债券将被强制赎回。赎回价格为100.08元/张,包含当期利息税。赎回登记日和赎回日分别为2024年12月26日和27日。公司提醒持有人及时转股以避免可能的损失。本次赎回完成后,新北转债将在深圳证券交易所摘牌。


千方科技:关于股东股份质押延期的公告: 公司实际控制人夏曙东先生将其持有的18,990,000股股份质押给中信证券股份有限公司,占其所持股份的7.92%,占公司总股本的1.20%,质押用途为实际控制的企业生产经营。原质押到期日为2024年10月24日,延期至2025年10月24日。另外,夏曙东先生还质押了3,300,000股,占其所持股份的1.38%,占公司总股本的0.21%,质押到期日同样从2024年10月24日延期至2025年10月24日。

云涌科技:关于获得政府补助的公告: 江苏云涌电子科技股份有限公司于2024年12月26日发布公告,宣布公司近日收到共计人民币101.82万元的政府补助,该补助与收益相关。根据《企业会计准则第16号——政府补助》的规定,这部分补助属于与收益相关的政府补助.


海康威视:关于首次回购公司股份的公告

杭州海康威视数字技术股份有限公司于 2024 年 12 月 9 日、2024 年 12 月 25 日召开公司第六届董事会第四次会议、2024 年第二次临时股东大会,审议通过了《关于回购公司股份方案的议案》,同意公司通过深圳证券交易所交易系统以集中竞价交易方式回购公司部分已在境内发行的人民币普通股(A 股)股票。回购资金总额不超过人民币 25 亿元(含),不低于人民币 20 亿元(含),回购价格不超过人民币 40 元/股(含),回购所需资金来源于公司自有资金及股票回购专项贷款,回购期限为自公司股东大会审议通过回购股份方案之日起不超过十二个月。本次回购的股份将用于依法注销减少注册资本。


恒锋信息:关于向不特定对象发行可转换公司债券募集资金投资项目延期的公告

恒锋信息科技股份有限公司于 2024 年 12 月 26 日召开第四届董事会第八次会议和第四届监事会第六次会议,审议通过了《关于向不特定对象发行可转换公司债券募集资金投资项目延期的议案》,在募集资金投资项目实施主体、实施地点、募集资金投资用途及投资规模不发生变更的情况下,根据募集资金投资项目当前实际建设进度,将募集资金投资项目“市域社会治理平台建设项目”达到预定可使用状态时间调整为 2025 年 12 月 31 日。本次募投项目延期事项在董事会审批权限范围内,无需提交股东大会审议。


正元智慧:关于归还部分暂时补充流动资金的闲置募集资金的公告

正元智慧集团股份有限公司于 2024 年 7 月 9 日召开第四届董事会第三十五次会议、第四届监事会第二十一次会议,审议通过了《关于使用部分闲置募集资金暂时补充流动资金的议案》,同意公司使用部分闲置募集资金不超过人民币 18,000 万元(含)暂时补充流动资金,其中人民币 3,000万元(含)使用期限自公司董事会审议通过之日起至 2024 年 12 月 31 日前,人民币 15,000 万元(含)使用期限自公司董事会审议通过之日起不超过 12 个月,上述资金将于到期前归还至募集资金专用账户。


容知日新:关于控股股东、实际控制人、董事长兼总经理增持公司股份进展暨增持金额过半的公告

安徽容知日新科技股份有限公司(以下简称“公司”)控股股东、实际控制人之一、董事长兼总经理聂卫华先生基于对公司未来发展的信心和对公司长期投资价值的认可,计划自 2024 年 9 月 5 日起 6 个月内,以其自有资金或自筹资金通过上海证券交易所交易系统允许的方式(包括但不限于集中竞价和大宗交易等)增持公司股份,合计增持金额为不低于人民币 950 万元且不超过人民币 1,050 万元。


志晟信息:董事、高级管理人员辞职公告

公司董事会于2024年12月27日收到董事、高级管理人员林琦先生递交的辞职报告,自2024年12月27日起辞职生效。上述辞职人员持有公司股份0股,占公司股本的0%。不是失信联合惩戒对象,辞职后不再担任公司其它职务。本公司董事会于2024年12月27日收到董事李萌先生递交的辞职报告,自2024年12月27日起辞职生效。上述辞职人员持有公司股份0股,占公司股本的0%。不是失信联合惩戒对象,辞职后继续担任财务总监职务。



6.本周重要新闻汇总

重新定义金融服务体验 奇富科技发布AI伴侣 “小奇”

奇富科技最新研发的AI伴侣“小奇”近日正式发布。奇富科技产品副总裁卢瑶阐述了小奇研发的三大动因:面对用户全生命周期中多样化的需求,传统服务方式显得力不从心;经营层面,短信、电话等传统触达方式受限于效率和成本;而奇富科技在内部效率提升及经营应用上,已经积累了丰富的AI技术储备,为小奇的诞生奠定了坚实的技术基础。

(来源:TechWeb)


大模型创企阶跃星辰完成数亿美元B轮融资 腾讯投资、启明创投等有投资

国产大模型创业“六小强”之一的阶跃星辰近日完成数亿美元B轮融资。此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。

(来源:TechWeb)


百川智能发布全链路领域增强金融大模型Baichuan4-Finance,整体准确率领先GPT-4o近20%

百川智能发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。

(来源:TechWeb)


英伟达据悉已初步敲定GB300订单配置

英伟达预计明年3月GTC大会揭露下世代GB300 AI服务器产品线,鸿海等供应商近期已进入GB300研发设计阶段。据了解,英伟达已初步拍定GB300订单配置,鸿海仍是最大供应商,预计明年上半年推出实机面市。业界人士透露,广达、英业达也是英伟达GB300重要伙伴,订单份额上,广达仅次于鸿海,为第二大供应商。

(来源:36氪)


打造下一个NVIDIA!软银孙正义芯片计划曝光

软银集团创始人孙正义近几个月正专注于一件事,那就是如何利用自家芯片打造下一个NVIDIA,在AI市场分一杯羹。孙正义的目标是到2026年推出首批可发货的AI芯片,并计划最早在明年夏季开发出原型产品。

(来源:TechWeb)


SUSE发布2025年技术趋势预测:私有AI平台的采用将会增加

企业级开源解决方案提供商SUSE的亚太区CTO Vishal Ghariwala发表《2025年技术趋势预测》署名文章,他指出,科技的快速发展正在重塑亚太地区各行各业。到2025年,企业将面临新兴威胁和机遇并存的复杂环境。要在这个充满变化的环境中保持领先,企业必须把数字韧性、安全和创新放在首位。

(来源:TechWeb)


8.8 万元起,众擎全开放通用具身智能体 PM01 人形机器人发布

深圳市众擎机器人科技有限公司今日发布了新一代全开放通用具身智能体 PM01,定价 8.8 万元起。众擎为客户准备了商业版与教育版 PM01 两种方案以供抉择,自当下直至 2025 年 3 月 31 日,商业版与教育版均以 8.8 万元的统一价格面向市场发售。

(来源:IT之家)


鸿海宣布进军 AR 眼镜市场,明年四季度量产 Micro LED 晶圆

鸿海今日宣布,将携手 Porotech 进军 AR 眼镜市场。依双方合作内容,鸿海将加速在 AR 与 Micro LED 的战略布局,并计划在台中建立 Micro LED 晶圆制程产线,预计 2025 年第四季度投入量产。

(来源:IT之家)


台积电股价触及历史高点,有望创下 25 年来最佳年度表现

全球最大的芯片代工制造商台积电股价触及历史新高,有望创下 25 年来最佳年度股票表现。周二,台积电股价在台北股市一度上涨 1.4%,短暂突破 11 月 8 日的高点(1095 台币),台积电股价今年以来已累计上涨 84%。

(来源:IT之家)


微软寻求自主AI能力,减少对OpenAI依赖以提高365 Copilot效率

微软正在积极研发和引入新的内部和第三方人工智能模型,目的是为了减少对其合作伙伴OpenAI技术的依赖,并进一步降低运营成本。这一策略是微软减少对OpenAI依赖计划的一部分,此前微软曾高度依赖OpenAI的模型,尤其是在推出Microsoft 365 Copilot时。

(来源:TechWeb)


英国 CMA 完成对 Synopsys 拟收购 Ansys 案第一阶段调查,提出三点关切

英国竞争与市场管理局 CMA 当地时间 20 日结束了对 EDA 与半导体 IP 龙头企业 Synopsys 新思科技拟以 350 亿美元收购工业仿真软件企业 Ansys 一案的第一阶段调查。

(来源:IT之家)


Pimax Dream Air VR 头显发布:可自动调节头戴绑带、眼追 + 单眼 4K HDR OLED,1900 美元

制造商 Pimax 推出了一款名为 Dream Air 的 VR 头显,最大的特性是支持眼追、HDR,还能自动调节头戴绑带,定价为 1900 美元,将于 2025 年第一季度发售。

(来源:IT之家)


周鸿祎谈 o3 大模型与 AGI 定义的调整及未来发展

Open AI 发布 o3 及其精简版 o3-mini,360 创始人周鸿祎对其解读。他认为 o3 虽在特定领域超越人类能力,但离全面超越人类的 AGI 定义尚有差距,AGI 定义或需调整为在专业领域超越人类的智能体;大模型应结合行业知识打造专业模型,且 o3 不能直接应用于各领域,大模型不是泡沫,未来需与行业紧密结合,算力需求将转向推理,行业巨头为获取能源支持采取相关举措。

(来源:TechWeb)



比亚迪猛攻智能化,推动智驾平权变革

比亚迪在新能源汽车淘汰赛中,尽管销售规模领先,但面临压力也积极求变。今年初发布整车智能战略并投入千亿资金,其智能化战略包括重视智能驾驶,进行部门调整与人才挖掘;虽早期对智驾投入谨慎,但如今加速智能化,有资金和技术基础,等来好时机;采用 “自研 + 供应商” 双向布局,侧重先靠供应商补缺口再推自研团队,通过广撒网、降成本、由下至上推动变革,以提升竞争力,推动智驾普及和成本降低,还入股卓驭科技,计划普及基础智驾功能至 10 万级别车型,其入局有望完善国内智驾生态。

(来源:TechWeb)


矩阵腾讯携手,推动居住产业数字化升级

当下居住产业数字化转型加速,矩阵股份与腾讯云合作,借助设计 AIGC 联合实验室,聚焦 AIGC、云计算等技术,探索其在居住产业应用,提升服务客户能力与用户体验。实验室将推动 AI 全链条应用,制定生态标准助力成果落地,还会帮助企业数智化转型,扩大生态伙伴圈提升行业效能。暗壳科技也凭母公司积累,在设计领域应用 AI 成果显著,为产业数字化增添动力。

(来源:Wind)


五部门出台企业数据资源利用意见

《意见》从健全企业数据权益实现机制、培育企业数字化竞争力、赋能产业转型升级、服务经济社会高质量发展、营造开放透明可预期的发展环境等五个方面作出具体部署。国家数据局将会同相关部门,加强统筹协调和政策保障,协同各行业主管部门结合本领域实际,高质量推进企业数据资源开发利用。

(来源:证券时报e公司)


OpenAI 或开发人形机器人,战略转变引关注

解散机器人团队近 4 年的 OpenAI,上月初已再次组建机器人团队,由 Caitlin Kalinowski 领导。重新组建团队一个多月后,有消息称 OpenAI 在考虑开发人形机器人,这意味着战略重大转变,即结合先进大模型与硬件产品,但具体细节及是否研发、何时推出未知。此前 OpenAI 已涉足该领域,今年投资了 Figure 和 Physical Intelligence,Figure 的人形机器人已整合其大模型,而特斯拉是目前人形机器人领域知名厂商,其 Optimus 人形机器人备受关注且已推出第二代,预计明年小批量生产。

(来源:TechWeb)


谷歌被曝用 Claude 改进 Gemini AI 引合规争议

据 TechCrunch 内部通信显示,参与改进谷歌 Gemini AI 模型的承包商,将其答案与 Anthropic 的 Claude 模型输出进行比较,引发谷歌是否获授权使用 Claude 进行测试的合规质疑。模型性能评估通常用行业基准测试,而此次 Gemini 承包商需按多个标准对每个回复评分,最多 30 分钟判断哪个答案更好。内部聊天记录表明 Claude 回复更强调安全性,如不回应不安全提示词,而 Gemini 曾因包含 “裸体和束缚” 被标记为严重安全违规。Anthropic 商业服务条款禁止客户未经批准用 Claude 构建竞争产品或训练竞争模型,谷歌是 Anthropic 主要投资者。谷歌 DeepMind 发言人 McNamara 称会比较模型输出评估,但未在 Claude 模型上训练 Gemini。

(来源:TechWeb)


Memecoin.Fun 与 ai16z 合作,开创 IAAO 新模式

Memecoin.Fun 将与 ai16z 合作,集成 Eliza 框架实现 TEE 可信环境下 AI agent 的 meme 代币分发,其融合 AI agent 与 Solana 智能合约,首创 IAAO 模式,通过定制化 AI agent Kimi 判断用户情况授予代币额度,该模式将为 web3 行业带来新解决方案与范式用例。

(来源:Wind)


小米正搭建GPU万卡集群 加大AI大模型投入

小米正在积极搭建自己的GPU万卡集群,并对AI大模型进行大规模投资。报道援引知情人士消息称,该计划已经施行数月之久,雷军在其中扮演了重要的领导角色。小米对AI大模型的重视早有迹象。早在2023年4月,小米AI实验室大模型团队正式成立。栾剑担任负责人,向AI实验室主任王斌汇报。栾剑曾在东芝(中国)研究院、微软(中国)工程院等机构担任要职,拥有丰富的AI领域经验。同年8月,小米大语言模型MiLM首度现身C-Eval、CMMLU 大模型评测榜单,当时这款模型在C-Eval 总榜单排名第 10、同参数量级排名第1。

(来源:Techweb)


腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”

腾讯研究院最新推出了 DRT-o1 系列模型,主要通过长思维链(long chain-of-thought,简称 CoT),更能理解比喻和隐喻等,从而提高文学作品的翻译质量。研究人员从古腾堡(Project Gutenberg)计划中选取 400 本公共领域英文书籍,提取 577600 个句子,并筛选出 63000 个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。DRT-o1 采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供修改建议,评估员则根据预设指标对翻译质量进行评分,通过反复迭代,不断提升翻译质量。

(来源:IT之家)


抖音推出送礼物红包,大厂再次上演红包大战

12月中旬,微信小店开启“送礼物”功能的灰度测试。根据官方公告,目前除珠宝、教育培训这两大类目的商品外,其他类目的微信小店,只要原价不超过1万元的商品,都将默认支持“送礼物”功能。由于送礼物的“包装”会以类似蓝色红包封面的形式,发送到对方聊天界面,故被不少网友成为“蓝包”,并引起热议。在当今数字化商业浪潮中,社交元素与电商领域正在紧密结合。微信、抖音等平台纷纷敏锐捕捉到这一趋势,迅速布局礼物赠送的新赛道,并创新性地采用了红包这一广受欢迎的形式来承载和推动这一业务。这不禁让人回想起当年,微信与支付宝之间那场激烈交锋的红包大战。

(来源:Techweb)


Anthropic联合创始人:AI尚未发展至极限,2025年将继续高速狂飙

Anthropic 联合创始人杰克・克拉克(Jack Clark)表示,得益于传统模型的规模化扩展和新模型、新方法的百花争鸣,2025 年 AI 领域继续在高速路上狂飙。克拉克在其 Import AI 博客中,反驳了 AI 发展已达到极限的说法,他表示,o3 模型并非简单地增大模型规模,而是利用强化学习和额外的计算能力,为规模扩展开辟了全新的可能性。克拉克预估各大公司通过结合扩展基础模型,并在训练和推理过程中整合新的方法,在 2025 年进一步推动 AI 领域的快速发展。

(来源:Techweb)



日本政府拟向芯片制造商Rapidus出资1000亿日元

日本政府计划在2025年下半年,向Rapidus公司出资1000亿日元(约合人民币46亿元)。现有股东和新股东的资本参与预计合计达到1000亿日元左右,日本政府将进行同等规模的出资。Rapidus计划用作追加购买2027年开始量产所需的极紫外线(EUV)光刻装置等的资金。

(来源:36氪)


宁德时代拟赴港上市:发行股数不超过总股本的5%

宁德时代第四届董事会第一次会议审议通过《关于公司发行H 股股票并在香港联合交易所有限公司上市方案的议案》。同时,会议还审议通过聘请致同(香港)会计师事务所有限公司为审计机构。此外公告称,该议案尚需提交股东大会以特别决议方式逐项审议。

(来源:TechWeb)


工信部:2025年力争累计建成5G基站450万座以上

工信部完善“双千兆”网络发展政策措施,试点部署万兆光网,有序推进算力中心建设布局优化,推动5G 演进和 6G 技术创新发展。强化互联网基础资源管理,提升无线电频谱技术创新能力和频谱资源开发利用水平。加强细分行业领域数据安全管理,提升极端场景应急通信保障能力。

(来源:TechWeb)


美团无人机出海开门大吉!获迪拜商业运营首张证书

美团无人机此次获批的迪拜商业运营资质证书,是由迪拜民航局针对无人机物流运营人从人、机、管、环全方位全流程的运行能力和经营水平考核,代表了监管方对运营人运行安全水平和服务水平的认可。该审定结果意味着美团无人机在当地成为了一家载物领域通用航空公司,也成为了中国首家具备国际化运营资质的无人机物流运营公司。(来源:TechWeb)


国家发改委低空经济发展司亮相

该司主要负责拟订并组织实施低空经济发展战略、中长期发展规划,提出有关政策建议,协调有关重大问题等事项。

(来源:同花顺)


iPhoneSE4领衔!苹果2025上半年新品爆发:5款大作已在路上

涉及PC、平板、手机、智能家居和智能穿戴等品类。其中iPhone SE 4是苹果最重要的新品之一,该机可以看作是单摄版的iPhone 14。性能方面,iPhone SE 4将配备A18芯片,并拥有8GB内存,支持Apple Intelligence,这将成为新机的核心竞争力。

(来源:TechWeb)



博通“狙击”英伟达

博通总裁兼首席执行官陈福阳声称自家已坐拥三家超大规模客户,他们已经制定了自己的多代AI XPU路线图,并计划在未来三年内部署这些 AI XPU。“到 2027 年,我们相信他们每家公司都计划在一个单一的网络结构上部署 100 万个 XPU 集群。

(来源:TechWeb)


7.历史报告回顾

一、 云计算(SaaS)类:
1、云计算龙头深度:《用友网络:中国企业级SaaS脊梁》
2、云计算龙头深度:《深信服:IT新龙头的三阶成长之路》
3、云计算龙头深度:《深信服:从超融合到私有云》
4、云计算行业深度:《飞云之上,纵观SaaS产业主脉络:产业-财务-估值》
5、云计算行业深度:《海外篇:海外SaaS启示录》
6、云计算行业深度:《港股篇:挖掘最具成长性的港股SaaS标的》
7、云计算动态跟踪之一:《华为关闭私有云和Gauss DB意欲何为?》
8、云计算动态跟踪之二:《阿里云引领IaaS繁荣,SaaS龙头花落谁家?》
9、云计算动态跟踪之三:《超越Oracle,Salesforce宣告SaaS模式的胜利!》
10、云计算动态跟踪之四:《非零基式增长,Salesforce奠定全球SaaS标杆地位》

二、 金融科技类:
1、证券IT 2B龙头深度:《恒生电子:强者恒强,金融IT龙头步入创新纪元》
2、证券IT 2C龙头深度:《同花顺:进击-成长的流量BETA》
3、银行IT 龙头深度:《宇信科技:拐点+弹性,数字货币新星闪耀》
4、银行IT 行业深度:《分布式,新周期》
5、万亿蚂蚁与产业链深度研究之一:《蚂蚁集团:成长-边界-生态》
6、金融科技动态跟踪之一:《创业板改革细则落地,全面催化金融IT需求》
7、金融科技动态跟踪之二:《蚂蚁金服上市开启Fintech新时代》
8、金融科技动态跟踪之三:《开放三方平台,金融科技创新有望迎来第二春》

三、 数字货币类:
1、数字货币行业深度_总篇:《基于纸币替代的空间与框架》
2、数字货币行业深度_生态篇:《大变革,数字货币生态蓝图》
3、数字货币动态跟踪之一:《官方首次明确内测试点,数字货币稳步推进》
4、数字货币动态跟踪之二:《合作滴滴拉开C端场景大幕》
5、数字货币动态跟踪之三:《BTC大涨带来短期扰动,DCEP仍在稳步推进》
6、数字货币动态跟踪之四:《启动大规模测试,《深圳行动方案》加速场景探索》
7、数字货币动态跟踪之五:《建行数字货币钱包短暂上线,测试规模再扩大》
8、数字货币动态跟踪之六:《深圳先行,数字货币红包试点验证G端场景》

四、 工业软件类:
1、工业软件龙头深度:《能科股份:智能制造隐形冠军,行业know-how铸就长期壁垒》
2、工业软件龙头深度:《中望软件:进军中国工业软件的“无人区”》
3、工业软件行业深度:《总篇:工业软件,中国制造崛起的关键》
4、工业软件动态跟踪之一:《三年行动计划出台,工业互联网大风再起》
5、工业软件动态跟踪之二:《工业软件为“基”,实现数字化转型》

五、 其他类别:
1、办公软件龙头深度:《福昕软件:PDF的中国名片,力争全球领先》
2、协作办公领军企业:《致远互联:价值未被挖掘的企业SaaS入口》
3、产业信息化龙头深度:《朗新科技:做宽B端做大C端,稀缺的产业互联网平台企业》
4、物联网领先企业:《达实智能:2021E 18xPE的物联网方案建设服务商,订单高景气》
5、信创行业深度:《总篇:信创,重塑中国IT产业基础的中坚力量》


8.风险提示
市场系统性风险、科技创新政策落地不及预期、中美博弈突发事件。

相关声明



►   分析师承诺
作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。

►   评级说明

►   华西证券免责声明
华西证券股份有限公司(以下简称“本公司”)具备证券投资咨询业务资格。本报告仅供本公司签约客户使用。本公司不会因接收人收到或者经由其他渠道转发收到本报告而直接视其为本公司客户。
本报告基于本公司研究所及其研究人员认为的已经公开的资料或者研究人员的实地调研资料,但本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载资料、意见以及推测仅于本报告发布当日的判断,且这种判断受到研究方法、研究依据等多方面的制约。在不同时期,本公司可发出与本报告所载资料、意见及预测不一致的报告。本公司不保证本报告所含信息始终保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者需自行关注相应更新或修改。
在任何情况下,本报告仅提供给签约客户参考使用,任何信息或所表述的意见绝不构成对任何人的投资建议。市场有风险,投资需谨慎。投资者不应将本报告视为做出投资决策的惟一参考因素,亦不应认为本报告可以取代自己的判断。在任何情况下,本报告均未考虑到个别客户的特殊投资目标、财务状况或需求,不能作为客户进行客户买卖、认购证券或者其他金融工具的保证或邀请。在任何情况下,本公司、本公司员工或者其他关联方均不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告而导致的任何可能损失负有任何责任。投资者因使用本公司研究报告做出的任何投资决策均是独立行为,与本公司、本公司员工及其他关联方无关。
本公司建立起信息隔离墙制度、跨墙制度来规范管理跨部门、跨关联机构之间的信息流动。务请投资者注意,在法律许可的前提下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的前提下,本公司的董事、高级职员或员工可能担任本报告所提到的公司的董事。本公司及其所属关联机构或个人可能在本报告公开发布之前已经使用或了解其中的信息。
所有报告版权均归本公司所有。未经本公司事先书面授权,任何机构或个人不得以任何形式复制、转发或公开传播本报告的全部或部分内容,如需引用、刊发或转载本报告,需注明出处为华西证券研究所,且不得对本报告进行任何有悖原意的引用、删节和修改。



团队成员





注: 文中报告节选自华西证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。
分析师:刘泽晶
分析师执业编号:S1120520020002
分析师:赵宇阳
分析师执业编号:S1120523070006
证券研究报告:【华西计算机】周观点:AI应用加速落地,推理算力井喷在即》
报告发布日期:2024年12月29日


重要提示:
《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过本订阅号发布的观点和信息仅面向华西证券的专业投资机构客户。若您并非华西证券客户中的专业投资机构客户,为控制风险,请取消订阅、接收或使用本订阅号中的任何信息。因本订阅号受限于访问权限设置,若给您造成不便,敬请谅解。市场有风险,投资需谨慎。


法律声明:
本订阅号为华西证券计算机团队设立及运营。本订阅号不是华西证券研究报告的发布平台。本订阅号所载的信息仅面向华西证券的专业投资机构客户,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自华西证券研究所已经发布的研究报告或者是对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。
在任何情况下,本订阅号所推送信息或所表述的意见并不构成对任何人的投资建议。华西证券及华西证券研究所也不对任何人因为使用本订阅号信息所引致的任何损失负任何责任。
本订阅号及其推送内容的版权归华西证券所有,华西证券对本订阅号及推送内容保留一切法律权利。未经华西证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。










请到「今天看啥」查看全文


推荐文章
金融先生MrFinance  ·  一名非典型985毕业生的大学简史
8 年前
金融先生MrFinance  ·  一名非典型985毕业生的大学简史
8 年前
硕士博士读书会  ·  一只猪的故事(深度好文)
8 年前