站在更大的视角看,如今的AI已走到一个节点——从技术爆发向产品突破前进。
7月8日,世界人工智能大会(WAIC)在上海的炎热中落下了帷幕,AI的热潮并没有消退,自2018年首届以来,WAIC始终保持着国际顶尖盛会的高端水准,这次也不例外。
WAIC 2023召开恰逢全球大模型和生成式人工智能(AIGC)蓬勃兴起之时,更加注重技术,参会大佬更多成为今年的主要特点。
开幕式上,特斯拉CEO埃隆·马斯克(Elon Musk)作为神秘嘉宾出现在WAIC的连线大屏幕上,一时间成为焦点,上一次还是在2019年的和马云对谈,在互联网上,将其称为“双马对话”,这一次他提到未来世界机器人的数量将超过人类。他表示,随着算力爆炸式增长,“机器计算”与“生物计算”的比例这一关键指标正在不断提高,这意味着随着时间推移,相对于机器,人类智力在地球上的总思维能力中所占的比例将越来越小。
除了马斯克,参会的重量级嘉宾还有香港中文大学教授汤晓鸥、华为轮值董事长胡厚崑,微软全球资深副总裁侯阳、地平线创始人及CEO余凯、图灵奖得主杨立昆(Yann LeCun)、美国国家工程院外籍院士沈向洋与IEEE CEO拉曼等。据悉,本次WAIC参展企业超400家,首发产品达30余款,大会聚集了国内外领军学者、知名企业家、国际组织代表等1400余位嘉宾,国内外院士80余位。
本次大会围绕大模型,设置有模型、算力、数据、应用、安全与伦理等几个论坛,除此之外,机器人也成为本次大会焦点。
作为大模型爆发之后的首届,“百模大战”之后的路应该如何走,是当下人工智能界需要深度思考的问题,目前我们应该技术冲锋还是迅速商业化落地,我们是应该自造大模型还是用别人的轮子尽快做出产品,企业应该聚拢资金还还是面向用户,400家企业在这里给出答案,竞逐未来。
AI世界里到底在发生着什么?站在更大的视角看,如今的AI已走到一个节点——从技术爆发向产品突破前进。
1.大模型热潮:30多款大模型汇聚上海
回顾前两届WAIC,因为行业下行、投融资缺乏,AI的发展有着太多不确定,ChatGPT的成功一举扫去了此前的阴云,它不仅证明了大模型的可行性,更给资本、行业做出一个很好的范例,它的商业化潜力也引发了关注,AI这一研发领域迅速集结了大量的企业和资源。
在过去短短的半年内,已经有超过80家中国企业发布了大模型。2月2日,复旦自然语言处理实验室发布国内首款大模型;3月14日,团队主要来自清华系的智谱AI发布chatGLM-130B;3月16日,百度发布文心一言;4月1日,商汤发布日日新大模型;4月11日,阿里发布通义千问等,这个名单可以列得很长,并且还在增长。
如果要给WAIC2023给一个关键词,那就是大模型——30多家厂商,急匆匆地来WAIC参加这场大模型的赶考——这就是本次WAIC最真实的写照。
在大会展馆,首次设置了“迈向通用人工智能”主题展区,集中展示国内外总计30多款大模型和10多款智能芯片,展馆内,400多家企业争相竞逐,展现着自己的科技最前沿,“走到哪都大模型”一位观众如此感叹。
展馆内,商汤发布了日日新的千亿参数语言大模型SenseChat2.0,并在现场搭建了一套动作捕捉和3D建模的无人赛事系统,当你在球场完成一组动作,系统就会自动完成运镜拍摄和特点分析;华为展区展出的是盘古大模型和昇腾AI生态,底层芯片、数据中心到上层架构、开发平台,华为都自成一体,他们想做大模型时代的“卖水人”;腾讯展出的则是各行业大模型解决方案,虽然通用大模型“混元”还未发布,已经有厂商不停地前去问价。
与大厂不同的是,也有一些初创AI公司专注于技术,在世博中心的一间小会议室内挤满了开发者,智谱AI的清华团队正在分享他们的ChatGLM最新研究成果;清华系的另一家公司循环智能公布了他们的月之暗面大模型在商业化方面的创新;在另一间会议室,启明创投正在梳理最近两年多里新成立的100多家生成式AI新公司,其中30%做语言类应用,最多的是做多模态应用的公司。据界面新闻消息,2020年GPT-3发布的两年内,创投机构对Al企业的投资增长了4倍,仅2022年就有13.7亿美元的融资。
以上只是本次大会的一部分,在本次大会上,围绕大模型共设置大模型、数据、算力、AI生态、AI算力等五大论坛,不可否认,如今的大模型产业,已经浪潮汹涌。
时间回到半年前,那时正是大模型的爆发之时,ChatGPT在广阔的互联网上正在成为一个划时代的产品,而在学术界,大家对于大模型已经看到GPT3的巨大影响力,成为共识。在行业内很多人将这次AI大爆炸比作继PC、移动互联网浪潮的第三次创业潮。与前两次不同的是,这次创业潮中技术和资金的门槛更高。
大模型的成功带给资本、行业、甚至大众的AGI信心也在迅速扩散,最近在公众领域讨论最多的就是如何做大模型,第一道坎儿就是做通用大模型还是做垂直行业大模型,是先做好一个技术底座还是先算好ROI。
虽然在全球已经发布的大模型中,国内占有的已经超过一半,对于如何去做好一个大模型,大部分企业还不是很明确,或者说“边做边想”。
正当众人疑惑大模型应该选择哪种路径之时,大厂已经依据自身资源和渠道,完成了基础模型的部署,并结合自身业务,开始建立AI生态。
一位业内人士告诉机器之心,“其实并不存在通用和行业大模型之间的对抗,每家都在做自己的事情,它是由技术信仰、公司愿景以及钱决定的。”
模型、算力、数据是一个大模型的必要因素,它们的重要性犹如工业革命的水电煤,这些构成大模型创业的基础因素里,还埋藏着大模型创业的几个问题。
2.三个问题:落地难、算力缺、成本高
大模型能做什么?这个问题早在大模型浪潮来临之前,就摆在中国AI公司的创业者面前。在本次WAIC上,这个问题依旧显著,从更加长远的整个大模型科技发展路径来看,大模型的商业化才刚刚开始。
落地难,这是目前大部分厂商都在面临的最主要问题之一。
目前,大部分厂商都已经在B端寻求一些不同程度的商业落地,在很多企业都已经结合自身业务,开展了一系列应用,在展馆内已经形成了比如大模型+教育、大模型+金融、大模型+智造、大模型+交通、大模型+健康等几大主题体验,不同的企业依据自身业务侧重点也会有所不同。商业化已经是参展大模型厂商重点之一,甚至有一些厂商,在考虑做大模型之初就会优先考虑商业落地,比如腾讯截止目前“混元”大模型虽然至今还没有正式发布,而腾讯已经展出的大模型相关解决方案已经超过50个。
与此同时,商业化中依旧存在一个重要问题,机器之心通过走访发现,目前大模型的商业化落地虽然繁多,但是从大部分案例来看,具体应用还是停留在Copilot基础上,主要帮助一些B端企业完成一些工作辅助、APP对话式操作等,真正差异化的产品并没有出现。从大模型的能力来看,其语义分析、多模态对话、人机交互等能力并没有真正发挥出来,大模型能力和产品之间存在“一些偏差”,正如一名AI产品经理所说,“我们需要一些产品创新。”
展馆内,还有一群人关注的问题更为具体,那就是投资人和下游厂商,一位投资人表示,“能否应用落地,实现商业化”成为了检验大模型成功与否的标准。下游厂商则更为直接,会更加关注“卖多少钱,什么时候用。”但是对于大部分厂商而言,还处于早期试验的阶段,一个大模型服务供应商表示,他们会比较“务实”,更加看重大模型应用的实际效益。
对于大模型公司而言,效益的第一个门槛就是:算力。
硅谷风险资本 a16z曾做过一项调查,大模型创业公司需要把 80%-90% 的早期融资款用来购买算力,他们将其称为一笔 “AI 税”。而在中国,难点在于算力总量的缺乏。
根据清华大学电子工程系主任汪玉在WAIC论坛上的总结,目前国内模型算力缺口依旧非常大,如果中国14亿人每个都用大模型去跑,总共需要的算力跟目前所拥有的差了三个数量级,他表示,需要让单位能量提供更高算力。
目前,国内大模型创业公司算力主要还是依靠国内几家云计算厂商,包括华为、阿里、字节、腾讯等,当一家AI公司决定要做大模型之后,就要“和这些厂商全部谈一遍”。
另一个原因在于,企业私有部署大模型成本还是太高,对于阿里、腾讯这样的大厂来讲,依旧会感觉到吃力。比如阿里正在通过开源模型、做生态来补足“贵”的问题,阿里发起的大模型开源社区“魔搭”,就想做成一个大模型超市,陈列出更偏行业化的专属模型,目前已经聚集了900多个AI模型。对于一些下游生态厂商来说,“他们不一定十分信任大模型这件事,还要考虑到退出问题,他们可能会担心大模型会不会是下一个元宇宙。”一位行业人员表示。
目前,国内AI发展正在一边做模型,一边造生态,一边补缺口的状态之下。大模型公司逐渐被分为两类,一类是以大模型为主的,比如百川智能的baichuan-7B、智谱AI的chatGLM、循环智能的月之暗面等等,另一类是以应用为主的,大部分大厂都依据自身业务优势和渠道,建立了自己的大模型应用和生态。
不止一位业内人士向机器之心预测,在今年年底,将会有几家在大模型能力上可以和GPT3.5持平的大模型公司以及相关产品出现。
3.另一个技术狂想:具身智能的爆发点
如果说AI技术有尽头,那一定就是具身智能。
过去数年里,机器人产业曾被无数挂着AI旗号的公司“赋能”过,但传统AI并没有那么智能,训练成本高,泛化能力弱,除了在机器人视觉(Robot Vision)领域(严格意义上应该是CV领域而非机器人领域)有较多应用之外,在机器人这样动作连续且复杂、有较多物理交互和操作因果性的领域落地情况并不乐观。
机器人行业中一直存在一个经典悖论——物理世界中最难解决的“容易”问题。如蹲下、起身、跳跃、转圈等等,对机器人来说,这些简单的动作都需要极为复杂的机械控制系统来实现。而现实生活中常见的简单任务,如做饭、冲咖啡、搬货,把流程分解成每一个动作,并且要做到“不走形”。这一类“容易”问题层层累加,难度是指数级递增的。
大模型在自然语言连续对话、通识理解、少样本/零样本学习等能力方向的突破,使得机器人在软件层面终于看到了变革的曙光。
根据界面援引业内人士观点,与基于软件平台的“对话机器人”的逻辑推理、或者更高层次的“生成式涌现”不同,目前活跃在一线的商业机器人、工业机器人整体走的还是自动化控制路线,需要解决的更多是机械控制问题。要解决这些问题,算法是有边界的,大多数研发与工程瓶颈被卡在传感器、控制器这一类硬件单元上,软硬件的智能融合处于非常早期探索阶段。
大模型的出现,补全了让机器人产业从1%到10%跃升的技术基础,这也是业内看中机器人+大模型的主要原因。
开幕式上,特斯拉作为神秘嘉宾带来“机器人与人类的比例未来可能超过 1:1”的观点之后,特斯拉机器人“擎天柱”(Optimus)此次也首登国内,亮相在世博展览馆的公共展区,现场吸引了大量的围观与打卡合影。这款5英寸8英尺(173cm)、体重 73kg的特斯拉人形机器人未来会在3-5年内量产,目标是百万台,单台价格也会降至2万美元。
在展会上,特斯拉展台的的Optimus 人形机器人是本次会上的“爆款”,机器人全身拥有28个自由度,就如同人体的关节,可以执行各种任务,实现搬运物品、交互、对话等功能。国内机器人制造商达闼机器人发布业内首个多模态大模型RobotGPT,包含RobotGPT 1.0服务平台和RobotGPT 1.0一体机产品,同时人形机器人小姜在展馆亮相,对于对话、图片、语音、动作等多模态信息具有感知、决策、生成能力。
在其他方面,美团无人机第四代新机型首次公布和亮相,这是一款小型多旋翼无人机,最大载重2.5kg,日后它将帮助美团完成无人机送餐,它的飞行高度不超过120米,速度最快达20m/s。上海理工大学展出的小贝机器人4.0,其直立行走能耗不到一百瓦,成本优势突出,而擎朗智能则展示了迎领机器人、消毒机器人、餐饮配送机器人、送餐机器人等多款产品。坐标浦东的傅利叶智能是国内较早从事机器人产品研发与生产的科技创新企业,这次展示了下肢康复机器人产品——穿上“铠甲”,患者可以在机器人的“搀扶”下缓步前行。
在本次WAIC现场,机器人成为大模型之外最大的亮点,展馆展出的三天时间内,所有的机器人展台都是人满为患,据统计,本次世界人工智能大会上,共有超过20款机器人亮相。在场馆之外,字节跳动入局机器人行业,目前团队计划扩充到百人;今年4月,小米成立机器人技术公司;大会进行同期,达闼机器人宣布完成10亿元C轮融资。而在二级市场,具身智能最近一段时间表现活跃,受到市场追捧。
受大模型带动,具身智能成为AI下一阶段的热点,或许可以说,行业等待的奇点正在到来。