2023年是大模型元年,也是生成式AI蓄力爆发之年,距离2022年底ChatGPT横空出世仅一年多,AI大模型已迅速赋能至千行百业。
为了加速大模型产业落地,继2023年11月启动AGI产业先锋营后,
首钢基金参加CANPLUS
联合前瞻产业研究院及华为云初创生态,发起《2024年中国AI大模型场景探索及产业应用调研报告》,并推出“AI大模型前沿访谈系列”,邀请科大讯飞、第四范式、商汤、智谱AI、百川智能等多家头部大模型公司参与,以期呈现当下国内大模型研发及应用的多样图景。
本期访谈的对象是
百川智能商业化部政企业务负责人贾亦赫
。贾亦赫提出了对政府在大模型产业落地方面的具体建议,他认为政府可以发挥主导性,发布应用场景,会更容易撬动产业第一块砖。
继Baichuan 3上线后,时隔三个多月,百川发布最新一代大模型Baichuan 4,并推出成立后首款AI应用——懂搜索、会提问的“百小应”,向模型+应用迈进。
互联网经验如何变为大模型优势?
Q:百川何时开始决定研发AI大模型?当前该业务布局处于什么阶段?
贾亦赫
:
2023
年
4
月,百川正式成立,不到
100
天就推出了
Baichuan-7B
、
Baichuan-13B
两个开源模型。之后,百川几乎是以月度为单位的迭代速度发布大模型,至今已推出
Baichuan-53B
、
Baichuan3-Turbo
、
Baichuan 4
等
12
款不同类型的模型。医疗、金融、能源、教育、电力等是百川目前重点布局的领域。
Q:
布局AI大模型,企业需要具备哪些基础或优势?
贾亦赫
:
第一个是数据获取及清洗经验。数据是模型训练的基础。百川拥有海量的优质数据和相关储备,同时也有完成万亿级页面及千亿级
Token
的语料抽取、结构化与质量评估经验。
第二个是大规模算力调度经验。大体量的数据和用户对算力提出了更高要求,基于团队在搜狗时期的经验,百川在算力、高效调度以及推理方面也具备成熟的经验和技术优势。
第三个是模型内容的安全经验。做互联网产品,特别是做大模型,要保证内容输出安全,规避风险。
Q:AI大模型产业化应用目前有两条路径:一种是基于通用AI大模型的能力,开发行业产品应用或者Agent;还有一种是融合产业Know-How构建专业的垂类行业大模型。据了解,这两种方式百川都有布局。您认为它们的优缺点分别是什么?未来哪种模式更有可能成为主流方式?
贾亦赫
:
我认为这两种方式是两种思维方向,并不矛盾。一个是“大模型
+
”,一个是“
+
大模型”,需要根据不同的场景选择应用。如果是基于大模型或利用
Agent
等技术直接进行开发,要求该场景的业务节点流程相对没有那么复杂,而且具有通用类型的数据。
如果一些领域属于数字化程度不高,它的应用场景有明显的行业属性,而且领域知识通过开放域很难获取到,更多的是通过自身业务长期积累而来,这个时候就必须融合行业
Know-How
,基于原有的流程体系和大模型进行构建。
Q:
能否分享一些百川AI大模型产业化应用案例?
贾亦赫
:
在能源领域,百川更多的是训练行业垂类大模型。例如针对石油类企业,百川基于用户自身的行业数据,同时拿出一些通用数据,帮助用户训练石油领域垂直类的模型。这个模型训练出来以后,可以赋能不同场景,例如新材料的研发、生产过程中的安全检测、产品营销等等。
在媒体领域为代表内容生产行业,大模型因为具备推理、联想、内容生成等基础功能,所以具有天然应用优势。百川跟媒体客户的合作中,利用大模型赋能内容策划、编辑、润色等工作流的提效。
在金融领域,百川认为新质生产力是提升金融服务效能的最优解,就是帮助金融机构创造出新的岗位员工。我们可以运用大模型的意图识别、内容搜索、智能问答等功能,再借助Agent能力,可以为每一个客户提供针对性的、一对一的客户服务经理。
Q:
在业务布局过程中,您认为能源、工业、金融、医疗相比于其他领域应用的难点主要在哪里?
贾亦赫
:目前各个行业都在探讨如何让大模型在行业的业务中实际落地,需求也非常多样化。但是真正从行业调研完成到场景落地,中间还是有一些难点,主要包括几个方面:一是模型匹配行业的要求较高,所以需要进行垂直领域模型训练,而这些行业的数据相对比较封闭,规模化获取数据的难度较大;二是这些行业对模型效果评估没有一个标准化的指标体系;三是这些行业的生产过程对准确率要求较高,如何降低模型幻觉,是亟需解决的问题。
Q
:
哪些类型的企业对AI大模型布局的兴趣更高?
贾亦赫
:
据我们观察,一般有政府或大型央国企背书的行业对
AI
大模型布局的兴趣更高,比如金融、石油石化、能源、医疗、科研领域的一些企业,接受程度相对都比较高,而且愿意进行一些尝试。
一方面是它们的行业数据积累比较多;另一方面,这类行业之前主要借助小模型或工程方式去解决一些问题,但它本身业务非常庞大,每出现一个新的需求,就需要一个小模型,而大模型的出现,可以帮助他们通过一个体系取代原来的小模型,避免不断地做应用系统。
Q:
目前大模型整体处于商业化落地探索阶段,有很多不同的收费方式,有定制化的,也有用API接入的。百川主要采用的商业模式和收费模式是什么样的?哪种模式可能会成为行业最主流的方式?
贾亦赫
:
百川的部署方式和收费模式相对灵活,用户可基于自身的需求和特点选择不同的付费方式。从使用模型和部署角度,百川提供了API接入、私有化部署和云端私有化的方式,从付费方式来讲,用户既可以一次性付费买断,也可以按照订阅制两种付费。从趋势角度来讲,订阅服务制会逐渐的成为主流,因为目前模型技术的迭代速度非常快,而项目是有周期的,往往一个项目还没做完,模型已经迭代升级了,订阅制可以更好的保障用户的权益。
Q
:
百川未来在AI大模型以及产业化应用方面的规划是什么?
贾亦赫
:
一方面,不断模型自身的能力,包括事实性回答的准确率、知识库的增强。
5
月
22
日,百川已正式发布具备多模态能力的新一代大模型
Baichuan4
。
另一方面是垂直领域模型和应用层面,百川将在医疗领域、金融领域深入探索产业化应用。
大模型落地:企业、政府如何“双向奔赴”?
Q: