在当下这个由DeepSeek引领的AI浪潮中,律所正面临着前所未有的机遇与挑战。如何打造新质生产力,成为在激烈竞争中脱颖而出的关键。对于法律人而言,“弯道超车”的时代已经来临,他们又该如何实现自我突围与进阶?从理论到实践,当“数智化”与法律深度融合,其中蕴含着怎样的奥秘与路径,能够助力法律行业步步为“赢”?
2025年2月22日,
“加油·置顶热爱”第三届法律服务业品牌发展论坛暨律新社2025品牌盛典
召开,在
“法律新质生产力与颠覆式创新”平行论坛
上,
华宇元典·元典问达运营负责人常成作“推理模型(如DeepSeek-R1)在法律行业的应用实践与展望”主题演讲
。常成的主题分享整理如下:
最近能感受到大家内心的焦虑,有一个专门词汇叫“FOMO(Fear Of Missing Out)”中文大概是对于错过一波浪潮的恐惧。这种群体焦虑,堪比当当年比特币在币圈掀起泡沫时的情景。不仅是法律行业,任何从事文字工作、需要使用电脑的从业者,都面临着是选择观望还是拥抱AI的挑战。我去年制作的PPT到今年可能仅有不到十分之一的内容还能用得上,每天都有新技术涌现。第二个问题就是,大家所说的AI技术到底是真有效还是智商税,是良药还是有害之物?我们都不知道该相信谁、选择谁。回溯到DeepSeek刚出现时,一些原本被认为非常权威的专家和期刊发表的使用方法与建议,后来被证明很多未经真正使用与验证就直接推出,存在似是而非的情况,后来才得以澄清。那么在当下这个时代,我们该如何建立自己对技术的判断准则,这正是我今天分享希望实现的。
下面的分享分为三个部分:
第一部分
,我会简单地来讲AI算法的前世今生,因为我并非技术背景出身,所以讲解的内容一定是通俗易懂的。我们公司从2016年成立之初便涉足AI领域,那时的AI还是阿尔法狗战胜李世石时期的AI,我将和大家分享AI如何一步步发展到今天,以及其中涉及的诸如ChatGPT对前面的迭代、DeepSeek对ChatGPT的迭代等内容。
第二部分
,讲讲AI产品的原则。当下大家热议技术,似乎忽略了产品经理的作用,但其实ChatGPT的底层技术transformer在2017年就已诞生相关论文,GPT3.5也是在ChatGPT之前半年就已出现,但让所有人震惊的是它被包装成了一个聊天机器人,这并非仅仅是技术的实现,更是产品经理的成果。同理,DeepSeek的出现,其技术一开始的能力在很多指标上与OpenAI-o1其实差不多,但产品经理做出了一个极为重要的选择——开放联网回答,它是首个开放联网回答的推理模型,o1上线了快一年都没有开放,这些都属于产品的影响因素。所以这一部分我会着重在AI时代的产品。
第三部分
则聚焦于我们法律行业以及法律人,探讨法律AI产品的选择以及行业未来的演进方向。
AI算法本质上就是从输入到输出,中间存在一个处理过程。这个框架既有权威性又足够抽象。
在这里,很重要的一点是大家要牢记,当我们使用AI时,我们能控制的变量其实很少,很多人思考的是中间环节或后续的训练问题,但那属于生产厂家的范畴,
对于我们使用者而言,真正能控制的只有输入因素
,所以在后面的讲解中,我会用两种颜色来区分,人能控制的东西用橙色表示,人不能控制的、属于机器的东西用蓝色表示,以此来展现诸多变化的过程。
2016年,华宇元典开始涉足法律模型时,采用的是利用知识图谱开发复杂专家规则的方法,若想让AI识别裁判文书中的具体内容,就得将特定法律概念怎么识别的规则编写出来。例如什么是侵害作品信息网络传播权纠纷,会有很详细的一段描述,再将这段描述和海量裁判文书做对应、训练,最终将对应关系映射出来。一个案由下的法律要素可能有几十上百个,我们共研发了300多个法律要素图谱,覆盖的要素数量达数万个。之所以大家没怎么听说过这套系统,是因为它主要服务于法院,且开发成本极高,也因此在2016-2020年那个阶段,法律AI公司远没有今天这么多,不过我们确实长期投入,
至今这些法律要素的识别范围已逐步覆盖全国公开裁判文书的90%以上
。
专家系统有其优势,一是任务特定化,专门用于案例文书的判别与提取,能够抽取裁判文书中的特定法律要素及相应指标来进行推理。但它的短板也很明显,最大的短板在于人工成本,即这一开发过程极为耗费行业专家与算法专家,这就导致AI的应用呈现割裂状态,只有高附加值、市场规模庞大的领域才有可能进行AI开发,法律领域因此没有得到很蓬勃的发展。另一个明显的短板就是任务特定化,这时AI没有常识,也难以解决多元化法律问题。
直到ChatGPT的出现,这既是一项技术革新,也是商业模式的重大创新,它所追求的是AGI,很多人知道AIGC中的G是“generate”,即生成式算法,但大家往往忽略了生成只是结果,其真正目标是实现通用人工智能,这个G是general是generalize,是泛化、是通用,依靠一个公式解决人类所有的智能问题,这个算法就是自然语言输入,transformer去生成下一个token。
ChatGPT所有运算都来源于我刚才输入的内容以及它自身生成的内容先进行向量化,再进行QKV的加权计算,最后形成一个概率列表,从概率列表中生成下一个字。ChatGPT将这样底层的技术包装成了一个聊天机器人,让我们如今能感受到它的强大。
3.驯服AI 1.0:优化输入改善输出——用上下文调整“注意力”
但是,大模型并非我们传统理解的机器或程序,它不会给出一个稳定的答案,我刚刚给大家演示了这个我装在电脑上的GPT2.0,它居然得出了1+1=1的答案,大模型只是不停地给出下一个字的概率列表,是概率和抽签式的结果。那么我们该如何控制大模型,让它真正给出我们想要的结果?非常重要的一点就是控制它的输入,让这边可供运算的输入内容足够多,每一个内容都指向我们想要的结果,最终的运算结果才能接近目标。
这个时候,我们就进入了第一个使用者驯服模型的阶段,“提示词工程”。通过引入思维链,就是告诉模型如何分步骤思考,通过引入少量例子、给出角色等技巧与方法,增加了输入的信息量,让模型生成式,注意力调整到更多重要的信息,使得生成的结果更加符合我们的期待。
到推理模型阶段,到底颠覆了什么?
DeepSeek-R1-zero训练的创新,在于它在整个模型输出中强制加入了思考环节
,即在训练时,它没有选择法律要素等结构化法律数据,但使用了有绝对正确答案的习题,如数学、物理、编程等,运用了两个奖励机制,
第一个奖励模型
是你的回答必须包含思考过程(体现在代码上就是
的部分),有了就给分,没有就没分,不看思考过程对不对;
第二个奖励机制
是你的回答对了还是错了,对了就给分,错了就没分。依靠这两个极简的训练机制,生产出了推理模型。所以DeepSeek推理模型第一版,中间所有的思考过程都没有用人类推理的数据去训练,而是让模型自己去生成思考,在这个过程中产生了令人震惊的涌现现象。
例如,它在解一个数学题时突然说“喂,等一下,这儿可是一个重要时刻,请看我一步一步算一下”。
所以有人问我用DeepSeek和用原来的AI有什么区别,那便是“不要教聪明人做事”
,它能做的数学奥数题和物理习题已经远超我们的水平,若你去教它如何推理,反而是在限制它的思考路径。因此,推理模型横空出世,它依靠强制性地生成一个思考环节,自动优化输入,
令人震惊的是,它只训练了物理和数学,却泛化到了法律推理领域,也有了极大提升
。
但DeepSeek依然存在很强的幻觉,这也就回到了一开始让大家做的测试,无论是真人还是豆包都会答错,我们不能让模型永远做闭卷考试,模型有着很强大的模式理解和预测能力,如果不让它查书、上网,它就没办法给出准确答案。
所以就到了我介绍的驯服AI2.0的阶段,“搜索增强生成(RAG)”环节。我们必须给DeepSeek足够好的“参考书”,以前我们说网站数据和内容都是为人类制作的,如今我们要尝试搭建一个架构,为AI提供一个非常好的获取知识的途径,以此武装它的回答,这非常重要,也是我们驯服AI的2.0版本,直到这个框架出来,一个成熟可用的AI产品架构便诞生了。
AI搜索/问答:
杀手级应用,同样将发生在法律行业
这里我提出个人观点的一个暴论,就是AI领域的第一个杀手级应用一定是AI搜索。
所谓杀手级应用(kill app),一定是会对传统业态造成颠覆式影响。这是Perplexity (首个原生Ai搜索产品)CEO当时接受采访时的回答,我从中间提炼出一句话——
“问题的关键是回答问题”
!
现在我们有看不完的网页,每天被无数信息轰炸,搜索到更多东西只是负担,而非优选。AI搜索要解决的问题是让人们直接了解真相,并通过简明扼要的个性化答案作出决策,而非去浏览网页、点击或筛选,那并非底层需求,这就是产品思维,而非技术思维。
DeepSeek-R1是全球第一个默认能够联网的推理模型,直到今天我们看到百度、微信等,所有大厂都在自己的搜索入口里加入了AI联网功能。如果AI的很多领域和应用都还在讲故事,那么AI搜索这件事就是切切实实地发生在我们身上,马上会影响我们每个人的日常使用。
1.AI搜索为何能重建知识流,它的知识流是如何流转的?
在红杉资本的2025AI年度报告中,提到AI搜索的关键在于4个步骤。第一是意图识别,关键词承载的信息有限,就像我们刚才说的,所有算法都是从输入到输出,仅输入几个词就想知晓对方想要什么,太难了,
但若让对方说了一句话,这句话里有前因后果、有标准,能识别的意图就会多了很多
。所以在意图识别方面还有很多工作可以做。第二是信息收集,以往我们靠关键词对撞库来收集信息,把重复过的内容找出来就行,但现在我们知道可以把一句话改写成很多个不同版本,只要意思相同,去知识库里面匹配,因为现在有了AI,它能懂人话了,例如“他拿刀逼着我让我给钱”和“他抢劫”在向量相似度上都能匹配到一起,而原来的关键词是根本匹配不到的。
而且这项工作如今意义重大,因为大模型有窗口大小的限制,就像我刚才演示页面里给大家看到的,它的运算量有上限,当要给它的内容超过上限,它就无法运算。例如,做全国民间借贷案子的特征分析,全国可能有超过1000万篇的裁判文书,若要它总结,它的窗口上限可能只有12万字左右,依然无法处理1000多万的案例文书。
这就需要在信息收集过程中,把这些内容里最重要的环节切片出来,然后根据相关性和可靠性排序
,它只能提取排在前10、20或30的最主要切片,根据这些内容来回答,未来还可能加入其他交互和产品功能。
向量匹配的出现,让我们原来必须靠关键词一一对应的模式,转变为用一个句子去匹配各种详细案情中的描述和介绍,从大海捞针到语义指导,这是一个激动人心的洞察。红杉资本在刚才那份报告中就把AI搜索作为第一个最重磅介绍的应用场景,其次
它认为每一个行业、每一个职业都会有自己的AI搜索
。这件事的洞察其实我自己都不敢确定,因为搜索一直是一家独大,但它给出的理由是,每个领域会有其自有知识和使用习惯等,我们刚才展现的那四大要素并不像原来一样都是统一化的,如今我们的需求越来越个性化,每个行业、每个职业都有自己的个性化场景需求和知识需求,所以会产生不同的AI搜索需求。
元典问达(ailaw.cn) 就是我们基于这个对于杀手级AI产品的理解,打造出来的。底层是强大的DeepSeek-R1推理模型,但同时也让模型开卷考试,能够回答时查看法规、案例、论文等,最大程度避免幻觉。我相信,问达就是咱们法律行业的AI搜索。
首先,我想引用一位英国民事司法主管、高等法院大法官的观点:
“如果律师运用AI技术能为客户和公众提供更好、更快、更有成本效益的服务,那么律师和法官便有义务为实现这些积极目的去使用这些科学技术。”
我们做法律并非因为这份工作舒适,这个岗位和行业有其自身的规定性和职责。这位大法官还时时提醒我们,要竭尽全力保护公平和企业免受新技术的不利影响,用是一定要用,但要做好防范和风控。
其次,回顾我们自身的法律需求,如今虽然大家都在说律师很内卷,案子少、收入低,但在天平的另一边,我
们依然看到中国在法治进程中仍是发展中国家,每年4000多万案子中,有68%的案件双方均未聘请律师
,并非律师不努力获客,而是有那么多案子,案值都不到1万块钱,律师费难以收取。如果收3000-4000元的律师费,再加上诉讼的不可知性,客户完全无法做出购买决策。所以法律服务率低是一个客观现实,我们要进一步推进法治建设,不能让这个市场空白,否则就会像如今法律咨询公司的兴起一样,因缺乏优质法律服务,其他人就可以捕捉这部分用户的需求。
AI带来的是技术平权,具体到法律领域就是法律知识平权。
而这个知识平权,也将带来行业洗牌,它在需求端造成了两极化,批量自动化服务成本将更低、质量会更高,可能终将独立存在,而不再是一种引流和诱导工具。现在许多法律服务因案值低,被律所、法律咨询公司当成新媒体选题、引流咨询等手段,纯粹用来留住客户,做进一步开发。但当客户发现原来这套东西用AI也能得到想要的结果时,这种获客手段可能就不成立了,我们所做的SEO和大量投放的获客来源有可能被颠覆。
客户和法官将变得强大。
前两天我遇到一位大所律师分享的案例,让我也挺紧张的,他说现在他提交材料给客户,客户居然会把不同律师提交的材料上传到DeepSeek,让DeepSeek帮忙分析,指出有哪些不足和缺点,哪个更好。以前我们说让DeepSeek出来,律师来评价它,肯定有很多短板,但若让DeepSeek来评价律师,我们已把很多案例和法规在输入中都给到它,它纯粹分析律师的推理逻辑和书写问题是否全面,想想是不是也很可怕?
从选律师到查知识到验结果,但凡有搜索环节,都有可能受到AI搜索带来的行业变迁影响
,不仅仅是法律AI搜索,所有AI搜索都将引发变迁,当客户、法官有了这种新兴工具,对我们来说,从需求端将面临很大冲击。
从供给端来看,我们的价值点如何打造?就像我刚才说的私有知识,在公网上无人能查到,只有我经历过、记录过、管理过。当你处理新案件,拥有这样的私有知识,只有通过你的线下实际积累、管理和分析才能获取,它会构成新的付费点和核心定价基础。知识数据是新时代律师服务的根本,超过这些能获取的东西。
在这种背景下,初级法律服务者的成才门槛会更高了,
因为你出彩、能收费的标准是你的回答至少要超过DeepSeek的回答
,即大数据和全网数据的回答,你才有可能额外收取服务附加值费用。这意味着我们的实习生、律助可能要经历长期学习,有点像医生的成才过程,可能从上学就不是3年起步,而是5年起步。另一方面是超额价值的溢价,成熟法律人有可能在这个过程中能收取额外溢价,因为你将突出体现自己不同于标准化服务的特点。
持续延伸的AI智能将会给服务生态带来洗牌,但我们也不是没有新机会。我留意到一条新闻,DeepSeek用年薪百万招聘懂AGI的法务,因为AGI的诞生过程,也是规则治理逐步完善的过程,懂AI、懂法律、懂国际规范,这是一个全新的人才需求画像。相应领域还有很多,例如自动驾驶的法律责任纠纷分配、机器人出现问题该如何界定、数据合规版权争议等,都是未来育人的机会。
同时,当我们拥有如此强大的工具,我们不想内卷,可以外卷,去拓展国外市场。既然AI搜索能帮助我们获得任何场景下的知识产权,我们原来的海外市场知识差距,现在完全可以快速抹平和快速学习。
当然也给大家一个警醒,有时候交流时,大家会说法律行业不一样,有很多特殊性,但其实不同行业类似的故事一遍又一遍地发生。我自己虽学法律,但一直没做律师,在很多行业待过。其他的行业,例如围棋,我很好奇当李世石被阿尔法狗战胜后,围棋市场是什么心态,所有围棋高手如何再延续追求,后来发现他们整个培养和学习过程变成谁更能解读AI的下棋逻辑、谁更能记忆新策略。还有翻译行业,随着AI翻译的出现,垂直翻译软件基本不再需要,虽对翻译就业市场造成巨大损失,但也让我们普通老百姓如今去国外能随时调出免费小程序提供即时翻译。画师、设计师行业也受到极大冲击,原来请专业画师作图可能几千元起,现在用AI瞬间能生成4-5张。马斯克对公务员的“打击”,议员原本要提交的国会报告几百几千页,找了几个年轻人用AI算法把内容全部清洗,去掉无用部分,最终提交给国会的只有几十页,删除了大量晦涩官僚用语,并获得通过。
AI的冲击往往比我们想象中来得更快,技术曲线是一个美国咨询机构Gartner判断技术所处阶段的工具,
一般一个技术会经历快速上升期,然后到绝望之谷,因为这个过程中很多实现遇到负面问题,最后平缓融入生产力过程。
如今推理模型大概处于巅峰位置,肯定会遇到应用中的诸多问题,慢慢融入我们的生活。
但我想说的是,这只是DeepSeek团队刚刚开源的研究成果之一,
后面还有许多“大招”在这条曲线上排着队,我们看到模型发展一点都没有减速
。例如多模态识别、文生语音、文生视频,大家最关心的大模型能否在手机、电脑上运行的端侧模型,能否有AI小宠物般随时可用,这些可能都将在接下来的几个月内陆续上演,DeepSeek自己就预告,后续会不断有新的开源报告发布,技术的到来是大招轮番要出。
这张图是我最喜欢的一部电影《沙丘》,其中有一句台词:“The mystery of life is not a problem to solve, but a reality to experience.(生命的奥秘不是一个要去解决的问题,而是要去体验的现实)”
我们如果想要解决问题,会发现有解决不完的问题,既然站在这里,每个人带着自己的目标,你的核心就不是解决完所有的问题,而是在解决问题的过程中,经历自己的一生,找到自己的态度,见证这一切。
最终的变化可能不是我们任何一个人能掌控的,但我们都要坚定向前。
回到一开始的问题,技术发展如此快,我们要不要学、要不要用?当然要,我们应该让自己去体验这些变化,张开毛孔和眼睛,随时应对即将发生的事情,这样我们做出的决策和经历的一生才是无悔的。