DeepSeek-V3和DeepSeek-R1的发布,正式宣告了AI应用进入低成本、高推理能力的新阶段。甄零科技,作为国内头部的合同管理系统厂商之一,今天正式宣布,甄零一诺AI旗舰版,现已引入深度思考大模型!
在全面接入深度思考模型后,甄零一诺AI旗舰版将在复杂推理任务上实现质的飞跃。深度思考大模型是专为复杂推理任务量身打造的,它借助大规模强化学习以及冷启动技术,无需依赖大量监督微调,就能达到与 OpenAI o1 系列相当的推理水平。在 MATH-500 测试中,R1 模型的得分高达 97.3%,超越了 o1-1217(96.8%),在FRAMES长上下文基准测试中则获得了82.5%的准确率,证明其可处理合同文本的长程依赖关系,识别跨条款风险。凭借这种卓越的推理能力,AI 在处理合同领域的诸多复杂任务时,例如合同审查、条款修订、合同辅助起草等,将变得更加高效且精准。
AI旗舰版现有功能焕新升级
复杂合同信息提取能力优化
广受客户欢迎的要素提取功能中,有一类复杂提取的场景,典型例子就是租赁合同的租赁条款。租赁条款中的租金支付,涉及到定金、首付款日期和后续周期性付款日期,可能与租赁期的起止时间、开票时间、免租期等租赁条款约定有关,需要充分理解上下文才能处理得比较好,这就对大模型的能力提出很高的要求。引入深度思考大模型后,一些长距离联想才能组合在一起的信息可以被大模型充分地注意到,还可以注意到更多的相关条款语义,最终一次性准确提取。准确率可提高3-8%,维护成本降低20%。
合同摘要能力优化
在合同摘要中,会涉及到对合同的服务交付方式,违约责任等要点的摘要。交付方式会涉及到合同中多个位置的文本信息,如交付内容/时间,验收标准,验收不通过的处理办法等,而往往不同的交付时间又和不同的付款里程碑关联,验收不通过又可能和违约情形相关联,其上下文语义逻辑复杂,表述多样,具有长程相关性,因此对大模型的理解能力,逻辑推断能力都提出了高要求。在引入深度思考大模型后,多种耦合的信息可以被更好的归纳和总结,摘要的完整性,准确性和可读性都得到了大幅提升。
协同评论总结能力优化
在合同的磋商过程中,参与者会对合同进行正文的引用和评论,而评论之间又有父子引用继承关系,根评论和一系列子评论会构成一颗评论引用树结构,并且树与树之间可能会针对同一段文本进行讨论,但却有前后的时间关系和逻辑关联,因此评论的总结对大模型的上下文理解能力提出了很高要求,此外,针对修改前后文本的评论也会干扰大模型的判断,如果大模型处理不得当,会导致无关的评论总结揉在一起,提高了人工阅读的成本。深度思考大模型能够更加有效的辨识评论树及和关联评论树之间的逻辑关系,并结合合同文本,提供更清晰、更易读、更凝练的评论总结,使用户更快速的掌握合同磋商的各方意见。
合同问答(新功能)
合同问答可以在起草、协作、审批等环节,帮助合同起草人、协同参与者、审批人及相对方法务更高效地协作和审批,用户可以通过提问的方式快速理解合同、理解条款,快速理解潜在风险,快速定位条款,以及获取关键信息。
场景示例1:快速理解合同
场景示例2:快速理解潜在风险
甄零AI专家怎么说
一直以来,甄零AI算法团队致力于研究AI在合同管理领域的应用落地,此次引入DeepSeek、利用好大模型的深度思考特性之外,同时兼顾快速部署以及场景适配。
甄零AI算法专家们,针对近期被问到的诸多问题,进行了逐一解答。
问:深度思考大模型的特点如何体现为在合同领域的优势?
答:合同领域的复杂AI应用如智能审查,条款修订,合同辅助起草等往往需要深入理解合同条款,并结合场景的问题进行推理和反思才能获得较好的效果。而不带深度思考能力的大模型,如Llama,Qwen等,虽然可以通过"Think step by step"来驱动其CoT能力,但因为这些模型没有经过如deepseek的思维链强化学习训练,导致其推理能力仍然有限。此时为了使其生成的结果更加准确可控,需要人为规定大模型的推理步骤,让大模型按照既定的思维树去进行推理和试错,有时甚至要结合human-in-the-loop的思路来引入人工的干预,使大模型面对复杂AI应用场景时的应用成本上升。
而推理能力强的大模型能够更深入地理解合同文本的语义和条款之间的逻辑关系,自动的规划其推理过程,自动试错和反思,从而更精准地识别潜在合同风险及合规性问题,在面对复杂的应用场景时,降低人为规定思维路径的工作量和大模型的应用落地成本。
问:甄零是如何引入深度思考大模型的?
答:在引入深度思考大模型时,我们核心关注其在不同任务场景上的效果和性能的平衡。因为深度思考类的模型往往需要较长的思考过程,会导致其在面对一些简单场景时进入过度的思考,如合同分类,常规字段的要素提取等。而如果分别部署深度思考大模型和非思考类的大模型,会极大的提升私有化部署成本。因此,甄零在深度思考模型的基础上训练短思考(low reasoning effort)插件,可以在同一个基座模型上随时开启其思考能力而不增加部署成本。基于这种架构,甄零的一诺大模型可以延续一贯以来的“低成本、高能力”特性,同时支持公版调用和低成本私有化部署。
实测表现:经过实测统计,在复杂问题理解的场景,带有使用DeepSeek-R1蒸馏后的深入思考大模型相比其未蒸馏的版本,75%的问题都要回答的更好,其余25%的问题也是表现持平。
问:深度思考大模型的进一步应用方向
答:
精准修订条款:有别于常见的智能审查软件中用标准条款替换风险条款的做法,精准修订条款可以在字词级别上进行必要的替换或修改,以最小的改动达成修订目的,其表现就如同一位人类合同协作人或审批人那样;
基于历史合同或模版辅助生成合同草案:用户输入少量必需信息即可获得一份在给定条件下进行小幅修改以匹配特定业务要求的合同,这将极大提高用户的自助完成合同流程的能力,同时大幅减少公司法务的繁冗工作;
履行偏差的风险分析:智能比较合同条款约定与履行结果,主动分析偏差并发出预警;
结束语:
深度思考大模型具有更强的远距离关联能力和逻辑推理能力,这就为合同管理的一些高级应用场景提供了更强大的引擎。
未来,甄零科技将继续不断探索AI领域,在这个AI平权的时代中,借助深度思考大模型的强大功能,打造企业合同管理产品AI创新引擎,助力企业提升交易质量!