DeepSeek助力群杰科技实现用印、合同数字化风控能力再提升
群杰产品与DeepSeek深入融合应用成果
群杰产品接入DeepSeek R1带来的实际应用价值
群杰科技旗下智能印控、合约卫士等行业领先数字化风控产品均已全面接入DeepSeek-R1系列模型对AI功能模块升级,为广大客户伙伴提供了更强的智能体验及本地化部署的印章/合同全生命周期管理系统新版本。
本次围绕合同印控全流程管理,对群杰合约卫士的合同起草、审查、用印、履约、归档等业务场景相关的功能模块进行了全面的智能化提升,通过DeepSeek-R1系列模型的接入提供了更加智能的业、财、法风控能力,合同AI审查信息的有效率提升至99.2%,进一步帮助企业全面提升合同风险防控和数据应用能力,并在提升能力的同时,显著降低本地化部署成本。
合同AI审查模块效果
合同AI审查模块DeepSeek-R1推导过程
合约卫士新版本智能化显著提升的业务场景方面
● 合同智能起草和批量生成
根据应用场景、具体业务信息自动匹配合同模板,补全合同签约方、金额、支付条款、履约条款等业务信息,自动生成合同,支持根据业务清单批量生成合同。
● 合同的合规审查和风险评估
对合同内容条款进行深度分析,识别其中可能存在的法务风险、合规问题、业务不合理的条款。基于比以往更强大的推理能力,能够对合同中的潜在的计算逻辑等业务风险进行预警。
● 合同信息的提取和比对
快速从合同文本中识别抽取合同双方主体、合同金额、履行期限、违约责任等关键信息,形成结构化数据,为合同信息的快速录入、计算、分析、比对提供便利。
快速对比不同版本的合同,识别出其中的差异。在合同修改过程中,系统可以快速找出新旧版本之间的条款变化、文字修改等,并生成详细的比对报告。对合同的不同版本进行管理,记录每次修改的时间、人员、内容及原因,确保合同版本的可追溯性。
● 合同用印文件识别与分析
使用群杰智能印章或电子印章进行线下线上智能化合同用印管理,在原有的独家隐形水印+OCR识别技术基础之上,进一步提升文本识别率(超99.9%),并大幅提高识别效率,降低大型集团企业客户对服务器GPU资源的依赖,从而降低采购成本。
● 履约监控和预警
合同盖章生效后,结合合同履约条款和实际业务数据,拆解为履约任务进行跟踪,实时监控合同的履约进度。当出现履约延迟或潜在违约风险时,及时发出预警,提醒采取相应的措施。
● 合同的智能归档管理和智能检索
将合同按照预设的分类规则自动归档(如合同类型、责任部门、合同金额、风险等级等),方便进行合同的管理和存储。
通过自然语言处理技术,支持用户使用自然语言进行合同检索。如,用户可以通过输入“所有2025年签订的50万元以上的采购合同”这样的自然语言指令,快速找到相关合同并进行概要统计和分析、摘要内容提示。
DeepSeek应用指南与技术启示
应用DeepSeek R1我们需要什么样的资源
DeepSeek可在windows、macOS或Linux系统上部署服务,DeepSeek模型下载完成后,可在终端中输入我们的问题或指令。显卡的显存占用和利用率取决于所选模型的大小和我们的硬件配置。
下表为DeepSeek R1系列大模型推荐使用的GPU显存大小以及型号。针对相关业务需要,同时考虑成本问题,我们可以选择的模型参数范围从1.5B~70B之间。主要区别如下:
● 若业务需求以轻量级合同抽取、标注辅助为主,1.5B~7B规模的模型已经足够,成本较低。
● 若需要更强的理解能力、复杂合同分析,可选择 8B~14B规模的模型,结合多卡4090或A100进行推理。
● 70B级别模型适用于需要高精度NLP处理的场景,但部署成本高,建议仅在特定高价值任务中使用。
表 DeepSeek R1系列大模型推荐使用的GPU参考
DeepSeek-R1-Distill-Qwen-7B在RTX4090上的使用效果
我们在NVIDIA GeForce RTX 4090、驱动版本: 550.120、Cuda=12.4、python=3.10.0的服务器上测试了DeepSeek-R1-Distill-Qwen-7B的推理效果,结果显示显存占用约15.3GB,GPU的利用率高达97%。
在测试的过程中我们设置max_new_tokens=2000,审查的测试合同字数为969个字,共耗时24.16秒,平均生成速度约为 82.8 tokens/秒。下图为我们使用DeepSeek的输出过程与输出结果。
图 DeepSeek-R1 -Distill-Qwen-7B 服务器测试审查效果
DeepSeek现象:技术爆发背后的启示
Q:DeepSeek 技术的爆发,对于中国大模型未来发展道路有哪些启示?对中国企业的一些启示?
A:DeepSeek 团队秉持技术理想主义,以实现 AGI 为目标,凭借长期积累和坚定执行力推动技术进步。其成功并非偶然,而是多年深耕的结果。创始人梁文峰的资金支持为团队提供了探索的自由,但更多有潜力的国内团队仍需要更完善的支持体系,以推动原始创新。DeepSeek的发展路径展现了长期主义的重要性,他们的成功经验值得学习,但技术路线不应被简单复制,而应在此基础上探索更具创新性的突破。
DeepSeek的成功为中国企业提供了以下启示:坚持长期主义,专注技术创新;重视开源与开放合作;优化资源配置,实现高效研发。
Q:DeepSeek-R1是全新物种LLM,Think能解锁无限可能吗?
A:虽然 DeepSeek-R1 被称为推理大模型,但本质上仍然是一款大语言模型,其核心能力与 OpenAI o1 相当,并未带来突破性的能力变革,并且在一些推理准确性测试中,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身DeepSeek-V3的3.9%。它的独特之处在于引入 Think过程,通过拆解推理来提升推理表现(类似于我们解一道复杂数学题时,会先拆解成多个小步骤),但这一机制带来了额外的时延,并非适用于所有场景。因此,DeepSeek-R1 并非真正意义上的“全新物种”,而是对推理方式的一种优化,而 Think也并非万能钥匙,而是以时间换取更精细的推理链条。
Q:使用DeepSeek系列模型对合同进行审查、要素抽取等工作,与应用其他LLM相比其优势有哪些?
A:基于指令型架构,依赖于用户提供的明确指令或提示,缺乏自主推理能力,对合同条款的理解可能较为表面。而采用推理型架构,能够在回答问题前进行“自问自答”式的推理思考,模拟人类的深度思考过程,从而提升对合同条款的理解和分析能力。通过深度思考过程,能够更深入地理解合同条款的含义,识别潜在的法律风险和隐含意图。
Q:为什么说DeepSeek R1能够取得如此全球性的成功呢?
A: DeepSeek R1 能够取得全球性成功,关键在于其开放普惠的策略和技术创新的突破。相比 OpenAI 的 o1 高昂的收费和封闭的策略,DeepSeek R1 让更多人切实体验到了深度思考的震撼,类似 2023 年初 ChatGPT 带来的现象级影响。 更重要的是,它在有限算力条件下,通过算法创新突破了算力瓶颈,证明了即使资源受限,也能实现全球领先的 AI 进展。这对中国 AI 发展意义重大,也揭示了 AI 未来普惠化的核心——提升效率,让通用人工智能真正触达每个人。