方案概述
传统的合规审计专家,需要持续学习、在合规审计的业务进行过程中,大量的对相关资料进行差异、整理。耗时耗力。企业知识管理员,传统的知识管理员,标签系统无法跟上业务变化的速度。本技术方案基于银行现有的大数据资源,构建一套智能合规管理系统。通过结合大语言模型、向量数据库、图数据库、以及相关的算法,智能分析并关联银行内外规、相关行政处罚、司法判决,并通过对话的方式实现基于相关信息内容的问答。帮助合规问题的实时监测、自动报告和风险预警。该系统将为银行提供高效的合规解决方案,降低合规风险,提高管理效率,增强客户信任。通过大模型批量将合规文件中的关联信息抽取至图数据库、向量数据库,实现对现有数据的合规性分析,提高合规管理的准确性。通过关联信息的查询、展示以及自然语言对话,实现对合规文件和通讯的实时监测,减少合规漏洞。发展高级合规智能系统,预测合规风险并提供决策支持。
业务挑战
- 业务合规问答:针对所有生成式问答,我都可以有一个看到他们一个或多个的来源出处,方便我对大模型生成内容进行确认,对答案进行溯源。(如有)我的每个合规问题都可以关联至司法案例和行政处罚上,帮助我了解法规相关联的知识
- 合规知识管理:管理每个文档知识点的切分情况,及其对应所生成的摘要、标签。以查看到每个标签的生成来源,帮助解释其合理性。
- 实时合规监测:快速发现并解决可能存在的合规问题。
- 自动合规报告:降低手工合规报告的工作量和错误率。
- 预测合规风险:提前应对可能的合规问题,减少风险。
- 提高管理效率:通过自动化和数据驱动的方法降低合规管理的成本。
方案架构
通过枫清·瑶光企业知识中台将金融机构持有的多源异构数据,包括结构数据、内外规文档和处罚文档数据进行处理,形成摘要和标签,并将处理结果形成的图和响亮数据存储于枫清·天枢多模态智能引擎用于支持后续的问答交互和应用;同时应用枫清·瑶光企业知识中台结合机构内数据和知识对大模型微调和管理,并通过自动生成问答对进行数据增强,同时在采用多路召回时,引入图召回,通过构建的法条、处罚、司法案例和标签等关系网络,减少大模型幻觉,提供确定性知识。
方案优势
- 大模型微调:选取业界 SOTA 大模型,当前是 Baichuan2 – 13B;使用全参微调、LoRA 等方式进行模型微调;自动生成问答对,做数据增强。
- 多路召回 embedding 算法:多路召回算法、多种 Embedding 算法,包括 Text2vec, ChatLaw-Text2Vec, m3e-base, bge-large-zh;Embedding 算法微调,提升效果。
- 使用图增加关系,减少大模型幻觉:构建法条、处罚、司法案例、标签等相互关联关系;问答时不单做向量召回,同时考虑图的关系;问答时给出问题相关的处罚、案例等确定性知识
- 具有成熟能力产品支撑上述场景在行内大规模复制和横向扩展:LLM Ops 低代码大模型微调工具、ArcVector 向量数据库、ArcGraph 分布式云原生图数据库、企业知识中台 EKC 提供合规问答应用底座
- 数据安全和隐私:项目高度重视数据安全和隐私,确保客户数据的保密性和完整性。这是合规管理中至关重要的方面。
- 强大的技术支持:银行拥有丰富的技术资源和实力,能够在大数据和人工智能领域提供强大的支持。这是项目在技术方面的显著优势。