一种基于大模型代理的财务数据风险分析方法及系统与流程

专利2025-03-28  11


本发明涉及数据风险分析,尤其涉及一种基于大模型代理的财务数据风险分析方法及系统。


背景技术:

1、财务数据风险分析的必要性在于其对企业经营决策和市场监管的重要性。随着经济的发展和企业经营环境的复杂化,企业面临的财务风险日益增多,包括信用风险、流动性风险、税务风险等。这些风险可能来源于市场波动、政策变化、内部管理不善等多个方面,对企业的财务健康和持续经营构成威胁。因此,准确评估和及时响应财务风险对于维护企业价值和股东利益至关重要。

2、在财务数据风险分析领域,目前普遍使用人工数学建模和神经网络模型预测,但仍存在许多局限性和不足。首先,人为分析数据风险容易疏忽和遗漏潜在的风险,特别是在处理大规模和复杂的财务数据时,关键的风险信号可能会被忽略。其次,由于分析人员的主观性,即使是面对相同的数据,也可能得出不同的结论,这影响了风险评估的一致性和可靠性。

3、因此,为了提高风险分析的准确性和效率,行业内正逐渐转向采用人工智能等先进技术,但是神经网络模型在预测方面也有些许不足之处。随着市场环境和风险因素的变化,深度学习模型在新数据到来后需要重新训练和调整,需要不断地迭代,耗时较长且成本高昂,导致模型对最新财务状况的反映存在滞后性。其次,一旦深度学习模型训练完成,其结构和参数往往固定,难以适应快速变化的市场环境和新兴的风险类型,导致模型在面对新风险时预测能力不足。


技术实现思路

1、本发明实施例提供了一种基于大模型代理的财务数据风险分析方法及系统,用于解决如下技术问题:现有的财务数据风险分析模型需要根据数据的变化而不断迭代,并且结构和参数比较固定,导致对最新财务状况的反应存在滞后性,且对数据风险的预测能力不足。

2、本发明实施例采用下述技术方案:

3、一方面,本发明实施例提供了一种基于大模型代理的财务数据风险分析方法,方法包括:获取历史风险数据样本,并进行预处理;

4、基于向量嵌入技术,将预处理后的历史风险样本数据转换为风险数据向量;

5、对所述风险数据向量进行向量降维以及二级分层聚类,构建向量数据库,并将所述向量数据库设置为风险分析大模型的代理工具;

6、将输入所述风险分析大模型的待测财务数据与所述向量数据库中的风险历史数据进行拟合估计,判断所述待测财务数据是否存在潜在风险,并生成风险分析报告。

7、在一种可行的实施方式中,获取历史风险数据样本,并进行预处理,具体包括:

8、基于在线财务数据库以及企业公开披露的财务信息,收集财务报告;

9、提取所述财务报告中的文本内容以及文本格式,并通过识别所述文本内容中的分隔符进行文本分段;

10、通过关联度计算算法,对分段后的文本进行关联文本合并,得到所述历史风险数据样本;

11、对所述历史风险数据样本进行数据预处理,包括数据清洗、缺失值处理、识别并剔除重复数据,以及识别并修正异常数据;

12、通过近似词匹配以及正则表达式,将所述历史风险数据样本中的数值数据进行归一化处理。

13、在一种可行的实施方式中,基于向量嵌入技术,将预处理后的历史风险样本数据转换为风险数据向量,具体包括:

14、对预处理后的历史风险数据样本进行分词处理以及去除停用词处理,得到若干个单词、句子以及段落;

15、在向量嵌入模型的向量对照表中查找词嵌入矩阵,获取每个单词的向量表示;

16、基于单词的上下文信息生成句子或段落的向量表示;

17、基于所述单词、句子以及段落的向量表示,得到所述风险数据向量。

18、在一种可行的实施方式中,基于单词的上下文信息生成句子或段落的向量表示,具体包括:

19、提取所述句子或段落中的核心关键单词;

20、通过选择性上下文敏感技术,获取所述核心关键单词的上下文信息;

21、根据所述上下文信息,确定所述核心关键单词的关联单词,并提取所述关联单词的向量表示;

22、基于所述上下文信息以及所述关联单词的向量表示,生成所述句子或段落的向量表示。

23、在一种可行的实施方式中,对所述风险数据向量进行向量降维以及二级分层聚类,构建向量数据库,具体包括:

24、对所述风险数据向量进行向量长度归一化处理;

25、通过主成分分析技术,对归一化处理后的所述风险数据向量进行向量降维;

26、对所有降维后的风险数据向量进行二级分层聚类;

27、将二级分层聚类后的风险数据向量存入数据库中,构建所述向量数据库。

28、在一种可行的实施方式中,对所有降维后的风险数据向量进行二级分层聚类,具体包括:

29、对所有降维后的风险数据向量进行一级聚类,并划分k个聚类中心,得到k个一级聚类簇;

30、对每个一级聚类簇进行二级聚类,并对每个一级聚类簇划分l个聚类中心,以将每个一级聚类簇继续聚类为l个二级聚类簇,最终得到k*l个聚类簇,完成所述二级分层聚类。

31、在一种可行的实施方式中,在将输入所述风险分析大模型的待测财务数据与所述向量数据库中的风险历史数据进行拟合估计之前,所述方法还包括:

32、通过所述风险分析大模型的输入层接收经过预处理的待测财务数据;

33、通过所述风险分析大模型的嵌入层,对所述待测财务数据进行向量嵌入,得到映射到高维空间中的财务数据向量。

34、在一种可行的实施方式中,将输入所述风险分析大模型的待测财务数据与所述向量数据库中的风险历史数据进行拟合估计,判断所述待测财务数据是否存在潜在风险,具体包括:

35、启动代理工具,在所述向量数据库中匹配与所述财务数据向量的相似度高于第一预设阈值的风险数据向量;

36、若初次匹配后,存在与所述财务数据向量的相似度高于第一预设阈值的风险数据向量,则判定所述待测财务数据存在潜在风险;

37、若初次匹配后,不存在与所述财务数据向量的相似度高于第一预设阈值的风险数据向量,则采用react机制进行多轮迭代分析,直至匹配到与所述财务数据向量的相似度高于第一预设阈值的风险数据向量,或者达到最大轮次;

38、若在达到最大轮次后,仍未匹配到与所述财务数据向量的相似度高于第一预设阈值的风险数据向量,则判定所述财务数据向量不存在潜在风险。

39、在一种可行的实施方式中,在所述向量数据库中匹配与所述财务数据向量的相似度高于预设阈值的风险数据向量,具体包括:

40、通过主成分分析技术,对所述财务数据向量进行向量降维;

41、遍历所有的一级聚类簇,分别计算降维后的所述财务数据向量与每个一级聚类簇的相似度,确定出相似度高于第二预设阈值的目标一级聚类簇;

42、分别计算降维后的所述财务数据向量与所述目标一级聚类簇中每个二级聚类簇的相似度,确定出相似度高于第三预设阈值的目标二级聚类簇;

43、分别计算降维后的所述财务数据向量与目标二级聚类簇中的每个风险数据向量的相似度,确定出相似度高于第一预设阈值的目标风险数据向量。

44、另一方面,本发明实施例还提供了一种基于大模型代理的财务数据风险分析系统,所述系统包括:

45、数据获取模块,用于获取历史风险数据样本,并进行预处理;

46、向量数据库构建模块,用于基于向量嵌入技术,将预处理后的历史风险样本数据转换为风险数据向量;对所述风险数据向量进行向量降维以及二级分层聚类,构建向量数据库,并将所述向量数据库设置为风险分析大模型的代理工具;

47、风险分析模块,用于将输入所述风险分析大模型的待测财务数据与所述向量数据库中的风险历史数据进行拟合估计,判断所述待测财务数据是否存在潜在风险,并生成风险分析报告。

48、与现有技术相比,本发明实施例提供的一种基于大模型代理的财务数据风险分析方法及系统,具有如下有益效果:

49、本发明基于大模型代理技术,将向量数据库作为代理工具,设计了一种财务数据风险分析方法。通过大模型的分析能力,根据输入数据和风险向量数据进行深度拟合分析,能够有效识别和评估财务数据中的潜在风险。通过从复杂的财务文本中提取有价值的信息,将其转化为有助于风险评估的结构化数据,能够将用户要分析的财务数据与数据库中的历史风险数据进行拟合分析,发现数据中蕴含的潜在风险,提高了对财务风险的识别和管理。在财务风险数据更新时无需重新训练模型,只需将数据处理后导入向量数据库,大模型就能够使用最新数据进行风险判断。面对数据库不存在的风险类别时,模型能够根据向量库中风险数据的高维度信息,对数据可能存在的风险进行智能建议,提高了输出风险报告的质量。


技术特征:

1.一种基于大模型代理的财务数据风险分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,获取历史风险数据样本,并进行预处理,具体包括:

3.根据权利要求1所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,基于向量嵌入技术,将预处理后的历史风险样本数据转换为风险数据向量,具体包括:

4.根据权利要求3所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,基于单词的上下文信息生成句子或段落的向量表示,具体包括:

5.根据权利要求1所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,对所述风险数据向量进行向量降维以及二级分层聚类,构建向量数据库,具体包括:

6.根据权利要求5所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,对所有降维后的风险数据向量进行二级分层聚类,具体包括:

7.根据权利要求1所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,在将输入所述风险分析大模型的待测财务数据与所述向量数据库中的风险历史数据进行拟合估计之前,所述方法还包括:

8.根据权利要求7所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,将输入所述风险分析大模型的待测财务数据与所述向量数据库中的风险历史数据进行拟合估计,判断所述待测财务数据是否存在潜在风险,具体包括:

9.根据权利要求8所述的一种基于大模型代理的财务数据风险分析方法,其特征在于,在所述向量数据库中匹配与所述财务数据向量的相似度高于预设阈值的风险数据向量,具体包括:

10.一种基于大模型代理的财务数据风险分析系统,其特征在于,所述系统包括:


技术总结
本发明公开了一种基于大模型代理的财务数据风险分析方法及系统,属于数据风险分析技术领域,用于解决现有的财务数据风险分析模型需要根据数据的变化而不断迭代,并且结构和参数比较固定,导致对最新财务状况的反应存在滞后性,且对数据风险的预测能力不足的技术问题。方法包括:获取历史风险数据样本,并进行预处理;基于向量嵌入技术,将预处理后的历史风险样本数据转换为风险数据向量;对风险数据向量进行向量降维以及二级分层聚类,构建向量数据库,并将向量数据库设置为风险分析大模型的代理工具;将输入风险分析大模型的待测财务数据与向量数据库中的风险历史数据进行拟合估计,判断待测财务数据是否存在潜在风险,并生成风险分析报告。

技术研发人员:赵国博,李明航,徐同明,李伟龙,李伯钊,王思源,鹿海洋,于兆洋
受保护的技术使用者:浪潮通用软件有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1817774.html

最新回复(0)