文档任务解析方法、装置、电子设备及存储介质与流程

专利2025-08-05  24


本发明属于文档解析,具体涉及一种文档任务解析方法、装置、电子设备及存储介质。


背景技术:

1、对于需求文档中的任务解析,现有技术中大都是通过语义识别来识别文档中的任务,然而采用语义识别的方式仅能够对明确列出了具体任务内容的文档进行任务解析。

2、而在实际情形中,需求文档中往往仅列出了需求内容,而并未明确列出具体的任务,通过语义识别的方式往往无法根据需求文档内容解析出该需求文档所对应的任务。

3、因此,如何提供一种有效的方案,以便根据文档内容解析出符合文档需求的任务,已成为现有技术中一亟待解决的难题。


技术实现思路

1、本发明的目的是提供一种文档任务解析方法、装置、电子设备及存储介质,用以解决现有技术中存在的上述问题。

2、为了实现上述目的,本发明采用以下技术方案:

3、第一方面,本发明提供了一种文档任务解析方法,包括:

4、通过对待解析任务文档进行词性标注、依存关系解析和实体识别,提取出所述待解析任务文档的关键信息;

5、将所述待解析任务文档的关键信息转换为json格式的结构化数据;

6、将所述结构化数据转换为语义向量;

7、将所述语义向量输入预先训练的任务分析模型,得到所述待解析任务文档所对应的任务列表,所述任务列表中包括至少一个任务,每个任务中包括至少一个子任务;

8、其中,所述任务分析模型是以样本任务文档的关键信息所对应的语义向量作为模型的输入,样本任务文档所对应的任务列表为输出进行训练得到的。

9、基于上述公开的内容,本发明通过对待解析任务文档进行词性标注、依存关系解析和实体识别,提取出所述待解析任务文档的关键信息;将所述待解析任务文档的关键信息转换为json格式的结构化数据;将所述结构化数据转换为语义向量;将所述语义向量输入预先训练的任务分析模型,得到所述待解析任务文档所对应的任务列表,所述任务列表中包括至少一个任务,每个任务中包括至少一个子任务;其中,所述任务分析模型是以样本任务文档的关键信息所对应的语义向量作为模型的输入,样本任务文档所对应的任务列表为输出进行训练得到的。如此,能够提取出待解析任务文档的关键信息,然后根据待解析任务文档的关键信息解析出符合待解析任务文档需求的任务列表,以便依据任务列表合理有序的完成待解析任务文档中所指示的任务,从而满足解析任务文档的需求。

10、在一个可能的设计中,所述将所述语义向量输入预先训练的任务分析模型,得到所述待解析任务文档所对应的任务列表,包括:

11、将所述语义向量进行归一化处理;

12、将归一化处理后的所述语义向量输入预先训练的任务分析模型,得到所述待解析任务文档所对应的任务列表。

13、在一个可能的设计中,所述任务列表中还包括所述至少一个任务中各任务所需要用到的计算模型信息和/或软件工具信息。

14、在一个可能的设计中,在得到所述待解析任务文档所对应的任务列表之后,所述方法还包括:

15、针对任务列表中的各子任务的任务类型,确定出各子任务的任务处理策略。

16、在一个可能的设计中,所述任务分析模型为bert模型。

17、在一个可能的设计中,所述方法还包括:

18、获取多个样本任务文档;

19、通过对所述多个样本任务文档进行词性标注、依存关系解析和实体识别,提取出所述多个样本任务文档中各样本任务文档的关键信息;

20、将各样本任务文档的关键信息转换为json格式的结构化数据;

21、将各样本任务文档所对应的结构化数据转换为语义向量,得到各样本任务文档所对应的语义向量;

22、将各样本任务文档所对应的语义向量作为模型的输入,各样本任务文档所对应的任务列表作为模型的输出进行训练,得到所述任务分析模型。

23、在一个可能的设计中,在将各样本任务文档所对应的结构化数据转换为语义向量,得到各样本任务文档所对应的语义向量之后,所述方法还包括:

24、计算各样本任务文档所对应的语义向量与知识库中的语义向量之间的相似度;

25、基于与知识库中的语义向量之间的相似度,对各样本任务文档所对应的语义向量进行扩充。

26、第二方面,本发明提供了一种文档任务解析装置,包括:

27、提取单元,用于通过对待解析任务文档进行词性标注、依存关系解析和实体识别,提取出所述待解析任务文档的关键信息;

28、第一转换单元,用于将所述待解析任务文档的关键信息转换为json格式的结构化数据;

29、第二转换单元,用于将所述结构化数据转换为语义向量;

30、运算单元,用于将所述语义向量输入预先训练的任务分析模型,得到所述待解析任务文档所对应的任务列表,所述任务列表中包括至少一个任务,每个任务中包括至少一个子任务;

31、其中,所述任务分析模型是以样本任务文档的关键信息所对应的语义向量作为模型的输入,样本任务文档所对应的任务列表为输出进行训练得到的。

32、第三方面,本发明提供了一种电子设备,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如上述第一方面或第一方面任一可能设计所述的文档任务解析方法。

33、第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行第一方面或第一方面任一可能设计所述的文档任务解析方法。

34、第五方面,本发明提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行如第一方面或第一方面任一可能设计所述的文档任务解析方法。

35、有益效果:

36、本发明提供的文档任务解析方法、装置、电子设备及存储介质,能够提取出待解析任务文档的关键信息,然后根据待解析任务文档的关键信息解析出符合待解析任务文档需求的任务列表,以便依据任务列表合理有序的完成待解析任务文档中所指示的任务,从而满足待解析任务文档的需求,便于实际应用和推广。



技术特征:

1.一种文档任务解析方法,其特征在于,包括:

2.根据权利要求1所述的文档任务解析方法,其特征在于,所述将所述语义向量输入预先训练的任务分析模型,得到所述待解析任务文档所对应的任务列表,包括:

3.根据权利要求1所述的文档任务解析方法,其特征在于,所述任务列表中还包括所述至少一个任务中各任务所需要用到的计算模型信息和/或软件工具信息。

4.根据权利要求1所述的文档任务解析方法,其特征在于,在得到所述待解析任务文档所对应的任务列表之后,所述方法还包括:

5.根据权利要求1所述的文档任务解析方法,其特征在于,所述任务分析模型为bert模型。

6.根据权利要求1所述的文档任务解析方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的文档任务解析方法,其特征在于,在将各样本任务文档所对应的结构化数据转换为语义向量,得到各样本任务文档所对应的语义向量之后,所述方法还包括:

8.一种文档任务解析装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如权利要求1~7任意一项所述的文档任务解析方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1~7任意一项所述的文档任务解析方法。


技术总结
本发明公开一种文档任务解析方法、装置、电子设备及存储介质,涉及文档解析技术领域。该方法包括通过对待解析任务文档进行词性标注、依存关系解析和实体识别,提取待解析任务文档的关键信息;将待解析任务文档的关键信息转换为JSON格式的结构化数据;将结构化数据转换为语义向量;将语义向量输入预先训练的任务分析模型,得到待解析任务文档所对应的任务列表,任务列表中包括至少一个任务,每个任务中包括至少一个子任务;任务分析模型是以样本任务文档的关键信息所对应的语义向量作为模型的输入,样本任务文档所对应的任务列表为输出进行训练得到的。本发明公开的方法、装置、电子设备及存储介质可从待解析任务文档中文档需求的任务列表。

技术研发人员:林小佳,林长春
受保护的技术使用者:广州企元大数据科技有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1823554.html

最新回复(0)