本发明涉及个性化文本摘要,尤其涉及一种基于prompt的个性化文本摘要生成方法及系统。
背景技术:
1、文本自动摘要是人工智能、信息检索和自然语言处理领域中一个重要的研究方向,摘要可以帮助用户高效地查找所需的信息,或者简明扼要地传达文章的主要内容,还可以帮助用户快速回顾已经阅读过的文章,文本自动摘要主要分为抽取式文本摘要、生成式文本摘要以及融合抽取式和生成式的文本摘要,抽取式摘要根据不同的指标直接从源文本中选择几个句子作为摘要,此类摘要无法概括全文的内容;生成式摘要可以生成不存在于源文本中但向用户传递相似信息的单词,此类摘要可能将源文本中的特定名词如地点、人名替换,改变了源文本的内容;在融合抽取式和生成式摘要的方法中,通过引入生成概率机制来决定是要拷贝源文本中的单词,还是从词汇表中选取表达相似意思的单词,另外还有一些方法首先选择源文本中几个句子,然后将所选句子组成新文本作为摘要生成模块的输入,以生成融合抽取式和生成式的摘要。这些方法针对缺乏上下文信息而造成语义模糊和用词规范性不高的部分文本无法精准生成个性化的文本摘要。
技术实现思路
1、有鉴于此,本发明提出一种基于prompt的个性化文本摘要生成方法及系统,可以解决现有技术所存在的对语义模糊和用词规范性不高的部分文本无法精准生成个性化文本摘要的缺陷。
2、本发明的技术方案是这样实现的:
3、一种基于prompt的个性化文本摘要生成方法,具体包括:
4、获取缺乏上下文信息的文本数据;
5、将所述文本数据输入prompt模块进行主题识别,得到主题关键字;
6、依据长短期记忆模型对主题关键字进行编码,得到主题关键字隐藏层状态;
7、将主题关键字隐藏层状态融合到注意力机制中,生成个性化的文本摘要。
8、作为所述基于prompt的个性化文本摘要生成方法的进一步可选方案,所述将所述文本数据输入prompt模块进行主题识别,得到主题关键字,具体包括:
9、获取每条文本数据的向量信息;
10、将每条文本数据向量信息映射到不同子空间中,得到权重矩阵;
11、依据多头自注意力机制对权重矩阵进行预处理,得到预处理后的权重矩阵;
12、使用softmax函数对预处理后的权重矩阵进行计算,得到注意力分布权重;
13、对注意力分布权重进行求和,得到每个向量的权重值;
14、选择出最大权重值的向量作为每条文本数据的关键字,得到主题关键字。
15、作为所述基于prompt的个性化文本摘要生成方法的进一步可选方案,所述将主题关键字隐藏层状态融合到注意力机制中,生成个性化的文本摘要,具体包括:
16、依据注意力模型对主题关键字隐藏层状态进行处理,得到主题关键字信息;
17、依据指针生成器网络模型对主题关键字信息进行处理,生成个性化的文本摘要。
18、作为所述基于prompt的个性化文本摘要生成方法的进一步可选方案,所述依据注意力模型对主题关键字隐藏层状态进行处理,得到主题关键字信息,具体包括:
19、获取解码器的隐藏层状态和注意力模型的隐藏状态,以及相对应的参数矩阵;
20、依据解码器的隐藏层状态、注意力模型的隐藏状态和相对应的参数矩阵,以及主题关键字隐藏层状态,得到主题关键字信息。
21、一种基于prompt的个性化文本摘要生成系统,包括:
22、第一获取模块,用于获取缺乏上下文信息的文本数据;
23、主题识别模块,用于将所述文本数据输入prompt模块进行主题识别,得到主题关键字;
24、编码模块,用于依据长短期记忆模型对主题关键字进行编码,得到主题关键字隐藏层状态;
25、融合模块,用于将主题关键字隐藏层状态融合到注意力机制中,生成个性化的文本摘要。
26、作为所述基于prompt的个性化文本摘要生成系统的进一步可选方案,所述主题识别模块包括:
27、第二获取模块,用于获取每条文本数据的向量信息;
28、映射模块,用于将每条文本数据向量信息映射到不同子空间中,得到权重矩阵;
29、预处理模块,用于依据多头自注意力机制对权重矩阵进行预处理,得到预处理后的权重矩阵;
30、权重计算模块,用于使用softmax函数对预处理后的权重矩阵进行计算,得到注意力分布权重;
31、求和模块,用于对注意力分布权重进行求和,得到每个向量的权重值;
32、选择模块,用于选择出最大权重值的向量作为每条文本数据的关键字,得到主题关键字。
33、作为所述基于prompt的个性化文本摘要生成系统的进一步可选方案,所述融合模块包括:
34、处理模块,用于依据注意力模型对主题关键字隐藏层状态进行处理,得到主题关键字信息;
35、生成模块,用于依据指针生成器网络模型对主题关键字信息进行处理,生成个性化的文本摘要。
36、作为所述基于prompt的个性化文本摘要生成系统的进一步可选方案,所述处理模块包括:
37、第三获取模块,用于获取解码器的隐藏层状态和注意力模型的隐藏状态,以及相对应的参数矩阵;
38、执行模块,用于依据解码器的隐藏层状态、注意力模型的隐藏状态和相对应的参数矩阵,以及主题关键字隐藏层状态,得到主题关键字信息。
39、一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项基于prompt的个性化文本摘要生成方法的步骤。
40、一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项基于prompt的个性化文本摘要生成方法的步骤。
41、本发明的有益效果是:通过获取缺乏上下文信息的文本数据,将所述文本数据输入prompt模块进行主题识别,得到主题关键字,能够有效在精简的同时保留缺乏上下文信息的文本数据的核心信息,同时,通过依据长短期记忆模型对主题关键字进行编码,得到主题关键字隐藏层状态,将主题关键字隐藏层状态融合到注意力机制中,能够有效生成个性化的文本摘要,从而解决了现有技术所存在的对语义模糊和用词规范性不高的部分文本无法精准生成个性化文本摘要的缺陷。
1.一种基于prompt的个性化文本摘要生成方法,其特征在于,具体包括:
2.根据权利要求1所述的一种基于prompt的个性化文本摘要生成方法,其特征在于,所述将所述文本数据输入prompt模块进行主题识别,得到主题关键字,具体包括:
3.根据权利要求2所述的一种基于prompt的个性化文本摘要生成方法,其特征在于,所述将主题关键字隐藏层状态融合到注意力机制中,生成个性化的文本摘要,具体包括:
4.根据权利要求3所述的一种基于prompt的个性化文本摘要生成方法,其特征在于,所述依据注意力模型对主题关键字隐藏层状态进行处理,得到主题关键字信息,具体包括:
5.一种基于prompt的个性化文本摘要生成系统,其特征在于,包括:
6.根据权利要求5所述的一种基于prompt的个性化文本摘要生成系统,其特征在于,所述主题识别模块包括:
7.根据权利要求6所述的一种基于prompt的个性化文本摘要生成系统,其特征在于,所述融合模块包括:
8.根据权利要求7所述的一种基于prompt的个性化文本摘要生成系统,其特征在于,所述处理模块包括:
9.一种计算设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-4中任意一项基于prompt的个性化文本摘要生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4中任意一项基于prompt的个性化文本摘要生成方法的步骤。