信息录入辅助方法、装置、电子设备及存储介质与流程

专利2022-05-09  74


本发明涉及软件技术领域,更具体地说,涉及一种信息录入辅助方法、装置、电子设备及存储介质。



背景技术:

随着计算机技术的普及,大量信息需要录入到计算机中。但长期录入信息,难免会出现手误导致信息录入错误的情况,从而给组织或企业带来巨大损失。



技术实现要素:

有鉴于此,为解决上述问题,本发明提供一种信息录入辅助方法、装置、电子设备及存储介质,技术方案如下:

本发明一方面提供一种信息录入辅助方法,所述方法包括:

采集录入者的脑电波信号,并对所述脑电波信号进行预处理;

将预处理后的脑电波信号翻译为第一文本信息;

利用所述第一文本信息对所述录入者所录入的第二文本信息进行修正。

优选的,所述对所述脑电波信号进行预处理,包括:

对所述脑电波信号进行滤波处理;

对滤波处理后的脑电波信号进行降采样处理;

对降采样处理后的脑电波信号进行归一化处理。

优选的,所述将预处理后的脑电波信号翻译为第一文本信息,包括:

调取文本翻译模型,所述文本翻译模型是以预设的脑电波信号为样本,以对所述样本的文本预测结果趋近于所述样本的文本标注结果为目标,对深度神经网络训练得到的;

将所述预处理后的脑电波信号输入至所述文本翻译模型,并获取所述文本翻译模型所输出的所述第一文本信息。

优选的,所述深度神经网络包括:

连续小波变换层、cnn自编码器、逆连续小波变换层、rnn编码器和rnn解码器。

优选的,所述利用所述第一文本信息对所述录入者所录入的第二文本信息进行修正,包括:

根据所述脑电波信号的采集时间,将所述第一文本信息转换为第一时间序列;

根据所述第二文本信息的录入时间,将所述第二文本信息转换为第二时间序列;

计算所述第一时间序列和所述第二时间序列的相似程度;

如果所述相似程度满足对应的修正条件,输出所述第一文本信息,以使所述录入者基于所述第一文本信息修正所述第二文本信息。

优选的,所述计算所述第一时间序列和所述第二时间序列的相似程度,包括:

将所述第一时间序列和所述第二时间序列划分到多个时段下,一个时段对应一个第一子时间序列和一个第二子时间序列,所述第一子时间序列为所述第一时间序列的部分序列,所述第二子时间序列为所述第二时间序列的部分序列;

针对所述多个时段中的每个时段,计算该时段下的第一子时间序列和第二子时间序列的相似程度;

相应的,如果所述相似程度满足对应的修正条件,输出所述第一文本信息,包括:

如果该时段对应的相似程度满足所述修正条件,输出该时段下的第一子时间序列所对应的文本信息。

本发明另一方面提供一种信息录入辅助装置,所述装置包括:

采集模块,用于采集录入者的脑电波信号,并对所述脑电波信号进行预处理;

翻译模块,用于将预处理后的脑电波信号翻译为第一文本信息;

修正模块,用于利用所述第一文本信息对所述录入者所录入的第二文本信息进行修正。

优选的,所述翻译模块,具体用于:

调取文本翻译模型,所述文本翻译模型是以预设的脑电波信号为样本,以对所述样本的文本预测结果趋近于所述样本的文本标注结果为目标,对深度神经网络训练得到的;将所述预处理后的脑电波信号输入至所述文本翻译模型,并获取所述文本翻译模型所输出的所述第一文本信息。

本发明另一方面提供一种电子设备,所述电子设备包括:至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述存储器存储的程序,所述程序用于实现任意一项所述的信息录入辅助方法。

本发明另一方面提供一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行任意一项所述的信息录入辅助方法。

相较于现有技术,本发明实现的有益效果为:

本发明提供一种信息录入辅助方法、装置、电子设备及存储介质,能够采集录入者的脑电波信号,并在预处理之后翻译为相应的文本信息,进而基于该文本信息对录入者实际录入的文本信息做出修正。基于本发明能够实现文本的辅助录入,减少甚至避免信息录入出现错误的概率,提高录入准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的信息录入辅助方法的方法流程图;

图2为本发明实施例提供的信息录入辅助方法的部分方法流程图;

图3为本发明实施例提供的信息录入辅助方法的另一部分方法流程图;

图4为本发明实施例提供的信息录入辅助方法的又一部分方法流程图;

图5为本发明实施例提供的信息录入辅助装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

参见图1所示的方法流程图,本发明实施例提供一种信息录入辅助方法,该方法包括如下步骤:

s10,采集录入者的脑电波信号,并对脑电波信号进行预处理。

本发明实施例中,脑电波,即eeg,是一种使用电生理指标记录大脑活动的方法,大脑在活动时,大量神经元同步发生的突触后电位经总和后形成的。它记录大脑活动时的电波变化,是脑神经细胞的电生理活动在大脑皮层或头皮表面的总体反应。

录入者在录入文本信息的过程中,可以通过佩戴电极帽来采集其的脑电波信号,一般来说,电极帽包含多个电极,分别布置于录入者脑部的不同位置,以采集相应位置的脑电波信号。

并且,为保证脑电波信号的有效性,本发明实施例中对脑电波信号可以先进行信号放大、再做滤波,以将已放大的脑电波信号的杂波、干扰波滤除。

为提高脑电波信号的可用性,具体实现过程中,步骤s10中“对脑电波信号进行预处理”可以采用如下步骤,方法流程图如图2所示:

s101,对脑电波信号进行滤波处理。

本发明实施例中,滤波是将信号中特定波段频率滤除的操作,是抑制和防止干扰的一项重要措施。发明人通过验证发现,与本发明相关的脑电波信号的频率主要位于70hz-150hz之内,因此可以采用70hz-150hz的hann窗带通滤波器,滤除无关的频段。

s102,对滤波处理后的脑电波信号进行降采样处理。

本发明实施例中,降采样是指在数字信号处理领域中的一种降低信号采样率的过程,采样率则是指每秒从连续信号中提取并组成离散信号的采样个数。

为了提高计算效率保证计算的实时性,本发明对脑电波信号进行降采样处理。过分的降采样会出现频带混叠现象,发明人通过验证发现,本发明中降采样率降为200hz较为适宜。

需要说明的是,本发明实施例中,滤波和降采样的顺序不能调换,一旦先降采样再滤波,则无法降到200hz或会出现频带混叠现象。

s103,对降采样处理后的脑电波信号进行归一化处理。

本发明实施例中,归一化是指将脑电波信号的幅值映射到(-1, 1)之间。为了防止偶然因素对脑电波的干扰,因此采用归一化的操作。需要说明的是,如果将归一化与降采样步骤颠倒,将浪费大量算力、降低计算效率。

s20,将预处理后的脑电波信号翻译为第一文本信息。

本发明实施例中,本发明实施例中可以使用一个文本翻译模型对脑电波信号进行处理,得到使用脑电波信号所翻译出来的文本信息,即第一文本信息。

具体实现过程中,步骤s20“将预处理后的脑电波信号翻译为第一文本信息”可以采用如下步骤,方法流程图如图3所示:

s201,调取文本翻译模型,文本翻译模型是以预设的脑电波信号为样本,以对样本的文本预测结果趋近于样本的文本标注结果为目标,对深度神经网络训练得到的。

s202,将预处理后的脑电波信号输入至文本翻译模型,并获取文本翻译模型所输出的第一文本信息。

本发明实施例中,训练文本翻译模型时,作为其基础模型的深度学习网络(dnn)可以由连续小波变换算法、卷积神经网络(cnn)与循环神经网络(rnn)三种主要算法组合形成。因此文本翻译模型即为dnn模型,使用dnn模型对脑电波信号进行编码和解码,从而得到第一文本信息。需要说明的是,文本翻译模型的训练过程属于传统的机器学习训练过程,在此不再赘述。

再者,为适应本发明的应用场景,本发明实施例还进一步搭建深度神经网络,具体的,深度神经网络包括:连续小波变换层、cnn自编码器、逆连续小波变换层、rnn编码器和rnn解码器。

本发明实施例中,电极帽具有多个电极,因此采集到的脑电波信号为多通道的,因此本发明可以通过遗传算法从多个通道中的选择出一个通道的脑电波信号作为本次迭代训练深度神经网络的样本。

具体的,按照采集时间,脑电波信号可以以时间序列的方式所存在,因此,连续小波变换层可以将该时序信号通过连续小波变换转为时频信号,进而,cnn自编码器可以去除连续小波变换层所输出的时频信号中的噪声,进一步,逆连续小波变换层通过逆连续小波变换将cnn自编码器所输出的时频信号转换为时序信号,再进一步,rnn编码器将逆连续小波变换层所输出的时序信号转换为时序的语言特征,最后,rnn解码器将rnn编码器所输出的语言特征翻译为语言。

需要说明的是:1)编码与解码,是一个相对概念,本质上都是从信息的一种表示形式转化为另一种表示形式。

2)对于使用遗传算法筛选输入通道。在多通道的脑电波分析过程中,并不是所有的通道均与目标任务相关,大量的通道使用手工筛选的方法是不可靠且不可能完成的。因此采用遗传算法进行特征筛选。

3)使用cnn自编码器滤除时频谱噪声。由于语言的因素是有限的,因此理应对应有限的脑电的时频谱状态,cnn是一种良好的图像识别模型,因此对于二维谱有较好的处理性能,故通过cnn编码器将时频谱识别为音节特征,再通过cnn解码器讲音节特征转化为噪声较低的时频谱。

4)rnn相对cnn有更好的时序信号处理能力,因此进一步使用rnn编码器将时序信号翻译成时序语言特征,再用rnn解码器将语言时序特征转化为语言文本。

s30,利用第一文本信息对录入者所录入的第二文本信息进行修正。

本发明实施例中,对于录入者通过诸如键盘、触摸屏等输入介质所录入的文本信息,即第二文本信息,可以通过与第一文本信息进行对比来确定录入者的想法与实际录入是否存在差异。如果两者存在差异,则可以提醒录入者,以保证录入者能够及时修改所录入的内容,减少录入结束后再修改的工作量。实际应用中,可以将第二文本信息显示于录入者的输入框一侧,从而提示录入者修改。

当然,如果录入者的想法与实际录入不存在差异,则说明无需辅助录入,此时不执行任何操作。

具体实现过程中,步骤s30“利用第一文本信息对录入者所录入的第二文本信息进行修正”可以采用如下步骤,方法流程图如图4所示:

s301,根据脑电波信号的采集时间,将第一文本信息转换为第一时间序列。

本发明实施例中,对于电极帽所采集的脑电波信号,可以按照其采集时间的先后次序对其进行文本翻译,以得到不同采集时间下的第一文本信息。由此,可以按照采集时间,将第一文本信息转换为相应的时间序列,即第一时间序列。该第一时间序列的横坐标为时间、纵坐标为第一文本信息。

s302,根据第二文本信息的录入时间,将第二文本信息转换为第二时间序列。

本发明实施例中,对于录入者所实际录入的第二文本信息,可以按照其录入时间,将第二文本信息转换为相应的时间序列,即第二时间序列。该第二时间序列的横坐标为时间、纵坐标为第二文本信息。

s303,计算第一时间序列和第二时间序列的相似程度。

本发明实施例中,可以以当前时间为基准,以一定时间窗口内的第一时间序列和第二时间序列进行相似程度的计算。即分别对第一时间序列和第二时间序列中采集时间位于该时间窗口内的子序列进行截取,进一步对从第一时间序列中所截取的时间序列和从第二时间序列中所截取的时间序列计算相似程度,这就可以有效减少数据处理量。

并且,在计算相似程度时,可以采用dwt(dynamictimewarping),即动态时间规整算法来计算两个时间序列的相似程度。

需要说明的是,本发明实施例中的时间序列,是指同一统计指标的数值按其发生的时间先后顺序排列而成的数列。

s304,如果相似程度满足对应的修正条件,输出第一文本信息,以使录入者基于第一文本信息修正第二文本信息。

本发明实施例中,如果相似程度小于对应的阈值,则确定第一文本信息和第二文本信息在时间窗口内存在差异,此时可以将位于该时间窗口内的部分第一文本信息输出于录入者的输入框一侧,从而提示录入者修改。

具体实现过程中,步骤s303“计算第一时间序列和第二时间序列的相似程度”可以采用如下步骤:

将第一时间序列和第二时间序列划分到多个时段下,一个时段对应一个第一子时间序列和一个第二子时间序列,第一子时间序列为第一时间序列的部分序列,第二子时间序列为第二时间序列的部分序列;针对多个时段中的每个时段,计算该时段下的第一子时间序列和第二子时间序列的相似程度。

本发明实施例中,无论是第一时间序列,还是第二时间序列,对于所截取的、位于时间窗口内的时间序列,还可以进一步对其进行划分,从而划分到不同时段下,比如可以按照规定的时间间隔来划分,再比如可以按照标点符号来划分,本发明对此不做限定。第一时间序列对应有多个时段下的第一子时间序列,第二时间序列对应有多个时段下的第二子时间序列。

对于同属于一个时段内的第一子时间序列和第二子时间序列,本发明实施例可以采用动态时间规整算法来计算两者的相似程度。

如果某个时段下的第一子时间序列和第二子时间序列的相似程度小于对应的阈值,则可以将该时段下第一子时间序列所对应部分第一文本信息输出于录入者的输入框一侧,从而提示录入者修改。

本发明实施例提供的信息录入辅助方法,能够采集录入者的脑电波信号,并在预处理之后翻译为相应的文本信息,进而基于该文本信息对录入者实际录入的文本信息做出修正。基于本发明能够实现文本的辅助录入,减少甚至避免信息录入出现错误的概率,提高录入准确性。

基于上述实施例提供的信息录入辅助方法,本发明实施例则对应提供一种执行上述信息录入辅助方法的装置,该装置的结构示意图如图5所示,包括:

采集模块10,用于采集录入者的脑电波信号,并对脑电波信号进行预处理;

翻译模块20,用于将预处理后的脑电波信号翻译为第一文本信息;

修正模块30,用于利用第一文本信息对录入者所录入的第二文本信息进行修正。

可选的,用于对脑电波信号进行预处理的采集模块10,具体用于:

对脑电波信号进行滤波处理;对滤波处理后的脑电波信号进行降采样处理;对降采样处理后的脑电波信号进行归一化处理。

可选的,翻译模块20,具体用于:

调取文本翻译模型,文本翻译模型是以预设的脑电波信号为样本,以对样本的文本预测结果趋近于样本的文本标注结果为目标,对深度神经网络训练得到的;将预处理后的脑电波信号输入至文本翻译模型,并获取文本翻译模型所输出的第一文本信息。

可选的,深度神经网络包括:

连续小波变换层、cnn自编码器、逆连续小波变换层、rnn编码器和rnn解码器。

可选的,修正模块30,具体用于:

根据脑电波信号的采集时间,将第一文本信息转换为第一时间序列;根据第二文本信息的录入时间,将第二文本信息转换为第二时间序列;计算第一时间序列和第二时间序列的相似程度;如果相似程度满足对应的修正条件,输出第一文本信息,以使录入者基于第一文本信息修正第二文本信息。

可选的,用于计算第一时间序列和第二时间序列的相似程度的修正模块30,具体用于:

将第一时间序列和第二时间序列划分到多个时段下,一个时段对应一个第一子时间序列和一个第二子时间序列,第一子时间序列为第一时间序列的部分序列,第二子时间序列为第二时间序列的部分序列;针对多个时段中的每个时段,计算该时段下的第一子时间序列和第二子时间序列的相似程度;

相应的,用于如果相似程度满足对应的修正条件,输出第一文本信息的修正模块30,具体用于:

如果该时段对应的相似程度满足修正条件,输出该时段下的第一子时间序列所对应的文本信息。

需要说明的是,本发明实施例中信息录入辅助装置的各模块的细化功能,可以参见信息录入辅助方法实施例对应公开部分,在此不再赘述。

本发明实施例提供的信息录入辅助装置,能够采集录入者的脑电波信号,并在预处理之后翻译为相应的文本信息,进而基于该文本信息对录入者实际录入的文本信息做出修正。基于本发明能够实现文本的辅助录入,减少甚至避免信息录入出现错误的概率,提高录入准确性。

基于上述实施例提供的信息录入辅助方法,本发明实施例还提供一种电子设备,该电子设备包括:至少一个存储器和至少一个处理器;存储器存储有程序,处理器调用存储器存储的程序,程序用于实现信息录入辅助方法。

基于上述实施例提供的信息录入辅助方法,本发明实施例还提供一种存储介质,该存储介质中存储有计算机可执行指令,计算机可执行指令用于执行信息录入辅助方法。

以上对本发明所提供的一种信息录入辅助方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素,或者是还包括为这些过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。


技术特征:

1.一种信息录入辅助方法,其特征在于,所述方法包括:

采集录入者的脑电波信号,并对所述脑电波信号进行预处理;

将预处理后的脑电波信号翻译为第一文本信息;

利用所述第一文本信息对所述录入者所录入的第二文本信息进行修正。

2.根据权利要求1所述的方法,其特征在于,所述对所述脑电波信号进行预处理,包括:

对所述脑电波信号进行滤波处理;

对滤波处理后的脑电波信号进行降采样处理;

对降采样处理后的脑电波信号进行归一化处理。

3.根据权利要求1所述的方法,其特征在于,所述将预处理后的脑电波信号翻译为第一文本信息,包括:

调取文本翻译模型,所述文本翻译模型是以预设的脑电波信号为样本,以对所述样本的文本预测结果趋近于所述样本的文本标注结果为目标,对深度神经网络训练得到的;

将所述预处理后的脑电波信号输入至所述文本翻译模型,并获取所述文本翻译模型所输出的所述第一文本信息。

4.根据权利要求3所述的方法,其特征在于,所述深度神经网络包括:

连续小波变换层、cnn自编码器、逆连续小波变换层、rnn编码器和rnn解码器。

5.根据权利要求1所述的方法,其特征在于,所述利用所述第一文本信息对所述录入者所录入的第二文本信息进行修正,包括:

根据所述脑电波信号的采集时间,将所述第一文本信息转换为第一时间序列;

根据所述第二文本信息的录入时间,将所述第二文本信息转换为第二时间序列;

计算所述第一时间序列和所述第二时间序列的相似程度;

如果所述相似程度满足对应的修正条件,输出所述第一文本信息,以使所述录入者基于所述第一文本信息修正所述第二文本信息。

6.根据权利要求5所述的方法,其特征在于,所述计算所述第一时间序列和所述第二时间序列的相似程度,包括:

将所述第一时间序列和所述第二时间序列划分到多个时段下,一个时段对应一个第一子时间序列和一个第二子时间序列,所述第一子时间序列为所述第一时间序列的部分序列,所述第二子时间序列为所述第二时间序列的部分序列;

针对所述多个时段中的每个时段,计算该时段下的第一子时间序列和第二子时间序列的相似程度;

相应的,如果所述相似程度满足对应的修正条件,输出所述第一文本信息,包括:

如果该时段对应的相似程度满足所述修正条件,输出该时段下的第一子时间序列所对应的文本信息。

7.一种信息录入辅助装置,其特征在于,所述装置包括:

采集模块,用于采集录入者的脑电波信号,并对所述脑电波信号进行预处理;

翻译模块,用于将预处理后的脑电波信号翻译为第一文本信息;

修正模块,用于利用所述第一文本信息对所述录入者所录入的第二文本信息进行修正。

8.根据权利要求7所述的装置,其特征在于,所述翻译模块,具体用于:

调取文本翻译模型,所述文本翻译模型是以预设的脑电波信号为样本,以对所述样本的文本预测结果趋近于所述样本的文本标注结果为目标,对深度神经网络训练得到的;将所述预处理后的脑电波信号输入至所述文本翻译模型,并获取所述文本翻译模型所输出的所述第一文本信息。

9.一种电子设备,其特征在于,所述电子设备包括:至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述存储器存储的程序,所述程序用于实现权利要求1-6任意一项所述的信息录入辅助方法。

10.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1-6任意一项所述的信息录入辅助方法。

技术总结
本发明提供一种信息录入辅助方法、装置、电子设备及存储介质,能够采集录入者的脑电波信号,并在预处理之后翻译为相应的文本信息,进而基于该文本信息对录入者实际录入的文本信息做出修正。基于本发明能够实现文本的辅助录入,减少甚至避免信息录入出现错误的概率,提高录入准确性。

技术研发人员:黄文东;胡小明;温雨霖;吴兴华;赵尊晨;朱明微;刘沁;邝智颖;贠博严;黄柱邦
受保护的技术使用者:中国银行股份有限公司
技术研发日:2021.06.09
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-7787.html

最新回复(0)