一种基于语音识别的短视频搜索推荐方法、系统及计算机存储介质与流程

专利2022-05-09  87


本发明属于视频搜索推荐技术领域,涉及到一种基于语音识别的短视频搜索推荐方法、系统及计算机存储介质。



背景技术:

随着物联网行业的快速发展,物联网内容的传播方式也逐渐变得多样化,播放时间段内容丰富的短视频也逐渐成为物联网内容的热门传播方式之一,为了提高用户观看体验,需要对用户搜索的短视频进行精准推荐。

现有的短视频搜索推荐方法主要是针对用户输入的文字进行分析和视频推荐,但是由于短视频包含的信息存在多元化,单纯的文字无法实现对短视频的精准推荐和搜索,因此,现有的短视频搜索推荐方法还存在了一定的弊端,一方面,现有的短视频搜索推荐方法搜索的方式具有局限性,无法提高短视频搜索的精准度,一方面,现有的短视频搜索推荐方法无法有效的提高用户待搜索短视频对应的搜索推荐效率,另一方面,现有的现有的短视频搜索推荐方法无法有效的提高用户的搜索体验感。



技术实现要素:

鉴于此,为解决上述背景技术中所提出的问题,现提出一种基于语音识别的短视频搜索推荐方法、系统及计算机存储介质,实现了对短视频的智能搜索和推荐;

本发明的目的可以通过以下技术方案实现:

本发明本发明第一方面提供了一种基于语音识别的短视频搜索推荐方法,该方法包括以下步骤:

s1、语音信息输入:通过语音导入模块将该用户待搜索短视频对应的语音信息进行平台导入,进而获取该用户输入的语音信息;

s2、语音信息转换:通过语音信息转换模块将该用户输入的语音信息转换为平台可识别文本格式,进而获取该用户输入语音对应的文本信息,将该用户输入语音对应的文本信息记为语音文本信息;

s3、搜索模式选取:通过搜索模式选取模块将搜索模式选取指令发送至该用户对应的搜索界面,进而获取该用户对应的搜索模式,其中搜索模式包括模糊搜索和精准搜索;

s4、文本信息处理:通过文本信息处理模块对该用户对应的语音文本信息进行处理,其中文本信息处理包括模糊搜索模式语音文本信息处理和精准搜索模式语音文本信息处理;

s5、短视频信息获取:通过短视频信息获取模块获取该平台各短视频对应的信息,进而获取该平台对应的短视频的数量,将该平台对应的短视频按照预设顺序进行编号,依次标记为1,2,...i,...n;

s6、视频匹配分析:通过数据处理与分析模块将处理的语音文本信息和短视频对应的信息进行匹配筛选,进而获取该平台各短视频与该用户对应语音文本信息的匹配度;

s7、视频发送:通过信息发送模块将该用户对应的视频匹配分析结果发送至该用户对应的视频搜索界面。

优选地,所述语音信息转换的具体过程为:根据该用户输入的语音信息,进而将该用户输入的语音信息进行滤波和增强处理,进而通过语音识别技术将处理后的该用户输入的语音格式转化为平台可识别的文本格式,进而获取该用户对应的语音文本信息。

优选地,所述模糊搜索模式语音文本信息处理的过程包括以下步骤:

a1、根据该用户对应的语音文本信息,进而将语音文本信息中对应的停用词进行过滤,进而获取处理后该用户的文本信息,将处理后的语音文本信息分割为各个单词,进而统计该用户对应文本信息中分割的单词的数量,并将分割的各单词按照预设顺序进行编号,依次标记为1,2,...j,...m,进而构建各分割单词集合f{f1,f2,...fj,...fm},fj表示该用户对应文本信息对应的第j个分割单词;

a2、将该语音文本信息中各分割单词进行相互对比筛选,进而获取各分割词在该用户文本信息出现的次数,并将各分割单词该用户文本信息出现的次数记为单词频率;

a3、根据该语音文本信息中各分割单词对应的频率,进而统计该语音文本信息中各分割单词对应的权重,其计算公式为gr表示该语音文本信息中第r个分割单词对应的权重,fr表示该语音文本信息第r个分割单词对应的频率,f表示数据库中存储的文档的数量,kr表示数据库中包含第r个分割单词对应的文档数量;

a4、根据各分割单词对应的权重,将各分割单词对应的权重分别与关键词对应的标准权重进行对比,若某分割单词对应的权重大于关键词对应的标准权重,则将该分割单词记为目标关键词,统计目标关键词的数量,并获取各目标关键子词对应的编号。

优选地,所述精准搜索模式语音文本信息处理的过程包括以下步骤:

b1、根据获取的该用户对应的语音文本信息,进而将该用户对应的语音文本信息发送至该用户对应的移动终端进行审核和确认;

b2、该用户接收该平台发送的文本信息,进而对该文本信息进行核查,若语音文本信息中存在错误,并对语音文本信息中存在错误的区域进行修改和标记,并将修改和标记的文本信息发送至该平台;

b3、平台获取该用户反馈的修改和标记的语音文本信息,并将该用户反馈的修改和标记的语音文本信息记为确认文本信息,进而将该确认文本信息进行分词,进而获取该确认文本信息对应各分割单词,将该确认文本信息对应的各分割单词按照预设顺序进行编号,依次标记为1,2,...x,...y,进而构建确认文本信息分割单词集合h(h1,h2,...hx,..hy),hx表示该确认文本信息中对应的第x个分割单词;

b4、依据模糊搜索模式该用户语音文本信息各分割单词权重的计算方法获取该确认文本信息各分割单词对应的权重,进而将该确认文本信息中各分割单词对应的权重按照从大到小的顺序进行排序,进而提取该确认文本信息中权重排名前五位的分割单词,将该分割单词记为候选关键词,并将提取的该确认文本信息对应的各候选关键词发送至该用户对应的移动终端;

b5、该用户接收该平台发送的各候选关键词,进而对接收的各候选关键词进行确认,并将确认后的各候选关键词记为确认关键词;

b6、平台接收该用户反馈的各确认关键词,进而统计该用户反馈的确认关键词的数量,并将该用户反馈的确认关键词按照预设顺序进行编号,依次标记为1,2,...u,...v,进而按照各分割单词权重的计算方法统计各确认关键词对应的权重,并构建各确认关键词权重集合q(q1,q2,...qu,...qv),qu表示第u个确认关键词对应的权重。

优选地,所述短视频信息包括短视频对应的关键词数量和各短视频各关键词对应的频率,将各短视频对应的关键词记为关键词,将各短视频各关键词与数据库中存储的文档进行匹配筛选,进而获取数据库中包含各短视频各关键词的文档数量,进而获取各短视频各关键词对应的权重,进而将各短视频对应的关键词按照预设顺序进行编号,依次标记为1,2,...k,...h。

优选地,所述视频匹配分析用于对模糊搜索模式处理的语音文本信息进行视频匹配分析,其具体分析过程为:根据模糊搜索模式处理获取的该语音文本信息对应的目标关键词的数量,进而将该语音文本信息对应的各目标关键词与各短视频对应的各关键词进行匹配筛选,进而统计各短视频对应关键词与该语音文本信息对应目标关键词相同的数量,进而统计各短视频对应的词语匹配度,其计算公式为λd表示第d个短视频对应关键词与该语音文本信息对应目标关键词的匹配度,ed表示第d个短视频对应关键词与该语音文本信息对应目标关键词相同的数量,gd表示第d个短视频对应的关键词的数量,d表示短视频编号,d=1,2,...i,...n。

优选地,所述视频匹配分析用于对精准搜索模式处理的语音文本信息进行视频匹配分析,其具体分析过程为:

c1、根据精准搜索获取模式处理获取的该确认文本信息对应的确认关键词的数量和各确认关键词对应的权重,根据各确认关键词对应的权重,进而将确认文本信息各确认关键词转化为向量形式,并构建确认文本信息向量集合l(l1,l2,...lu,...lv),lu表示该确认文本信息第u个确认关键词对应的向量;

c2、同时获取各短视频对应的关键词对应的数量和各短视频各关键词对应的权重,将各短视频各关键词转化为向量形式,并构建各短视频向量集合l′d(l′d1,l′d2,...l′dk,...l′dh),l′dk表示第d个短视频第k个关键词对应的向量;

c3、根据确认文本信息向量集合和各短视频向量集合,进而统计各短视频对应的综合匹配度,其计算公式为γd表示第d个短视频对应的综合匹配度,lt表示该确认文本信息第t个关键词对应的向量,l′dt′表示第d个短视频第t′个关键词对应的向量,t表示确认关键词编号,t=1,2,...u,...v,t′表示各短视频关键词编号,t′=1,2,...k,...h;

c4、根据统计的各短视频对应的综合匹配度,进而将各短视频对应的综合匹配度按照从大到小的顺序进行排序,进而提取综合匹配度排名第一位的短视频,并将该短视频作为优选推荐短视频,进而提取该优选推荐短视频对应的编号。

优选地,所述视频发送包括模糊搜索模式视频发送和精准搜索模式视频发送,当用户选取的搜索模式为模糊搜索时,根据模糊搜索获取的各短视频按照各短视频对应的推荐顺序,进而获取生成各短视频对应的视频链接,并将各短视频对应的视频链接按照各短视频对应的推荐顺序依次发送至该用户对应的搜索界面,当用户选取的搜索模式为精准搜索时,进而根据该优选推荐短视频对应的编号,并生成该优选推荐短视频对应的视频链接,并将该优选推荐短视频对应的视频链接发送至该用户对应的搜索界面,进而完成视频发送。

本发明第二方面提供了一种基于语音识别的短视频搜索推荐系统,所述数据处理与分析模块分别与文本信息处理模块、短视频信息获取模块、数据库和信息发送模块连接,语音信息转换模块分别与语音导入模块和搜索模式选取模块连接,文本信息处理模块与搜索模式选取模块连接。

本发明第三方面提供了一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明任一项所述的方法。

本发明的有益效果:

(1)本发明提供的一种基于语音识别的短视频搜索推荐方法,通过对该用户输入的语音进行分模式搜索处理和分析,有效的解决了现有的短视频搜索推荐方法搜索的方式具有局限性进而无法提高短视频搜索的精准度的问题,进而有效的提高了用户待搜索短视频对应的搜索推荐效率,同时也大大的提高了用户的搜索体验感。

(2)本发明在搜索模式选取,通过设置模糊搜索模式和精准搜索模式,进而大大的满足了用户的不同搜索需求,同时也大大的提高了用户输入语音与待搜索视频的关联性,其中,模糊搜索模式能在一定程度上大大的扩展了搜索范围,能够满足用户对同类扩展短视频的搜索需求,精准搜索模式通过对通过处理的语音文本信息进行二次确认,大大的提高了对应该用户待搜索短视频对应推荐的准确性。

(3)本发明实施例在语音信息转换,通过将用户输入的语音格式转化为平台可识别的文本格式,进而进而为后续对该用户待搜索短视频的匹配与搜索提供了有力的信息基础,进而大大的提高了短视频搜索的效率和搜索的结果的参考性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明方法实施步骤图;

图2为本发明系统模块连接示意图。

具体实施方式

下面将结合本发明实施以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

请参阅图1所示,本发明第一方面提供了一种基于语音识别的短视频搜索推荐方法,该方法包括以下步骤:

s1、语音信息输入:通过语音导入模块将该用户待搜索短视频对应的语音信息进行平台导入,进而获取该用户输入的语音信息;

s2、语音信息转换:通过语音信息转换模块将该用户输入的语音信息转换为平台可识别文本格式,进而获取该用户输入语音对应的文本信息,将该用户输入语音对应的文本信息记为语音文本信息;

其中,所述语音信息转换的具体过程为:根据该用户输入的语音信息,进而将该用户输入的语音信息进行滤波和增强处理,进而通过语音识别技术将处理后的该用户输入的语音格式转化为平台可识别的文本格式,进而获取该用户对应的语音文本信息。

本发明实施例通过将用户输入的语音格式转化为平台可识别的文本格式,进而进而为后续对该用户待搜索短视频的匹配与搜索提供了有力的信息基础,进而大大的提高了短视频搜索的效率和搜索的结果的参考性。

s3、搜索模式选取:通过搜索模式选取模块将搜索模式选取指令发送至该用户对应的搜索界面,进而获取该用户对应的搜索模式,其中搜索模式包括模糊搜索和精准搜索;

本发明实施例通过设置模糊搜索模式和精准搜索模式,进而大大的满足了用户不同的搜索需求,同时也大大的提高了用户输入语音与待搜索视频的关联性,其中,模糊搜索模式能在一定程度上大大的扩展了搜索范围,能够满足用户对同类扩展短视频的搜索需求,精准搜索模式通过对通过处理的语音文本信息进行二次确认,大大的提高了对应该用户待搜索短视频对应推荐的准确性。

s4、文本信息处理:通过文本信息处理模块对该用户对应的语音文本信息进行处理,其中文本信息处理包括模糊搜索模式语音文本信息处理和精准搜索模式语音文本信息处理;

具体地,所述模糊搜索模式语音文本信息处理的过程包括以下步骤:

a1、根据该用户对应的语音文本信息,进而将语音文本信息中对应的停用词进行过滤,进而获取处理后该用户的文本信息,将处理后的语音文本信息分割为各个单词,进而统计该用户对应文本信息中分割的单词的数量,并将分割的各单词按照预设顺序进行编号,依次标记为1,2,...j,...m,进而构建各分割单词集合f{f1,f2,...fj,...fm},fj表示该用户对应文本信息对应的第j个分割单词;

a2、将该语音文本信息中各分割单词进行相互对比筛选,进而获取各分割词在该用户文本信息出现的次数,并将各分割单词该用户文本信息出现的次数记为单词频率;

a3、根据该语音文本信息中各分割单词对应的频率,进而统计该语音文本信息中各分割单词对应的权重,其计算公式为gr表示该语音文本信息中第r个分割单词对应的权重,fr表示该语音文本信息第r个分割单词对应的频率,f表示数据库中存储的文档的数量,kr表示数据库中包含第r个分割单词对应的文档数量;

a4、根据各分割单词对应的权重,将各分割单词对应的权重分别与关键词对应的标准权重进行对比,若某分割单词对应的权重大于关键词对应的标准权重,则将该分割单词记为目标关键词,统计目标关键词的数量,并获取各目标关键子词对应的编号。

具体地,所述精准搜索模式语音文本信息处理的过程包括以下步骤:

b1、根据获取的该用户对应的语音文本信息,进而将该用户对应的语音文本信息发送至该用户对应的移动终端进行审核和确认;

b2、该用户接收该平台发送的文本信息,进而对该文本信息进行核查,若语音文本信息中存在错误,并对语音文本信息中存在错误的区域进行修改和标记,并将修改和标记的文本信息发送至该平台;

其中,用户修改语音文本信息的修改方式包括语音修改、替换修改和手动修改。

在具体实施例中,语音修改方式通过用户将存在错误的的文本区域的语句进行重新输入语音,替换修改是将存在错误的字进行文本检索和替换,手动修改是通过将错处的区域进行删减和修改。

b3、平台获取该用户反馈的修改和标记的语音文本信息,并将该用户反馈的修改和标记的语音文本信息记为确认文本信息,进而将该确认文本信息进行分词,进而获取该确认文本信息对应各分割单词,将该确认文本信息对应的各分割单词按照预设顺序进行编号,依次标记为1,2,...x,...y,进而构建确认文本信息分割单词集合h(h1,h2,...hx,..hy),hx表示该确认文本信息中对应的第x个分割单词;

b4、依据模糊搜索模式该用户语音文本信息各分割单词权重的计算方法获取该确认文本信息各分割单词对应的权重,进而将该确认文本信息中各分割单词对应的权重按照从大到小的顺序进行排序,进而提取该确认文本信息中权重排名前五位的分割单词,将该分割单词记为候选关键词,并将提取的该确认文本信息对应的各候选关键词发送至该用户对应的移动终端;

b5、该用户接收该平台发送的各候选关键词,进而对接收的各候选关键词进行确认,并将确认后的各候选关键词记为确认关键词;

b6、平台接收该用户反馈的各确认关键词,进而统计该用户反馈的确认关键词的数量,并将该用户反馈的确认关键词按照预设顺序进行编号,依次标记为1,2,...u,...v,进而按照各分割单词权重的计算方法统计各确认关键词对应的权重,并构建各确认关键词权重集合q(q1,q2,...qu,...qv),qu表示第u个确认关键词对应的权重。

本发明实施例在对该用户对应的语音文本信息进行处理时,通过将该语音文本信息进行分词和提取关键词,进而为后续对短视频的匹配搜索提供了重要的信息基础,大大的提高了对该用户待搜索短视频的搜索效率和搜索的精准度。

s5、短视频信息获取:通过短视频信息获取模块获取该平台各短视频对应的信息,进而获取该平台对应的短视频的数量,将该平台对应的短视频按照预设顺序进行编号,依次标记为1,2,...i,...n;

具体地,短视频信息包括短视频对应的关键词数量和各短视频各关键词对应的频率,将各短视频对应的关键词记为关键词,将各短视频各关键词与数据库中存储的文档进行匹配筛选,进而获取数据库中包含各短视频各关键词的文档数量,进而获取各短视频各关键词对应的权重,进而将各短视频对应的关键词按照预设顺序进行编号,依次标记为1,2,...k,...h。

s6、视频匹配分析:通过数据处理与分析模块将处理的语音文本信息和短视频对应的信息进行匹配筛选,进而获取该平台各短视频与该用户对应语音文本信息的匹配度;

具体地,所述视频匹配分析用于对模糊搜索模式处理的语音文本信息进行视频匹配分析,其具体分析过程为:根据模糊搜索模式处理获取的该语音文本信息对应的目标关键词的数量,进而将该语音文本信息对应的各目标关键词与各短视频对应的各关键词进行匹配筛选,进而统计各短视频对应关键词与该语音文本信息对应目标关键词相同的数量,进而统计各短视频对应的词语匹配度,其计算公式为λd表示第d个短视频对应关键词与该语音文本信息对应目标关键词的匹配度,ed表示第d个短视频对应关键词与该语音文本信息对应目标关键词相同的数量,gd表示第d个短视频对应的关键词的数量,d表示短视频编号,d=1,2,...i,...n。

具体地,所述视频匹配分析用于对精准搜索模式处理的语音文本信息进行视频匹配分析,其具体分析过程为:

c1、根据精准搜索获取模式处理获取的该确认文本信息对应的确认关键词的数量和各确认关键词对应的权重,根据各确认关键词对应的权重,进而将确认文本信息各确认关键词转化为向量形式,并构建确认文本信息向量集合l(l1,l2,...lu,...lv),lu表示该确认文本信息第u个确认关键词对应的向量;

c2、同时获取各短视频对应的关键词对应的数量和各短视频各关键词对应的权重,将各短视频各关键词转化为向量形式,并构建各短视频向量集合l′d(l′d1,l′d2,...l′dk,...l′dh),l′dk表示第d个短视频第k个关键词对应的向量;

c3、根据确认文本信息向量集合和各短视频向量集合,进而统计各短视频对应的综合匹配度,其计算公式为γd表示第d个短视频对应的综合匹配度,lt表示该确认文本信息第t个关键词对应的向量,l′dt′表示第d个短视频第t′个关键词对应的向量,t表示确认关键词编号,t=1,2,...u,...v,t′表示各短视频关键词编号,t′=1,2,...k,...h;

c4、根据统计的各短视频对应的综合匹配度,进而将各短视频对应的综合匹配度按照从大到小的顺序进行排序,进而提取综合匹配度排名第一位的短视频,并将该短视频作为优选推荐短视频,进而提取该优选推荐短视频对应的编号。

本发明实施例通过对模糊搜索模式和精准搜索模式进行视频匹配分析,有效的解决了现有的短视频搜索推荐方法搜索的方式具有局限性进而无法提高短视频搜索的精准度的问题,进而有效的提高了用户待搜索短视频对应的搜索推荐效率,同时也大大的提高了用户的搜索体验感。

s7、视频发送:通过信息发送模块将该用户对应的视频匹配分析结果发送至该用户对应的视频搜索界面。

具体地,所述视频发送包括模糊搜索模式视频发送和精准搜索模式视频发送,当用户选取的搜索模式为模糊搜索时,根据模糊搜索获取的各短视频按照各短视频对应的推荐顺序,进而获取生成各短视频对应的视频链接,并将各短视频对应的视频链接按照各短视频对应的推荐顺序依次发送至该用户对应的搜索界面,当用户选取的搜索模式为精准搜索时,进而根据该优选推荐短视频对应的编号,并生成该优选推荐短视频对应的视频链接,并将该优选推荐短视频对应的视频链接发送至该用户对应的搜索界面,进而完成视频发送。

请参阅图2所示,本发明第二方面提供了一种基于语音识别的短视频搜索推荐系统,所述数据处理与分析模块分别与文本信息处理模块、短视频信息获取模块、数据库和信息发送模块连接,语音信息转换模块分别与语音导入模块和搜索模式选取模块连接,文本信息处理模块与搜索模式选取模块连接。

其中,所述数据库用于存储各类型的文本信息和关键词对应的标准权重。

本发明实施例中,所述各类型文本信息包括科学文本信息、地理文本信息等,进而将数据库和存储的文本类型按照预设顺序进行编号,依次标记为1,2,...p,...q,进而获取各类型文本信息对应的数量,通过存储各类型对应的文本信息,进而便于对该用户对应的语音文本信息进行关键词提取,文本类型和各类型文本数量越多,关键词提取的精准度越高。

本发明第三方面提供了一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明任一项所述的方法。

以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。


技术特征:

1.一种基于语音识别的短视频搜索推荐方法,其特征在于:该方法包括以下步骤:

s1、语音信息输入:通过语音导入模块将该用户待搜索短视频对应的语音信息进行平台导入,进而获取该用户输入的语音信息;

s2、语音信息转换:通过语音信息转换模块将该用户输入的语音信息转换为平台可识别文本格式,进而获取该用户输入语音对应的文本信息,将该用户输入语音对应的文本信息记为语音文本信息;

s3、搜索模式选取:通过搜索模式选取模块将搜索模式选取指令发送至该用户对应的搜索界面,进而获取该用户对应的搜索模式,其中搜索模式包括模糊搜索和精准搜索;

s4、文本信息处理:通过文本信息处理模块对该用户对应的语音文本信息进行处理,其中文本信息处理包括模糊搜索模式语音文本信息处理和精准搜索模式语音文本信息处理;

s5、短视频信息获取:通过短视频信息获取模块获取该平台各短视频对应的信息,进而获取该平台对应的短视频的数量,将该平台对应的短视频按照预设顺序进行编号,依次标记为1,2,...i,...n;

s6、视频匹配分析:通过数据处理与分析模块将处理的语音文本信息和短视频对应的信息进行匹配筛选,进而获取该平台各短视频与该用户对应语音文本信息的匹配度;

s7、视频发送:通过信息发送模块将该用户对应的视频匹配分析结果发送至该用户对应的视频搜索界面。

2.根据权利要求1所述的一种基于语音识别的短视频搜索推荐方法,其特征在于:所述语音信息转换的具体过程为:根据该用户输入的语音信息,进而将该用户输入的语音信息进行滤波和增强处理,进而通过语音识别技术将处理后的该用户输入的语音格式转化为平台可识别的文本格式,进而获取该用户对应的语音文本信息。

3.根据权利要求1所述的一种基于语音识别的短视频搜索推荐方法,其特征在于:所述模糊搜索模式语音文本信息处理的过程包括以下步骤:

a1、根据该用户对应的语音文本信息,进而将语音文本信息中对应的停用词进行过滤,进而获取处理后该用户的文本信息,将处理后的语音文本信息分割为各个单词,进而统计该用户对应文本信息中分割的单词的数量,并将分割的各单词按照预设顺序进行编号,依次标记为1,2,...j,...m,进而构建各分割单词集合f{f1,f2,...fj,...fm},fj表示该用户对应文本信息对应的第j个分割单词;

a2、将该语音文本信息中各分割单词进行相互对比筛选,进而获取各分割词在该用户文本信息出现的次数,并将各分割单词该用户文本信息出现的次数记为单词频率;

a3、根据该语音文本信息中各分割单词对应的频率,进而统计该语音文本信息中各分割单词对应的权重,其计算公式为gr表示该语音文本信息中第r个分割单词对应的权重,fr表示该语音文本信息第r个分割单词对应的频率,f表示数据库中存储的文档的数量,kr表示数据库中包含第r个分割单词对应的文档数量;

a4、根据各分割单词对应的权重,将各分割单词对应的权重分别与关键词对应的标准权重进行对比,若某分割单词对应的权重大于关键词对应的标准权重,则将该分割单词记为目标关键词,统计目标关键词的数量,并获取各目标关键子词对应的编号。

4.根据权利要求1所述的一种基于语音识别的短视频搜索推荐方法,其特征在于:所述精准搜索模式语音文本信息处理的过程包括以下步骤:

b1、根据获取的该用户对应的语音文本信息,进而将该用户对应的语音文本信息发送至该用户对应的移动终端进行审核和确认;

b2、该用户接收该平台发送的文本信息,进而对该文本信息进行核查,若语音文本信息中存在错误,并对语音文本信息中存在错误的区域进行修改和标记,并将修改和标记的文本信息发送至该平台;

b3、平台获取该用户反馈的修改和标记的语音文本信息,并将该用户反馈的修改和标记的语音文本信息记为确认文本信息,进而将该确认文本信息进行分词,进而获取该确认文本信息对应各分割单词,将该确认文本信息对应的各分割单词按照预设顺序进行编号,依次标记为1,2,...x,...y,进而构建确认文本信息分割单词集合h(h1,h2,...hx,..hy),hx表示该确认文本信息中对应的第x个分割单词;

b4、依据模糊搜索模式该用户语音文本信息各分割单词权重的计算方法获取该确认文本信息各分割单词对应的权重,进而将该确认文本信息中各分割单词对应的权重按照从大到小的顺序进行排序,进而提取该确认文本信息中权重排名前五位的分割单词,将该分割单词记为候选关键词,并将提取的该确认文本信息对应的各候选关键词发送至该用户对应的移动终端;

b5、该用户接收该平台发送的各候选关键词,进而对接收的各候选关键词进行确认,并将确认后的各候选关键词记为确认关键词;

b6、平台接收该用户反馈的各确认关键词,进而统计该用户反馈的确认关键词的数量,并将该用户反馈的确认关键词按照预设顺序进行编号,依次标记为1,2,...u,...v,进而按照各分割单词权重的计算方法统计各确认关键词对应的权重,并构建各确认关键词权重集合q(q1,q2,...qu,...qv),qu表示第u个确认关键词对应的权重。

5.根据权利要求1所述的一种基于语音识别的短视频搜索推荐方法,其特征在于:所述短视频信息包括短视频对应的关键词数量和各短视频各关键词对应的频率,将各短视频对应的关键词记为关键词,将各短视频各关键词与数据库中存储的文档进行匹配筛选,进而获取数据库中包含各短视频各关键词的文档数量,进而获取各短视频各关键词对应的权重,进而将各短视频对应的关键词按照预设顺序进行编号,依次标记为1,2,...k,...h。

6.根据权利要求1所述的一种基于语音识别的短视频搜索推荐方法,其特征在于:所述视频匹配分析用于对模糊搜索模式处理的语音文本信息进行视频匹配分析,其具体分析过程为:根据模糊搜索模式处理获取的该语音文本信息对应的目标关键词的数量,进而将该语音文本信息对应的各目标关键词与各短视频对应的各关键词进行匹配筛选,进而统计各短视频对应关键词与该语音文本信息对应目标关键词相同的数量,进而统计各短视频对应的词语匹配度,其计算公式为λd表示第d个短视频对应关键词与该语音文本信息对应目标关键词的匹配度,ed表示第d个短视频对应关键词与该语音文本信息对应目标关键词相同的数量,gd表示第d个短视频对应的关键词的数量,d表示短视频编号,d=1,2,...i,...n。

7.根据权利要求1所述的一种基于语音识别的短视频搜索推荐方法,其特征在于:所述视频匹配分析用于对精准搜索模式处理的语音文本信息进行视频匹配分析,其具体分析过程为:

c1、根据精准搜索获取模式处理获取的该确认文本信息对应的确认关键词的数量和各确认关键词对应的权重,根据各确认关键词对应的权重,进而将确认文本信息各确认关键词转化为向量形式,并构建确认文本信息向量集合l(l1,l2,...lu,...lv),lu表示该确认文本信息第u个确认关键词对应的向量;

c2、同时获取各短视频对应的关键词对应的数量和各短视频各关键词对应的权重,将各短视频各关键词转化为向量形式,并构建各短视频向量集合l′d(l′d1,l′d2,...l′dk,...l′dh),l′dk表示第d个短视频第k个关键词对应的向量;

c3、根据确认文本信息向量集合和各短视频向量集合,进而统计各短视频对应的综合匹配度,其计算公式为γd表示第d个短视频对应的综合匹配度,lt表示该确认文本信息第t个关键词对应的向量,l′dt′表示第d个短视频第t′个关键词对应的向量,t表示确认关键词编号,t=1,2,...u,...v,t′表示各短视频关键词编号,t′=1,2,...k,...h;

c4、根据统计的各短视频对应的综合匹配度,进而将各短视频对应的综合匹配度按照从大到小的顺序进行排序,进而提取综合匹配度排名第一位的短视频,并将该短视频作为优选推荐短视频,进而提取该优选推荐短视频对应的编号。

8.根据权利要求1所述的一种基于语音识别的短视频搜索推荐方法,其特征在于:所述视频发送包括模糊检索模式视频发送和精准检索模式视频发送,当用户选取的搜索模式为模糊搜索时,根据模糊搜索获取的各短视频按照各短视频对应的推荐顺序,进而获取生成各短视频对应的视频链接,并将各短视频对应的视频链接按照各短视频对应的推荐顺序依次发送至该用户对应的搜索界面,当用户选取的搜索模式为精准搜索时,进而根据该优选推荐短视频对应的编号,并生成该优选推荐短视频对应的视频链接,并将该优选推荐短视频对应的视频链接发送至该用户对应的搜索界面,进而完成视频发送。

9.一种基于语音识别的短视频搜索推荐系统,其特征在于:所述数据处理与分析模块分别与文本信息处理模块、短视频信息获取模块、数据库和信息发送模块连接,语音信息转换模块分别与语音导入模块和搜索模式选取模块连接,文本信息处理模块与搜索模式选取模块连接。

10.一种计算机存储介质,其特征在于:所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1-8任一项所述的方法。

技术总结
本发明公开提供的一种基于语音识别的短视频搜索推荐方法、系统及计算机存储介质。该基于语音识别的短视频搜索推荐方法包括:将该用户待搜索短视频对应的语音信息进行平台导入;将该用户输入的语音信息转换为平台可识别文本格式;将搜索模式选取指令发送至该用户对应的搜索界面,获取用户寻选取的搜索模式;对该用户对应的语音文本信息进行处理;获取该平台各短视频对应的信息;将处理的语音文本信息和短视频对应的信息进行匹配筛选;进而通过对该用户输入的语音进行分模式搜索处理和分析,有效的解决了现有的短视频搜索推荐方法搜索的方式具有局限性的问题,大大的提高了用户待搜索短视频对应的搜索推荐效率。

技术研发人员:孔祥兰
受保护的技术使用者:武汉亿融信科科技有限公司
技术研发日:2021.06.08
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-8756.html

最新回复(0)