1.本发明属于关系抽取技术领域,尤其涉及一种知识点推荐方法、装置、电子设备及存储介质。
背景技术:
2.目前,随着人工智能技术在社会各个领域中的广泛应用,利用信息抽取技术对课程教学资料进行关键信息抽取从而构建课程学习的知识图谱,是当前课程信息化建设的研究热点。其中,关系抽取是信息抽取技术的重要环节,它是指对文本信息建模自动抽取出实体对之间的语义关系,提取出有效的语义知识,是知识图谱构建中极为关键的部分。
3.近年来,深度学习的发展为实体关系抽取任务提供了有力的支持,根据数据集标注量级的差异,深度学习的实体关系抽取任务分为有监督和远程监督两类,有监督的学习方法能够抽取有效的实体关系,其准确率和召回率都很不错,但是这类方法对标注数据十分依赖,而标记数据耗时耗力。
4.因此,亟需提供一种能够采用一种融合注意力机制与人工相结合的方法,从识别出已有的知识点扩充出高质量的知识点,用作高质量的知识库或者预测的知识点,或者作为基于知识点权重的推荐视频依据的技术方案。
技术实现要素:
5.为了解决上述问题,本发明提供一种知识点推荐方法,包括:
6.获取客户端播放的当前教研视频,所述当前教研视频包括:多个具有试题的图像帧;
7.按照所述当前教研视频中的多个具有试题的图像帧的播放顺序依次将图像帧中的试题转换为对应的多个文本信息;
8.依次提取每个所述文本信息中的特征信息集,所述特征信息集包括多个当前知识点;
9.根据全部所述特征信息集从预先建立的知识分类库中获取关联的至少一个关联知识点;
10.根据全部所述特征信息集和全部所述关联知识点确定推荐知识点。
11.进一步地、所述依次提取每个所述文本信息中的特征信息集,包括:
12.依次提取所述文本信息中的关键词作为所述特征信息集;
13.和/或、依次对所述文本信息进行分词,去除停用词后剩下的词作为所述特征信息集;
14.和/或、依次对所述文本信息进行分词,去除标点后剩下的词作为所述特征信息集。
15.进一步地、还包括:
16.根据所述推荐知识点推送对应的推荐教研视频。
17.进一步地、所述根据全部所述特征信息集和全部所述关联知识点确定推荐知识点,包括:
18.按照预设选取顺序在全部所述特征信息集中选取当前特征信息集;
19.依次对所述当前特征信息集中的多个当前知识点转换得到对应的词向量;
20.依次对所述当前特征信息集中的多个词向量进行注意力计算,得到每个当前知识点的和值和注意力分数;
21.将所述注意力得分和对应的词向量相乘得到加权值;
22.对全部所述加权值进行归一化处理得到每个当前知识点的对应等级;
23.根据选取等级最高的当前知识点与所述关联知识点确定推荐知识点。
24.进一步地、所述知识分类库的建立方法包括:
25.获取全部教研视频;
26.提取每个教研视频的知识点;
27.根据全部知识点构建知识点图谱集,所述知识点图谱集包括多种类别的知识点图谱,每个知识点图谱包括多个推荐知识点。
28.进一步地、所述根据选取等级最高的当前知识点与所述关联知识点确定推荐知识点,包括:
29.比较所述等级最高的当前知识点和所述关联知识点;
30.当所述等级最高的当前知识点和所述关联知识点不同时,根据所述关联知识点确定推荐知识点。
31.另一方面,本发明提供一种知识点推荐装置,包括:
32.当前教研视频获取模块,被配置为执行获取客户端播放的当前教研视频,所述当前教研视频包括:多个具有试题的图像帧;
33.转换模块,被配置为执行按照所述当前教研视频中的多个具有试题的图像帧的播放顺序依次将图像帧中的试题转换为对应的多个文本信息;
34.特征信息集获取模块,被配置为执行依次提取每个所述文本信息中的特征信息集,所述特征信息集包括多个当前知识点;
35.关联知识点获取模块,被配置为执行根据全部所述特征信息集从预先建立的知识分类库中获取关联的至少一个关联知识点;
36.推荐知识点确定模块,被配置为执行根据全部所述特征信息集和全部所述关联知识点确定推荐知识点。
37.进一步地、所述特征信息集获取模块,包括:
38.第一特征信息集提取单元,被配置为执行提取所述文本信息中的关键词作为所述特征信息集;
39.和/或、第二特征信息集提取单元,被配置为执行依次对所述文本信息进行分词,去除停用词后剩下的词作为所述特征信息集;
40.和/或、第三特征信息集提取单元,被配置为执行依次对所述文本信息进行分词,去除标点后剩下的词作为所述特征信息集。
41.另一方面,本发明提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至
少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述所述的知识点推荐方法。
42.再一方面,本发明提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述所述的知识点推荐方法。
43.由于上述技术方案,本发明具有以下有益效果:
44.本发明使用注意力机制来对视频中提取的知识点的重要程度进行打分,进行知识点推荐的时候可以根据知识点的权重进行相关关联视频的推荐,推荐的视频更加符合用户需求。
45.使用该方法可以根据视频的类别,寻找相关学科的知识库,根据知识点的权重不同,从已有知识库中扩充相关的知识点,扩充知识库内容,从而缓解知识库数据量规模小的问题。
附图说明
46.为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
47.图1为本说明书实施例提供的一种知识点推荐系统的应用示意图;
48.图2是本发明实施例提供的一种知识点推荐方法的流程图;
49.图3为本发明实施例提供的一种初始化权重输入示意图;
50.图4为本发明实施例提供的一种注意力得分示意图;
51.图5为本发明实施例提供的另一种知识点推荐方法的流程图;
52.图6是本发明实施例提供的一种知识点推荐装置的框图;
53.图7是本发明实施例提供的一种电子设备的结构示意图;
54.图8是本发明实施例提供的一种存储介质的结构示意图;
55.其中,10
‑
客户端,20
‑
服务器,11
‑
当前教研视频获取模块,12
‑
转换模块,13
‑
特征信息集获取模块,14
‑
关联知识点获取模块,15
‑
推荐知识点确定模块。
具体实施方式
56.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
57.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于
清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
58.请参阅图1,图1为本说明书实施例提供的一种知识点推荐系统的应用示意图。该系统可以包括客户端10和服务器20,客户端中安装有应用程序,应用程序可以与服务器进行数据交互,以用于实现本申请的知识点推荐方法。如图1所示,客户端可以用于提供面向应用用户的下载或更新处理。客户端提供面向应用用户的下载或更新的方式可以包括但不限于应用程序方式或网页方式等。
59.本申请实施例中,该知识点推荐系统中的服务器可以包括独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content deliverynetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。在一个示例中,服务器为分布式系统时,该分布式系统可以为区块链系统。
60.本申请实施例中,所述客户端可以包括智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,ar)/虚拟现实 (virtual reality,vr)设备、智能可穿戴设备等类型的实体设备。本申请实施例中客户端上运行的操作系统可以包括但不限于安卓系统、ios系统、linux、windows 等。
61.需要说明的是,以下图中示出的是一种可能的步骤顺序,实际上并不限定必须严格按照此顺序。有些步骤可以在互不依赖的情况下并行执行。
62.以下介绍本发明的一种知识点推荐方法,请参考说明书附图2,其示出了本发明实施例提供的一种知识点推荐方法的流程,如图2所示,该方法的执行主体可以是上述服务器20,所述方法可以包括:
63.s102:获取客户端播放的当前教研视频,所述当前教研视频包括:多个具有试题的图像帧;
64.在具体的实施过程中,当前教研视频由图像帧序列组成,当前教研视频可以是未经过压缩编码的视频文件也开业是经过压缩编码的视频文件,未经过压缩编码的当前教研视频原始图像在编码前,每一帧的数据量均较大。经过压缩编码后,视频文件或视频流中的仅关键帧的数据量较大,而差别帧的数据量较小。
65.需要说明的是,根据压缩算法的不同,差别帧也可以是b帧,即双向估计差别帧,由于区分p帧和b帧对本发明的实际效果没有实际影响,因此,为方便描述,在后续实施例中,仅以p帧为例表示差别帧,而在实际应用中,根据压缩算法的不同,差别帧既可以是p帧也可以是b帧)。
66.可以理解的是,当前教研视频可以是教师的授课教案或教师制作的授课材料,其中可以包括关于当前授课的试题。
67.s104、按照所述当前教研视频中的多个具有试题的图像帧的播放顺序依次将图像帧中的试题转换为对应的多个文本信息。
68.在具体的实施过程中,可以对提取的多个具有试题的图像帧进行灰度图转换,得到原始灰度图;
69.将所述原始灰度图进行对比度增强,得到增强灰度图;
70.将所述增强灰度图进行分割处理,得到初始灰度图集;
71.将所述初始灰度图集进行图像增强,得到所述标准灰度图。
72.其中,对提取的多个具有试题的图像帧进行灰度图转换,得到原始灰度图,包括:
73.将多个具有试题的图像帧中的所有像素输入至一个灰度值转换公式中进行灰度值转换,根据转换后的灰度值生成所述原始灰度图。
74.其中,所述灰度值转换公式为:
75.0.30*r 0.59*g 0.11*b
76.其中r,g,b为所述包含文字信息的图像中的像素的三分量。
77.所述对比度增强指的是所述增强灰度图中像素点亮度最大值与最小值之间的对比。
78.进一步地,本发明实施例可以采用对比度拉伸方法对所述原始灰度图进行对比度增强。
79.所述对比度拉伸方法也叫作灰度拉伸。本发明实施例使用对比度拉伸方法中的分段线性变换函数,根据实际需求针对所述原始灰度图中特定区域进行灰度拉伸,进而增强所述原始灰度图的对比度,得到增强灰度图。
80.详细地,所述分段线性变换函数公式如下所示:
81.d
b
=f(d
a
)=a*d
a
b
82.其中a为线性斜率,b为d
b
在y轴上的截距,d
a
代表输入所述原始灰度图的灰度值,d
b
代表输出所述增强灰度图的灰度值。如果a>1,此时输出的所述灰度图对比度相比原图像是增强的。如果a<1,此时输出的所述灰度图对比度相比原图像是削弱的。
83.进一步地,本发明实施例利用下述方法对所述增强灰度图进行分割处理,得到初始灰度图集:
84.预设初始灰度值t为前景与背景的分割阈值,根据所述初始灰度值t计算得到所述增强灰度图中的前景像素点和背景像素点;
85.计算所述前景像素点的数量占图像比例w0,平均灰度u0;
86.及计算所述背景像素点的数量占图像比例为w1,平均灰度为u1;
87.得到所述增强灰度图的总平均灰度:u=w0*u0 w1*u1,以及前景和背景灰度的方差:g=t*w0*(u0‑
u)*(u0‑
u) w1*(u1‑
u)*(u1‑
u)=t*w0*w1*(u0‑
u1)*(u0‑
u1);
88.重复执行上述的步骤,直到当所述方差g达到最大值时,认为此时前景和背景差异最大,此时的g即为最佳分割阈值;
89.根据所述最佳分割阈值将所述增强灰度图分割为前景和背景两部分,得到所述初始灰度图集。
90.上述方法得到的初始灰度图集中,对背景与前景,即图像背景和文字之间的区别并不明显,本发明实施例进一步对所述初始灰度图集进行图像增强,得到所述标准灰度图。
91.详细的,所述将所述标准灰度图进行图像增强,包括:
92.将所述初始灰度图集和输入至下述公式中进行计算,得到所述标准灰度图 s(x,y):
93.s(x,y)=r(x,y)
×
l(x,y)
94.其中,r(x,y)表示初始灰度图集中前景部分,l(x,y)表示初始灰度图集中背景部分。
95.进一步地,本发明所述预设图像识别技为ocr(optical character recognition,光学文字识别)图像识别技术。
96.所述ocr图像识别技术通过图像中文字与背景中的不同像素,判定出文字的具体形状,根据判定出的文字形状对所述文字进行文字识别,得到一组或多组文本信息。
97.s106、依次提取每个所述文本信息中的特征信息集,所述特征信息集包括多个当前知识点。
98.在上述实施例基础上,本说明书一个实施例中,所述依次提取每个所述文本信息中的特征信息集,包括:
99.依次提取所述文本信息中的关键词作为所述特征信息集;
100.和/或、依次对所述文本信息进行分词,去除停用词后剩下的词作为所述特征信息集;
101.和/或、依次对所述文本信息进行分词,去除标点后剩下的词作为所述特征信息集。
102.在具体的实施过程中,可以通过提取所述文本集的关键词作为所述特征信息集;和/或可通过对所述文本集进行分词,去除停用词后剩下的词作为所述特征信息集;和/或可通过和/或、对所述文本集进行分词,去除标点后剩下的词作为所述特征信息集。对输入文档进行分词得到多个词、每个词的词性和每个词与其相邻词的词性组合;计算每个词的重要程度;计算每个词的词性的权重;计算每个词与其相邻词的词性组合的权重;以及对于每个词,根据其重要程度、词性的权重以及词性组合的权重来提取该词的文本特征。
103.示例地、本步骤是为了抽取由视频转化成的文本信息的知识点特征得到特征信息集,为后续对文本做深度语义理解使用。对于给定的视频文本vi,抽取文本信息f
ti
={f1,f2,
…
,f
n
}。
104.文本包括内容、知识点特征如下表所示。首先抽取文本中的信息。将试题的文本中的中文进行切割,切割后将中文使用带有学科词典和停用词的分词器进行分割。然后将分词结果按顺序一起组成如下表所示的unigram特征。
[0105][0106]
其中,学科词典为含有学科专有词的词典。例如,机构词典含有各类机构名称,如盐城幼儿师范等。停用词指分词过程中需过滤掉的无用词。例如:的、若等。
[0107]
s108、根据全部所述特征信息集从预先建立的知识分类库中获取关联的至少一个关联知识点。
[0108]
在具体的实施过程中,所述知识分类库的建立方法包括:
[0109]
获取全部教研视频;
[0110]
提取每个教研视频的知识点;
[0111]
根据全部知识点构建知识点图谱集,所述知识点图谱集包括多种类别的知识点图
谱,每个知识点图谱包括多个推荐知识点。
[0112]
在具体的实施过程中,知识分类库可以是存储在服务器20中,知识分类库中包括大量的教研视频,每个教研视频可以有对应的领域类别,如土木工程类、电气类等。
[0113]
可以理解的是,知识图谱(knowledge graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。因此可以根据特征信息集中的多个当前知识点获取关联的至少一个关联知识点。不同关联知识点在知识图谱中的类别可以不同。
[0114]
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。
[0115]
在知识分类库建立时可根据每个教研视频的知识点构建知识点图谱集,为了获取教育知识点经验,以供在模型中加入教育知识点经验。对于文本中经常出现的知识点,可以人工将其添加值知识图谱中,并且加入unigram特征的形式。
[0116]
s110、根据全部所述特征信息集和全部所述关联知识点确定推荐知识点。
[0117]
在具体的实施过程中,所述根据全部所述特征信息集和全部所述关联知识点确定推荐知识点,可以包括:
[0118]
按照预设选取顺序在全部所述特征信息集中选取当前特征信息集;
[0119]
在具体的实施过程中,可以依次对每个特征信息集进行注意力计算。预设选取顺序在本说明书实施例中不做具体限定,可以是教研视频播放顺序等。
[0120]
依次对所述当前特征信息集中的多个当前知识点转换得到对应的词向量;
[0121]
依次对所述当前特征信息集中的多个词向量进行注意力计算,得到每个当前知识点的和值和注意力分数;
[0122]
将所述注意力得分和对应的词向量相乘得到加权值;
[0123]
对全部所述加权值进行归一化处理得到每个当前知识点的对应等级;
[0124]
根据选取等级最高的当前知识点与所述关联知识点确定推荐知识点。
[0125]
示例地:
[0126]
一、准备输入:从3个输入开始,每个输入的尺寸为4。如输入1:[1,0,1,0],输入2:[0,2,0,1],输入3:[1,1,1,1]
[0127]
二、初始化权重:初始化权重每个输入必须具有三个表示形式,图3为本发明实施例提供的一种初始化权重输入示意图,如图3所示。这些表示形式称为键,查询和值。对于此示例,让我们假设这些表示的尺寸为3。因为每个输入的尺寸为4,这意味着每组权重都必须为4
×
3。
[0128]
每个输入必须具有三个表示形式。这些表示形式称为键,查询和值。对于此示例,让我们假设这些表示的尺寸为3。因为每个输入的尺寸为4,这意味着每组权重都必须为4
×
3。
[0129]
为了获得这些表示形式,每个输入都将与一组键的权重,一组查询的权重和一组值的权重相乘。在示例中,如下“初始化”三组权重。
[0130]
键的权重:1[0,0,1]
[0131]
2[1,1,0]
[0132]
3[0,1,0]
[0133]
4[1,1,0]
[0134]
查询权重:1[1,0,1]
[0135]
2[1,0,0]
[0136]
3[0,0,1]
[0137]
4[0,1,1]
[0138]
键的权重:1[0,2,0]
[0139]
2[0,3,0]
[0140]
3[1,0,3]
[0141]
4[1,1,0]
[0142]
注意:在神经网络设置中,这些权重通常是小数,使用适当的随机分布(如高斯,xavier和kaiming分布)随机初始化。
[0143]
三、派生密钥,查询和值:派生键、查询和值现在我们有了三组权重,让我们实际获取每个输入的键、查询和值表示形式。输入1的键表示:
[0144]
现在有了三组权重,让实际获取每个输入的键、查询和值表示形式。输入1 的键表示:
[0145]
[0,0,1]
[0146]
[1,0,1,0]*[1,1,0]=[0,1,1]
[0147]
[0,1,0]
[0148]
[1,1,0]
[0149]
使用相同的权重集获取输入2的键表示:
[0150]
[0,0,1]
[0151]
[1,1,1,1]*[1,1,0]=[2,3,1]
[0152]
[0,1,0]
[0153]
[1,1,0]
[0154]
一种更快的方法是对上述操作进行矢量化处理。
[0155]
每个输入的派生键表示为:
[0156]
[0,0,1]
[0157]
[1,0,1,0][1,1,0][0,1,1]
[0158]
[0,2,0,2]*[0,1,0]=[4,4,0]
[0159]
[1,1,1,1][1,1,0][2,3,1]
[0160]
进行同样的操作,以获取每个输入的值表示形式;
[0161]
每个输入的派生值表示为:
[0162]
[0,2,0]
[0163]
[1,0,1,0][0,3,0][1,2,3]
[0164]
[0,2,0,2]*[1,0,3]=[2,8,0]
[0165]
[1,1,1,1][1,1,0][2,6,3]
[0166]
最后是查询表示形式,从每个输入中派生查询表示为:
[0167]
[1,0,1]
[0168]
[1,0,1,0][1,0,0][1,0,2]
[0169]
[0,2,0,2]*[0,0,1]=[2,2,2]
[0170]
[1,1,1,1][1,1,0][2,1,3]
[0171]
四、计算输入1的注意力得分,图4为本发明实施例提供的一种注意力得分示意图,如4所示:
[0172]
为了获得注意力得分,我们首先在输入1的查询与所有键(包括其自身) 之间取一个点积。由于有3个关键表示(因为我们有3个输入),因此我们获得3个注意力得分。
[0173]
五、计算softmax:softmax注意分数,在所有注意力得分中使用softmax (蓝色):softmax([2,4,4])=[0.0,0.5,0.5]
[0174]
六、将分数与值相乘:
[0175]
从乘数值和分数)得出的加权值表示:
[0176]
每个经过softmax的输入的最大注意力得分乘以其相应的值,得到3个对齐向量)。
[0177]
1:0.0*[1、2、3]=[0.0、0.0、0.0]
[0178]
2:0.5*[2、8、0]=[1.0、4.0、0.0]
[0179]
3:0.5*[2、6、3]=[1.0、3.0、1.5]
[0180]
七、总和加权值以获得输出1;
[0181]
将所有加权值相加以得出输出1;
[0182]
取所有加权值并将它们按元素求和:
[0183]
[0.0,0.0,0.0]
[0184]
[1.0,4.0,0.0]
[0185]
[1.0,3.0,1.5]
[0186]
‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑
[0187]
=[2.0,7.0,1.5]
[0188]
所得向量[2.0、7.0、1.5](深绿色)为输出1,该输出基于输入1与所有其他键(包括其自身)交互的查询表示形式。
[0189]
八、重复输入2和输入3,直至全部计算出加权值。
[0190]
在确定每个当前知识点的加权值后,可以根据对应的加权值确定加权值最高(等级最高)的当前知识点。
[0191]
示例地、本步是为了对文本进行深度语义理解,并且由于m个知识点的文本信息对推荐的知识点并不是同等重要,因此需要计算信息对推荐知识点的重要程度。
[0192]
例如,对于上述表中的试题,知识点“盐城幼儿师范”、“大数据云平台”和“云计算技术”要比其他知识点的教研信息重要。计算教研信息对试题重要程度具体的方式是使用注意力机制(attention_model)。首先将试题文本信息和教研经验都转换成深层语义表示,然后通过注意力机制计算该知识点对视频推荐的重要程度w={w1,w2,
…
,w
m
}。其中w∈r
m
,m为知识点个数。
[0193]
对抽取的试题文本信息的unigram使用google开源的word2vec转换为 wordembedding。设给定信息的unigram为t
i
={f1,f2,
…
,f
n
},经过wordembedding之后,该
文本信息表示为te
ti
={te1,te2,
…
, te3},准备输入该文本信息,初始化权重,派生密钥,查询和值,计算输入的注意力得分,计算softmax,将分数与值相乘,总和加权值以获得输出。最终得到的输出要将知识点的重要程度分成一级、二级和三级知识点。比如大数据的技术,可以分成下表几类的级别。
[0194][0195]
在一些可能的实施例中,所述根据选取等级最高的当前知识点与所述关联知识点确定推荐知识点,包括:
[0196]
比较所述等级最高的当前知识点和所述关联知识点;
[0197]
当所述等级最高的当前知识点和所述关联知识点不同时,根据所述关联知识点确定推荐知识点。
[0198]
本说明书实施例中文本中语义信息和专家的经验的互相约束。不仅能对文本进行深度语义理解,通过注意力机制计算该文本信息对推荐的重要程度,并且决策和教研经验互相约束来决定最终的推荐知识点。
[0199]
在上述实施例基础上,本说明书一个实施例中,图5为本发明实施例提供的另一种知识点推荐方法的流程图,如图5所示,方法还包括:
[0200]
s302、根据所述推荐知识点推送对应的推荐教研视频。
[0201]
在具体的实施过程中,由于本发明采用unigram模板抽取自然语言文本中的知识点,使用注意力机制将相关的知识点进行权重排名,可以根据知识点的权重不同,推荐不同的视频。可以理解的是,教研视频有对应的知识点,在推荐过程中可以通过匹配推荐知识点和教研视频有对应的知识点的方式进行视频推荐。
[0202]
本发明使用注意力机制来对视频中提取的知识点的重要程度进行打分,进行知识点推荐的时候可以根据知识点的权重进行相关关联视频的推荐,推荐的视频更加符合用户
需求。
[0203]
使用该方法可以根据视频的类别,寻找相关学科的知识库,根据知识点的权重不同,从已有知识库中扩充相关的知识点,扩充知识库内容,从而缓解知识库数据量规模小的问题。
[0204]
另一方面,本发明实施例还提供一种知识点推荐装置,如图6所示,图6是本发明实施例提供的一种知识点推荐装置的框图,包括:
[0205]
当前教研视频获取模块11,被配置为执行获取客户端播放的当前教研视频,所述当前教研视频包括:多个具有试题的图像帧;
[0206]
转换模块12,被配置为执行按照所述当前教研视频中的多个具有试题的图像帧的播放顺序依次将图像帧中的试题转换为对应的多个文本信息;
[0207]
特征信息集获取模块13,被配置为执行依次提取每个所述文本信息中的特征信息集,所述特征信息集包括多个当前知识点;
[0208]
关联知识点获取模块14,被配置为执行根据全部所述特征信息集从预先建立的知识分类库中获取关联的至少一个关联知识点;
[0209]
推荐知识点确定模块15,被配置为执行根据全部所述特征信息集和全部所述关联知识点确定推荐知识点。
[0210]
在上述实施例基础上,本说明书一个实施例中,所述特征信息集获取模块,包括:
[0211]
第一特征信息集提取单元,被配置为执行提取所述文本信息中的关键词作为所述特征信息集;
[0212]
和/或、第二特征信息集提取单元,被配置为执行依次对所述文本信息进行分词,去除停用词后剩下的词作为所述特征信息集;
[0213]
和/或、第三特征信息集提取单元,被配置为执行依次对所述文本信息进行分词,去除标点后剩下的词作为所述特征信息集。
[0214]
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0215]
本发明实施例还提供了一种电子设备,如图7所示,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如前述所述的知识点推荐方法。
[0216]
在一个具体的实施例中,如图7所示,其示出了本发明实施例提供的电子设备的结构示意图。所述电子设备800可以包括一个或一个以上计算机可读存储介质的存储器810、一个或者一个以上处理核心的处理器820、输入单元830、显示单元840、射频(radio frequency,rf)电路850、无线保真(wireless fidelity, wifi)模块860以及电源870等部件。本领域技术人员可以理解,图8中示出的电子设备结构并不构成对电子设备800的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0217]
所述存储器810可用于存储软件程序以及模块,所述处理器820通过运行或执行存
储在所述存储器810的软件程序以及模块,以及调用存储在存储器810 内的数据,从而执行各种功能应用以及数据处理。所述存储器810可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据所述电子设备的使用所创建的数据等。此外,存储器810可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器810还可以包括存储器控制器,以提供处理器820对存储器810的访问。
[0218]
所述处理器820是电子设备800的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器810内的软件程序和/或模块,以及调用存储在存储器810内的数据,执行电子设备800的各种功能和处理数据,从而对电子设备800进行整体监控。所述处理器820可以是中央处理器(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integratedcircuit,asic)、现成可编程门阵列(field
‑
programmable gate array,fpga) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0219]
所述输入单元830可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元830可包括图像输入设备831以及其他输入设备832。图像输入设备 831可以是摄像头,也可以是光电扫描设备。除了图像输入设备831,输入单元 830还可以包括其他输入设备832。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0220]
所述显示单元840可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元840可包括显示面板841,可选的,可以采用液晶显示器(liquid crystal display,lcd)、有机发光二极管(organic light
‑ꢀ
emitting diode,oled)等形式来配置显示面板841。
[0221]
所述rf电路850可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器820处理;另外,将涉及上行的数据发送给基站。通常,rf电路850包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(sim)卡、收发信机、耦合器、低噪声放大器(low noise amplifier,lna)、双工器等。此外,rf电路850还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(global system of mobile communication,gsm)、通用分组无线服务(general packet radio service,gprs)、码分多址(code division multiple access,cdma)、宽带码分多址(widebandcode division multiple access,wcdma)、长期演进(long term evolution, lte)、电子邮件、短消息服务(short messaging service,sms)等。
[0222]
wifi属于短距离无线传输技术,电子设备800通过wifi模块860可以帮助用户收发
电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图8示出了wifi模块860,但是可以理解的是,其并不属于电子设备800的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
[0223]
所述电子设备800还包括给各个部件供电的电源870(比如电池),优选的,电源可以通过电源管理系统与处理器820逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源870还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0224]
需要说明的是,尽管未示出,所述电子设备800还可以包括蓝牙模块等,在此不再赘述。
[0225]
本发明实施例还提供了一种存储介质,如图8所示,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、该至少一段程序、该代码集或指令集可由电子设备的处理器执行以完成上述任一所述的知识点推荐方法。
[0226]
可选地,在本发明实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read
‑
only memory,rom)、随机存取存储器(random access memory, ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0227]
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0228]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备和存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0229]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0230]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种知识点推荐方法,其特征在于,包括:获取客户端播放的当前教研视频,所述当前教研视频包括:多个具有试题的图像帧;按照所述当前教研视频中的多个具有试题的图像帧的播放顺序依次将图像帧中的试题转换为对应的多个文本信息;依次提取每个所述文本信息中的特征信息集,所述特征信息集包括多个当前知识点;根据全部所述特征信息集从预先建立的知识分类库中获取关联的至少一个关联知识点;根据全部所述特征信息集和全部所述关联知识点确定推荐知识点。2.根据权利要求1所述的方法,其特征在于,所述依次提取每个所述文本信息中的特征信息集,包括:依次提取所述文本信息中的关键词作为所述特征信息集;和/或、依次对所述文本信息进行分词,去除停用词后剩下的词作为所述特征信息集;和/或、依次对所述文本信息进行分词,去除标点后剩下的词作为所述特征信息集。3.根据权利要求1所述的方法,其特征在于,还包括:根据所述推荐知识点推送对应的推荐教研视频。4.根据权利要求1所述的方法,其特征在于,所述根据全部所述特征信息集和全部所述关联知识点确定推荐知识点,包括:按照预设选取顺序在全部所述特征信息集中选取当前特征信息集;依次对所述当前特征信息集中的多个当前知识点转换得到对应的词向量;依次对所述当前特征信息集中的多个词向量进行注意力计算,得到每个当前知识点的和值和注意力分数;将所述注意力得分和对应的词向量相乘得到加权值;对全部所述加权值进行归一化处理得到每个当前知识点的对应等级;根据选取等级最高的当前知识点与所述关联知识点确定推荐知识点。5.根据权利要求4所述的方法,其特征在于,所述知识分类库的建立方法包括:获取全部教研视频;提取每个教研视频的知识点;根据全部知识点构建知识点图谱集,所述知识点图谱集包括多种类别的知识点图谱,每个知识点图谱包括多个推荐知识点。6.根据权利要求4所述的方法,其特征在于,所述根据选取等级最高的当前知识点与所述关联知识点确定推荐知识点,包括:比较所述等级最高的当前知识点和所述关联知识点;当所述等级最高的当前知识点和所述关联知识点不同时,根据所述关联知识点确定推荐知识点。7.一种知识点推荐装置,其特征在于,包括:当前教研视频获取模块,被配置为执行获取客户端播放的当前教研视频,所述当前教研视频包括:多个具有试题的图像帧;转换模块,被配置为执行按照所述当前教研视频中的多个具有试题的图像帧的播放顺序依次将图像帧中的试题转换为对应的多个文本信息;
特征信息集获取模块,被配置为执行依次提取每个所述文本信息中的特征信息集,所述特征信息集包括多个当前知识点;关联知识点获取模块,被配置为执行根据全部所述特征信息集从预先建立的知识分类库中获取关联的至少一个关联知识点;推荐知识点确定模块,被配置为执行根据全部所述特征信息集和全部所述关联知识点确定推荐知识点。8.根据权利要求7所述的装置,其特征在于,所述特征信息集获取模块,包括:第一特征信息集提取单元,被配置为执行提取所述文本信息中的关键词作为所述特征信息集;和/或、第二特征信息集提取单元,被配置为执行依次对所述文本信息进行分词,去除停用词后剩下的词作为所述特征信息集;和/或、第三特征信息集提取单元,被配置为执行依次对所述文本信息进行分词,去除标点后剩下的词作为所述特征信息集。9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1
‑
7任一项所述的知识点推荐方法。10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1
‑
7任一项所述的知识点推荐方法。
技术总结
本发明提供一种知识点推荐方法,包括:获取客户端播放的当前教研视频,所述当前教研视频包括:多个具有试题的图像帧;按照所述当前教研视频中的多个具有试题的图像帧的播放顺序依次将图像帧中的试题转换为对应的多个文本信息;依次提取每个所述文本信息中的特征信息集,所述特征信息集包括多个当前知识点;根据全部所述特征信息集从预先建立的知识分类库中获取关联的至少一个关联知识点;根据全部所述特征信息集和全部所述关联知识点确定推荐知识点,本发明使用注意力机制来对视频中提取的知识点的重要程度进行打分,进行知识点推荐的时候可以根据知识点的权重进行相关关联视频的推荐,推荐的视频更加符合用户需求。推荐的视频更加符合用户需求。推荐的视频更加符合用户需求。
技术研发人员:王敬勇 薛丽达 马杰
受保护的技术使用者:王敬勇
技术研发日:2021.02.24
技术公布日:2021/6/29
转载请注明原文地址:https://doc.8miu.com/read-15457.html