本申请涉及阅读朗读,尤其涉及一种基于电子书阅读行为智能推荐朗读素材的方法。
背景技术:
1、现有阅读方案聚焦于传统形式的阅读电子书,传统的电子书通常是以数字形式存储的书籍,以便在电子设备上阅读,但这会导致朗读素材的一般性,无法满足不同用户的个性化朗读学习需求,难以提供有针对性的学习支持。
2、综上,相关技术中存在的技术问题有待得到改善。
技术实现思路
1、本申请实施例的主要目的在于提出一种基于电子书阅读行为智能推荐朗读素材的方法。
2、本发明所采取的技术方案是:
3、一方面,本发明实施例提供了一种基于电子书阅读行为智能推荐朗读素材的方法,所述方法包括:
4、获取电子书阅读行为数据;
5、对所述电子书阅读行为数据进行预处理,得到文本朗读素材池;
6、对所述文本朗读素材池进行素材评分,得到朗读素材;
7、根据所述朗读素材进行朗读场景推荐,得到朗读场景信息;
8、根据所述朗读场景信息和所述朗读素材,得到用户朗读素材推荐池。
9、进一步地,所述获取电子书阅读行为数据,包括:
10、获取电子书数据;
11、获取用户阅读行为数据;所述用户阅读行为数据包括用户划线数据、用户写想法数据、用户选择朗读数据、用户复制数据、用户分享数据。
12、进一步地,所述对所述电子书阅读行为数据进行预处理,得到文本朗读素材池,包括:
13、对电子书数据进行文本清洗,得到清洗数据;
14、对所述清洗数据进行段落识别合并,得到电子书朗读素材;
15、对用户阅读行为数据进行去重与合并,得到阅读行为素材;
16、根据所述电子书朗读素材和所述阅读行为素材,建立所述文本朗读素材池。
17、进一步地,所述对电子书数据进行文本清洗,得到清洗数据,包括:
18、所述文本清洗包括统一文本格式、删除换行符、删除多余空格、去除无关内容、错别字检测与纠正、数据脱敏;
19、所述去除无关内容包括去除广告;
20、所述错别字检测与纠正包括使用第三方自然语言处理技术,自动检测和纠正错别字。
21、进一步地,所述对所述清洗数据进行段落识别合并,得到电子书朗读素材,包括:
22、对所述清洗数据采用分段算法分析文本的布局、换行符、空格和标点符号,得到段落识别数据;
23、使用自然语言处理技术对所述段落识别数据进行匹配,匹配后优先按照电子书的句子顺序规则进行合并,得到段落合并数据;
24、对所述段落合并数据进行语法错误检测,得到电子书朗读素材。
25、进一步地,所述对用户阅读行为数据进行去重与合并,得到阅读行为素材,包括:
26、对用户选择文本进行完整段落检测,得到完整段落数据;
27、对所述完整段落数据进行内容去重,得到阅读行为素材。
28、进一步地,所述对所述文本朗读素材池进行素材评分,得到朗读素材,包括:
29、对所述文本朗读素材池进行合适度评分和热度评分;
30、所述合适度评分包括计算情感分析分、节奏感分、星级分、篇幅长度分;
31、所述热度评分包括计算阅读量分、读完量分、读一读次数分、想法数分、划线数分、复制数分、分享数分。
32、进一步地,所述根据所述朗读素材进行朗读场景推荐,得到朗读场景信息,包括:
33、若用户未登录,则推荐热门排行榜的朗读素材;
34、若用户已登陆,则根据用户喜好进行朗读素材相似度匹配,得到朗读场景信息。
35、进一步地,所述若用户已登陆,则根据用户喜好进行朗读素材相似度匹配,得到朗读场景信息,包括:
36、所述朗读场景信息包括书籍素材推荐信息、朗读任务推荐信息、阅读器推荐信息;
37、获取用户标签;所述用户标签包括静态标签和动态标签;
38、所述静态标签包括用户类型、归属行业类型;所述动态标签包括用户阅读行为数据;
39、对所述用户标签进行权重值计算,得到用户喜好分;
40、根据所述用户喜好分对用户进行书籍活动朗读素材推荐,得到所述书籍素材推荐信息;
41、对用户进行阅读情况追踪,得到追踪数据;
42、根据所述追踪数据对用户进行朗读任务布置推荐,得到所述朗读任务推荐信息;
43、根据所述追踪数据对用户进行阅读器朗读素材推荐,得到所述阅读器推荐信息。
44、进一步地,所述根据所述追踪数据对用户进行朗读任务布置推荐,得到朗读任务推荐信息,包括:
45、根据所述追踪数据对朗读素材进行综合评分推荐,得到朗读任务推荐信息。
46、另一方面,本发明实施例还提供了一种基于电子书阅读行为智能推荐朗读素材的方法的实现装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前面所述的基于电子书阅读行为智能推荐朗读素材的方法。
47、另一方面,本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行前面所述的基于电子书阅读行为智能推荐朗读素材的方法。
48、本申请实施例至少包括以下有益效果:本申请提供一种基于电子书阅读行为智能推荐朗读素材的方法,该方案通过获取电子书阅读行为数据;对所述电子书阅读行为数据进行预处理,得到文本朗读素材池;对所述文本朗读素材池进行素材评分,得到朗读素材;根据所述朗读素材进行朗读场景推荐,得到朗读场景信息;根据所述朗读场景信息和所述朗读素材,得到用户朗读素材推荐池。本发明能够减轻人工筛选朗读素材的工作量,丰富朗读素材库,便于将朗读素材更高效地提供给用户,有利于提升学生的阅读兴趣。
1.一种基于电子书阅读行为智能推荐朗读素材的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取电子书阅读行为数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述电子书阅读行为数据进行预处理,得到文本朗读素材池,包括:
4.根据权利要求3所述的方法,其特征在于,所述对电子书数据进行文本清洗,得到清洗数据,包括:
5.根据权利要求3所述的方法,其特征在于,所述对所述清洗数据进行段落识别合并,得到电子书朗读素材,包括:
6.根据权利要求3所述的方法,其特征在于,所述对用户阅读行为数据进行去重与合并,得到阅读行为素材,包括:
7.根据权利要求1所述的方法,其特征在于,所述对所述文本朗读素材池进行素材评分,得到朗读素材,包括:
8.根据权利要求1所述的方法,其特征在于,所述根据所述朗读素材进行朗读场景推荐,得到朗读场景信息,包括:
9.根据权利要求8所述的方法,其特征在于,所述若用户已登陆,则根据用户喜好进行朗读素材相似度匹配,得到朗读场景信息,包括:
10.根据权利要求9所述的方法,其特征在于,所述根据所述追踪数据对用户进行朗读任务布置推荐,得到朗读任务推荐信息,包括:
