基于因果推理的知识追踪方法、系统、设备及存储介质与流程

专利2022-05-09  65



1.本申请涉及知识追踪领域,尤其涉及一种基于因果推理的知识追踪方法、系统、设备及 存储介质。


背景技术:

2.随着人工智能在各种领域建模方面的成功,人们希望使用算法来模拟人类跟踪学生在 掌握特定技能或概念时的知识状态的能力,并预测学生的学习表现,这激发了人们对知识跟 踪(knowledge tracing,kt)的研究。知识追踪是一个根据历史数据对学生的知识状态进行 建模的任务,代表了学生知识的掌握水平。解决kt问题的一个著名模型是基于递归神经网 络的模型,称为深度知识跟踪(deep knowledge tracing,dkt),虽然dkt在知识追踪任务 中取得了令人印象深刻的表现,但dkt有一个主要问题,即预测输出的过渡。当一个学生 在一项与技能i相关的学习任务中表现良好时,该模型对该技能的预测性能可能会下降,反 之亦然。这是不合理的,因为人们希望学生的知识状态是随着时间的推移逐渐过渡,而不是 在掌握和未掌握之间交替,这种波浪式的转变是不利的,它会误导对学生知识状态的解释。


技术实现要素:

3.本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种 基于因果推理的知识追踪方法、系统、设备及存储介质。
4.第一方面,本申请实施例提供了一种基于因果推理的知识追踪方法,包括:获取随机变 量,所述随机变量对应特定的知识点;获取潜在结果,所述潜在结果表示学生对特定知识点 的回答结果;根据所述随机变量和所述潜在结果,确定所述随机变量和所述潜在结果的关系 式;获取观测变量,所述观测变量包括混杂变量,调整变量和无关变量;根据所述混杂变量、 所述调整变量以及所述随机变量和所述潜在结果的关系式,确定所述潜在结果的转换输出; 根据所述转换输出,确定所述观测变量的第一目标函数;获取样本权重,根据所述样本权重 更新所述第一目标函数,确定第二目标函数;根据所述第二目标函数以及所述样本权重,确 定平衡权重,所述平衡权重用于评估单个变量与所述潜在结果之间的因果关系。
5.可选地,所述方法还包括:对所述第一目标函数作优化处理,所述优化处理将调整变量 与观测变量分离,以及将混杂变量与观测变量分离。
6.可选地,所述方法还包括:获取全局平衡模型;通过所述全局平衡模型评估单个变量与 所述潜在结果之间的因果关系。
7.可选地,所述通过所述全局平衡模型评估单个变量与所述潜在结果之间的因果关系,包 括:通过自动编码器对所述混合变量进行编码,确定重构向量;通过乘积解码器对所述重构 变量进行数据重建,确定所述样本权重。
8.可选地,所述通过所述全局平衡模型评估单个变量与所述潜在结果之间的因果关
系,还 包括:通过深度知识追踪模块,将输入数据映射到非线性低维空间。
9.可选地,所述转换输出具体为:
[0010][0011]
其中,y 为转换输出,k为随机变量,z为调整变量,x为混杂向量,i为变量的编号。
[0012]
可选地,所述第一目标函数具体为:
[0013]
minimize||y


h(u)||2[0014]
其中,y

为转换输出,u为观测变量。
[0015]
第二方面,本申请实施例提供了一种基于因果推理的知识追踪系统,包括:获取模块, 用于获取随机变量、潜在结果、观测变量和样本权重;数据处理模块,用于根据所述随机变 量和所述潜在结果,确定所述随机变量和所述潜在结果的关系式;并用于根据所述混杂变量、 所述调整变量以及所述随机变量和所述潜在结果的关系式,确定所述潜在结果的转换输出; 目标函数处理模块,用于根据所述转换输出,确定所述观测变量的第一目标函数;并用于根 据所述样本权重更新所述第一目标函数,确定第二目标函数。因果推理模块,用于根据所述 第二目标函数以及所述样本权重,确定平衡权重,所述平衡权重用于评估单个变量与所述潜 在结果之间的因果关系。
[0016]
第三方面,本申请实施例提供了一种设备,包括:至少一个处理器;至少一个存储器, 用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一 个处理器实现如第一方面所述的基于因果推理的知识追踪方法。
[0017]
第四方面,本申请实施例提供了一种计算机存储介质,其中存储有处理器可执行的程序, 所述处理器可执行的程序在由所述处理器执行时用于实现如第一方面所述的基于因果推理 的知识追踪方法。
[0018]
本申请实施例的有益效果如下:获取对应特定知识点的随机变量,以及获取学生回答特 定知识点的潜在结果,根据所述随机变量和所述潜在结果,确定所述随机变量和所述潜在结 果的关系式;获取观测变量,并将观测变量分为混杂变量、调整变量和无关变量;采用因果 推理的方法对随机变量和潜在结果的关系进行分析,根据所述混杂变量、所述调整变量以及 所述随机变量和所述潜在结果的关系式,确定所述潜在结果的转换输出;根据所述转换输出, 确定所述观测变量的第一目标函数;通过该第一目标函数可以将混杂变量从观测变量中分离 出来,从而达到恢复混杂向量与潜在结果的因果关系的目的;获取样本权重,根据所述样本 权重更新所述第一目标函数,确定第二目标函数;根据所述第二目标函数以及所述样本权重, 确定平衡权重,所述平衡权重用于评估单个变量与所述潜在结果之间的因果关系;通过学习 样本权重,并不断更新目标函数,使加权后的变量彼此独立;得到精确的平衡权重后,平衡 权重可以减少要素之间的协方差,以帮助评估单个变量与结果变量之间的因果关系。
附图说明
[0019]
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的 实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
[0020]
图1为本申请一些实施例提供的基于因果推理的知识追踪方法的步骤图;
[0021]
图2为本申请一些实施例提供的因果图;
[0022]
图3为本申请一些实施例提供的全局平衡模型的总体框架图;
[0023]
图4为本申请一些实施例提供的使用基于因果推理知识追踪方法对assistments2009 数据集中一名学生进行知识追踪的热图;
[0024]
图5为本申请一些实施例提供的使用dkt对assistments2009数据集中一名学生进行 知识追踪的热图;
[0025]
图6为本申请一些实施例提供基于因果推理的知识追踪系统;
[0026]
图7为本申请一些实施例提供的一种设备。
具体实施方式
[0027]
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申 请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于 限定本申请。
[0028]
需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序, 但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述 的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的 对象,而不必用于描述特定的顺序或先后次序。
[0029]
通常,知识追踪任务可以被制定为一个监督序列学习问题:给定一个学生过去的练习交 互xt=(x1,x2,

),预测学生在下一个时间步骤t 1中正确回答一个新练习的概率,即 p(at 1=1|qt 1,xt)。输入xt=(qt,at)是一个元组,表示哪个练习得到了回答(qt),以及在时 间t时这个练习是否得到了正确的回答(at)。
[0030]
解决kt问题的一个著名方法是基于递归神经网络(rnns)的模型,称为深度知识跟踪 (dkt)。初步研究发现,dkt无需获取人类进行大量的特征工程也能优胜于传统的知识追 踪方法。虽然dkt在知识追踪任务中取得了令人印象深刻的表现,但有学者发现了一个主 要问题,即预测输出的过渡。当一个学生在一项与技能i相关的学习任务中表现良好时,该 模型对该技能的预测性能可能会下降,反之亦然。这是不合理的,因为人们希望学生的知识 状态随着时间的推移逐渐过渡,而不是在掌握和未掌握之间交替,因此这种波浪式的转变是 不利的,它会误导对学生知识状态的解释。为了解决上述问题,有学者提出提出将dkt模 型的原始损失函数扩大为正则化的损耗函数,以获得对下一次交互作用更好的预测精度。但 是,他们的解决方案只关注于局部依赖性,不能解决输入的全局依赖性。全局依赖关系是指 问题不会以局部依赖关系的形式连续出现,而是会在几个时间步后出现。
[0031]
为了找出并解决dkt中上述问题的根本原因,在本申请的方案中,首先采用因果推理 的方法,因果推理是一种用于解释分析的强大统计建模工具。因果推理方法的本质是消除混 杂因素的混杂效应,从而显著提高当前函数效应估计。而混杂效应通常由倾向性评分来处理, 混杂效应用来总结控制混杂因素所需的信息,但混杂效应将所有观测变量都视为混杂变量, 而忽略了调整变量,调整变量有效地减少了估计效应的方差。此外,这些方法中的大多数都 假设一个变量是否是导致结果的原因是预先知道的。然而,在大多数情况下如知识追踪等, 先验知识并不能很好地定义因果结构。
[0032]
基于此,本申请提出一种基于因果推理的知识追踪方法、系统、设备及存储介质,首先 利用因果推理分析对所有观测变量中的混杂变量和调整变量进行分离,并找出恢复因果关系 的方法;另外,还通过学习样本权值,对变量进行重新加权,使重新加权后的变量彼此独立, 以帮助评估一个单一变量对结果变量的因果关系,也就是消除非因果特征和预测结果之间的 假相关性,从而实现稳定的知识追踪。
[0033]
下面结合附图,对本申请实施例作进一步阐述。
[0034]
参照图1,图1为本申请一些实施例提供的基于因果推理的知识追踪方法的步骤图,该 方法包括但不限于步骤s100至步骤s130。
[0035]
步骤s100,获取随机变量,随机变量对应特定的知识点;并获取潜在结果,潜在结果 表示学生对特定知识点的的回答结果。
[0036]
具体地,本申请实施例首先进行知识追踪的可观察性学习:定义一个知识点为随机变量 k,定义潜在结果y(k)来表示学生是否能正确回答对应于一个特定的知识点k=k,k∈0,1 的问题;同时也定义拥有知识或所谓技能的学生,即k=1,否则k=0。那么对于索引i= 1,2,

m的每个数据样本,观察到一个知识点k
i
,一个结果y
i
(k
i
),观察到样本i的结果, 也就是随机变量和潜在结果的关系式可以表示为:
[0037]
y
i
(k
i
)=k
i
·
y
i
(1) (1

k
i
)
·
y
i
(0)
[0038]
需要说明的是,除非特别说明,本申请实施例中一个变量对应一个物理含义,例如y在 上述公式中代表潜在结果,则y的含义在下文的公式中的物理含义不变,y的含义也不再赘 述,本申请实施例中其他的变量也同理。
[0039]
步骤s110,获取观测变量,观测变量包括混杂变量,调整变量和无关变量。
[0040]
具体地,在步骤s100中进行知识追踪的可观察性学习时,除了观察到知识点k
i
,结果 y
i
(k
i
),还可以观察到一个维数n的变量u
i
的变量,u为观测变量。
[0041]
需要说明的是,在本申请实施例进行的知识追踪的可观察性学习中,设置有三个假设, 分别为:
[0042]

稳定的知识点数值:当给定观察变量时,假设一个知识点的潜在结果的分布不受另一 个知识点的特定分配的影响。
[0043]

非混杂:当给出观察变量时,与知识点对应的随机变量和潜在结果之间是独立的。
[0044]

分离性:观测变量u可以分解为三个集合,即u=(x,z,i),其中x为混杂变量,z 为调整变量,i为无关变量。
[0045]
参照图2,图2为本申请一些实施例提供的因果图,如图2所示的因果图可以用于分离 混杂变量和调整变量,混杂变量为x,混杂变量与随机变量k(也可以理解为知识点k)有 联系,或许会影响潜在结果y;调整变量为z,调整变量z影响潜在结果y,但与随机变量 k独立;无关变量为i,无关变量i与随机变量k和潜在结果y均无关,因此无关变量没有 在图2中画出。
[0046]
步骤s120,根据混杂变量、调整变量以及随机变量和潜在结果的关系式,确定潜在结 果的转换输出。
[0047]
具体地,本申请实施例中的转换输出具体为:
[0048][0049]
其中,y 为转换输出,k为随机变量,z为调整变量,x为混杂向量,i为变量的编号。 在上述的公式中,φ(z)用于对z做线性处理,φ(z)有助于减少与调整变量z有关的潜在结 果y的方差,然后调整估计值继续减少差异,具体调整估计值为:
[0050]
e(y |x)=e(y(1)

y(0)|x)
[0051]
e(y |x)=e(y(1)

y(0)|x)
[0052]
基于上述估计值,可以得到针对观测变量u的第一目标函数:
[0053]
minimize||y


h(u)||2[0054]
对第一目标函数进行更新,确定第二目标函数,具体如下式:
[0055][0056][0057][0058]
其中,α和β都是用于优化的参数,α用于分离调整变量z,β优化用于分离混杂变量 x,γ是h(u)的系数常量,λ、δ、η均为常数,w是样本权重,w(β)具体为:
[0059][0060]
另外,估计倾向得分时的损失函数具体表示为:
[0061][0062]
另外,

是指hadamard乘积。上述的倾向得分定义为:给定所有观测变量u的学生在 知识状态下(k=1)的概率。
[0063]
另外,对第一目标函数进行了优化处理,优化处理用于分离出调整变量z和β,β用于 将变量x与变量u分离,具体地,对系数向量α进行优化,通过以下公式进行优化:
[0064][0065]
步骤s100至步骤s120的分析提供了可解释性,即一旦将混杂变量x和调整变量z分 开,就可以恢复混杂变量x和潜在结果y之间的所有因果关系,从而实现稳定的学习。在 预测潜在结果y时,用来验证学生是否可以通过因果特征正确回答问题的部分是稳定的,而 不稳定部分主要来自于非因果特征(噪声特征)的不稳定性,这种不稳定性是由非因果特征 与潜在结果y之间的虚假相关性得出的。因此,如果非因果特征与潜在结果y无关,则可 以消除这种虚假相关。因此,本申请实施例提出一种具有学习算法的因果调节器,用于消除 这种虚假相关性,学习算法将在下面的内容中展开阐述。
[0066]
步骤s130,根据第二目标函数以及样本权重,确定平衡权重,平衡权重用于评估单个 变量与潜在结果之间的因果关系。
[0067]
具体地,在本申请实施例中提出一种学习算法,该学习算法用于构造用于估计因果效应 的平衡权重,该学习算法通过调整样本权重使连续估计达到大致平衡,主要思想是学习样本 权重,并使用样本权重来对样本进行加权,使加权后的变量彼此独立,以帮助评估单个变量 与结果变量之间的因果关系,并且从理论上可以证明这种样本权重的存在。
[0068]
首先,参照如下的第二目标函数:
[0069][0070][0071][0072]
为了最小化第二目标函数,应该将以下的部分最小化:
[0073][0074]
将混杂变量x与观测变量u分开,然后通过调整样本权重w来更新第二目标函数,具 体如下式所示:
[0075][0076][0077][0078]
其中,λ1、λ2、λ3、λ4均为常数,w是调整后的全局样本权重,x
i
是混杂变量x中的第 i行/样本,p是协变量数。
[0079]
另外,上述公式中的第一行是学习算法中的加权损失,也就是如下式子:
[0080][0081]
设置样本权重w≥0,则表示每个样本权重约束为非负数,当范数时,就可以 减小样本权重的方差。另外,设置弹性净约束以及||β||1≤λ4,可以避免过度拟合。
[0082]
另外,上述公式中包含因果调节器,因果调节器具体为:
[0083][0084]
其中,x
·
,

j
是混杂变量x中第j个变量,而x
·
,

j
=x\{x
·
,j
}表示通过除去第j个变量二 剩下的所有变量,该因果调节器的公式表示将变量x
·
,j
设为对应知识点的随机变量时,协变 量不平衡的损失,

指的是hadamard积。通过使用样本权重w进行样本加权,就可以通过 因果调节器检查潜在结果y和混杂变量x协变量之间是否存在相关性,从而确定稳定特征。
[0085]
为了确定稳定特征,本申请实施例提出一个全局平衡模型,在全局平衡模型中,可以学 习全局样本权重,该权重可用于估算每个特征的效果;同时该模型可以控制其他特征。
[0086]
参照图3,图3为本申请一些实施例提供的全局平衡模型的总体框架图。为了捕获稳定 特征和响应变量之间的非线性结构,全局平衡模型使用卷积神经网络(convolutional neural networks,cnns)来构建自动编码器模型,因为cnns可以将输入的邻域关系和空间局部 性保留在较高的潜在值中。将混杂因素x输入自动编码器,可得到编码后的重构向量自动编码器同时也将φ(
·
)传递到全局均衡部分。另外,该全局平衡模型通过组合深度知识追 踪模块dkt,提高处理长输入序列数据的能力,同时深度知识追踪模块将输入数据映射到 非线性低维空间,因为在低维空间中进行平衡会简化全局平衡的问题。将自动编码器的输出 数据输入到乘积解码器来进行数据重建,并确定样本权重w。对于每个协变量j,权重会在x
·
,j
的实现中平衡来自维度缩减φ(x
·
,

j
)的构造协变量。最后,使用样本权重w对样本进行加权, 并学习kt的预测模型,该预测模型是协变量的低维表示的函数,具体可以如下表示:
[0087][0088]
通过全局平衡模型的处理,第二目标函数再次更新如下:
[0089][0090][0091][0092]
其中λ5为常数,φ(x)
k
为表示变量,而表示输入的混杂向量x与重构向 量之间具有样本权重w的重构误差。如果有足够的数据使得混杂变量x的所有实现都出 现在数据中,则可以得出精确的平衡权重。平衡权重可以减少要素之间的协方差,确定平衡 权重后则可以评估单个变量与结果变量之间的因果关系。
[0093]
下面通过一个例子来说明通过本申请实施例提出的全局平衡模型对样本进行加权后,可 以评估单个变量与结果变量之间的因果关系。
[0094]
假设混杂变量x=是s,v,其中s为稳定特征,v为噪声特征,假设存在一个可能性方 程如下:
[0095]
p(y|s)=p(y=y|s=s)=p(y=y|s=s,v=v)
[0096]
下面提出一个提议:如果对于所有混杂变量x,都有当满足以下条件:
[0097][0098]
则存在一个样本权重w,这个样本权重w事实上就是本申请所提出的平衡权重,这个 样本权重w满足:
[0099][0100]
此时,混杂变量x中的变量经过上述样本权重w的均衡后是相互独立的,证据是:根 据假设p(y|s)=p(y=y|s=s)以及上述提议,即s和v互相独立,因此可以推出:
[0101]
p(y=y|v=v)=p(y=y|s,v=v),即
[0102]
p(y=y|v=v)=p(y=y|s),即
[0103]
p(y=y|v=v)=p(y=y)
[0104]
因此可以推出,y与v相互独立,由于只有稳定的特征与结果相关,因此本申请提出的 方法可以使kt在重新加权后变得稳定,换句话说,x和y之间的因果关系得以恢复。
[0105]
下面,阐述通过本申请实施例提出的基于因果推理的知识追踪方法对真实数据集进行实 验的结果。
[0106]
参照表1,表1为本申请一些实施例提供的多个现有数据集的情况。表1前两行数据集 来自assistments在线辅导平台,并且已在多种知识追踪模型中广泛使用。表1的第一行数 据(assist2009)的原始数据集由于记录重复而被处理,处理后的数据集包含4417名学生来 自124个技能的328291个问答互动。表1中的第二行数据集(assist2015)包含19917名学 生对100项技能的回答,总计708631个问答互动;和数据集assist2009相比,它包含更 多互动,但平均每个技能和学生的记录数较小,因为学生人数更多。表1中的第三行数据集 (statics2011)由工程统计课程提供,改数据来自333名学生的189927次互动的数据集,其中 有1223技能标签。表1的第四行数据集(simulated

5)模拟2000名虚拟学生学习虚拟概念得 到,五个虚拟概念,每个学生按相同的顺序回答50个问题,最后得到100000的回答。
[0107]
数据集学生数量标签答案assist20094417124328291assist201519917100708631statics20113331223189927simulated

520005100000
[0108]
表1
[0109]
对表1中提到的训练集进行5倍的交叉验证以获取超参数设置,并使用xavier统一初始 化程序来初始化模型的权重,学习率和辍学率分别设置为0.01和0.5;使用auc作为评估 指标;此外,还使用f1分数(分类中的另一个经典指标)来评估模型的性能。
[0110]
参照表2,表2为本申请一些实施例提供的多种知识追踪方法对数据集的测试结果,本 申请实施例中选取了4种方法与本申请提出的基于因果推理的知识追踪方法进行比较,4种 方法分别为pfa,bkt,dkt,dkt 。参照表2,除了simulated

5之外,本申请提出的基 于因果推理的知识追踪方法在auc和f1两个评估指标的四个数据集上均取得了出色的结 果。例如,在assist2015的auc方面,拟议的方法超过dkt 10%;而f1分数也同样 表现出色,与其他模型相比,本申请提出的基于因果推理的知识追踪方法取得了显着的改进。
[0111]
而且,在simulated

5数据集上,本申请提出的知识追踪方法的性能不是很出色,原因 之一是实施例中使用的4个数据集中没有长序列,因此无法发挥本申请实施例方法的捕获长 序列的优势;另一个原因是所有数据都具有相同的问题序列,并且每个问题仅出现一次,因 此,simulated

5数据集在数据之间的依赖性不如其他3个数据集强,也影响了本申请实施例 中的基于因果推理的知识追踪方法的表现。
[0112][0113]
表2
[0114]
上述内容通过对比现有技术中4种知识追踪方法与本申请提出的知识追踪方法在4个真 实数据集中的表现,已经体现了本申请提出的基于因果推理知识追踪方法基于auc和f1 两个评价评价标准都有着不俗的表现。针对dkt在知识追踪任务中的问题,即预测输出的 过渡问题,本申请提出的基于因果推理知识追踪方法也较好地解决了,具体结果参照图4和 图5,图4为本申请一些实施例提供的使用基于因果推理知识追踪方法对assistments2009 数据集中一名学生进行知识追踪的热图;图5为本申请一些实施例提供的使用dkt对 assistments2009数据集中一名学生进行知识追踪的热图;图4和图5的横轴意义相同,纵 轴意义也相同;横轴坐标表示该学生对某一个知识概念回答的结果,例如(55,1)表示该学 生在当前时间步回答编号为55的知识概念,且回答结果为正确,则记为(55,1);若在当前 时间步学生回答编号为55的知识概念错误,则记为(55,0);横轴共有35个坐标,表示该 学生回答了35次问题;纵轴坐标表示该学生回答的知识概念的编号,分别为98、55、45、 33、32。另外,图4和图5在图片右侧使用颜色深浅来表示该学生对不同知识概念的掌握程 度,颜色最深代表完全掌握,颜色最浅表示完全没有掌握,掌握程度分为0.0至
1.0共6个 等级。
[0115]
参照图4,在回答了35次问题之后,该学生掌握了知识概念32和55,但未能掌握知识 概念33、45和99。从图4和图5中可以看出,本申请提出的基于因果推理知识追踪方法与 dkt相比,在知识状态更改方面具有更好的性能。参照图4,当学生不正确地反复回答知识 概念32时,概念32的知识状态逐渐降低。但是,该学生在最后三个时间步中正确回答了概 念32,因此该学生概念32的知识状态增加了。而参照图5,也就是dkt的预测,很明显对 该学生的知识预测结果与本申请提出的方法是不一致的,而dkt的预测是不合理的,因为 该学生的知识状态会随着时间的推移逐渐转变,但又不能在掌握和尚未掌握之间交替,而在 图5中显示该学生的知识状态呈现波浪式的转变,而这种转变会误导对学生知识状态的解释。 因此在使用知识追踪方法对学生的知识获取状态进行预测的方面,本申请实施例提供的基于 因果推理知识追踪方法相比于现有技术中的dkt方法表现更好,也就说本申请实施例提供 的基于因果推理知识追踪方法可以更好地掌握学生的知识水平,并为人们通过可预测的视觉 分析提供了更有用的参考。
[0116]
参照图6,图6为本申请一些实施例提供基于因果推理的知识追踪系统,该系统600包 括获取模块610、数据处理模块620、目标函数处理模块630和因果推理模块640;获取模块 用于获取随机变量、潜在结果、观测变量和样本权重;数据处理模块用于根据随机变量和潜 在结果,确定随机变量和潜在结果的关系式;并用于根据混杂变量、调整变量以及随机变量 和潜在结果的关系式,确定潜在结果的转换输出;目标函数处理模块用于根据转换输出,确 定观测变量的第一目标函数;并用于根据样本权重更新第一目标函数,确定第二目标函数。 因果推理模块用于根据第二目标函数以及样本权重,确定平衡权重,平衡权重用于评估单个 变量与潜在结果之间的因果关系。
[0117]
参考图7,图7为本申请一些实施例提供的一种设备,该设备700包括至少一个处理器 710,还包括至少一个存储器720,用于存储至少一个程序;图7中以一个处理器及一个存储 器为例。
[0118]
处理器和存储器可以通过总线或者其他方式连接,图7中以通过总线连接为例。
[0119]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性 计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器, 例如至少一个磁盘存储器件、闪存器件或其他非暂态固态存储器件。在一些实施方式中,存 储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该设 备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0120]
本申请的另一个实施例还提供了一种设备,该设备可用于执行如上任意实施例中的控制 方法,例如,执行以上描述的图1中的方法步骤s100至s130。
[0121]
以上所描述的设备实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也 可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根 据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0122]
本申请实施例还公开了一种计算机存储介质,其中存储有处理器可执行的程序,其特征 在于,处理器可执行的程序在由处理器执行时用于实现本申请提出基于因果推理的知识追踪 方法。
[0123]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实 施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理 器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实 施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介 质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普 通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据 结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可 移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、 cd

rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储设 备、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域 普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如 载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0124]
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉 本领域的技术人员在不违背本申请精神的前提下还可作出种种的等同变形或替换,这些等同 的变形或替换均包含在本申请权利要求所限定的范围内。

技术特征:
1.基于因果推理的知识追踪方法,其特征在于,包括:获取随机变量,所述随机变量对应特定的知识点;获取潜在结果,所述潜在结果表示学生对特定知识点的回答结果;根据所述随机变量和所述潜在结果,确定所述随机变量和所述潜在结果的关系式;获取观测变量,所述观测变量包括混杂变量,调整变量和无关变量;根据所述混杂变量、所述调整变量以及所述随机变量和所述潜在结果的关系式,确定所述潜在结果的转换输出;根据所述转换输出,确定所述观测变量的第一目标函数;获取样本权重,根据所述样本权重更新所述第一目标函数,确定第二目标函数;根据所述第二目标函数以及所述样本权重,确定平衡权重,所述平衡权重用于评估单个变量与所述潜在结果之间的因果关系。2.根据权利要求1所述的基于因果推理的知识追踪方法,其特征在于,所述方法还包括:对所述第一目标函数作优化处理,所述优化处理将调整变量与观测变量分离,以及将混杂变量与观测变量分离。3.根据权利要求2所述的基于因果推理的知识追踪方法,其特征在于,所述方法还包括:获取全局平衡模型;通过所述全局平衡模型评估单个变量与所述潜在结果之间的因果关系。4.根据权利要求3所述的基于因果推理的知识追踪方法,其特征在于,所述通过所述全局平衡模型评估单个变量与所述潜在结果之间的因果关系,包括:通过自动编码器对所述混合变量进行编码,确定重构向量;通过乘积解码器对所述重构变量进行数据重建,确定所述样本权重。5.根据权利要求4所述的基于因果推理的知识追踪方法,其特征在于,所述通过所述全局平衡模型评估单个变量与所述潜在结果之间的因果关系,还包括:通过深度知识追踪模块,将输入数据映射到非线性低维空间。6.根据权利要求1所述的基于因果推理的知识追踪方法,其特征在于,所述转换输出具体为:其中,y 为转换输出,k为随机变量,z为调整变量,x为混杂向量,i为变量的编号。7.根据权利要求1所述的基于因果推理的知识追踪方法,其特征在于,所述第一目标函数具体为:minimize||y


h(u)||2其中,y

为转换输出,u为观测变量。8.一种基于因果推理的知识追踪系统,其特征在于,包括:获取模块,用于获取随机变量、潜在结果、观测变量和样本权重;数据处理模块,用于根据所述随机变量和所述潜在结果,确定所述随机变量和所述潜
在结果的关系式;并用于根据所述混杂变量、所述调整变量以及所述随机变量和所述潜在结果的关系式,确定所述潜在结果的转换输出;目标函数处理模块,用于根据所述转换输出,确定所述观测变量的第一目标函数;并用于根据所述样本权重更新所述第一目标函数,确定第二目标函数。因果推理模块,用于根据所述第二目标函数以及所述样本权重,确定平衡权重,所述平衡权重用于评估单个变量与所述潜在结果之间的因果关系。9.一种设备,其特征在于,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1

7中任一项所述的基于因果推理的知识追踪方法。10.一种计算机存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由所述处理器执行时用于实现如权利要求1

7任一项所述的基于因果推理的知识追踪方法。
技术总结
本发明公开了一种基于因果推理的知识追踪方法、系统、设备及存储介质,其中方法包括:获取随机变量、潜在结果,并确定随机变量和潜在结果的关系式;获取观测变量,将观测变量分为混杂变量、调整变量和无关变量;采用因果推理的方法进行分析,根据混杂变量、调整变量以及随机变量和潜在结果的关系式,确定潜在结果的转换输出;根据转换输出,确定第一目标函数;获取样本权重并确定第二目标函数;根据第二目标函数以及样本权重,确定平衡权重,平衡权重可以减少要素之间的协方差,以帮助评估单个变量与结果变量之间的因果关系。量与结果变量之间的因果关系。量与结果变量之间的因果关系。


技术研发人员:黄昌勤 朱佳 黄琼浩 梁婉莹
受保护的技术使用者:浙江师范大学
技术研发日:2021.03.01
技术公布日:2021/6/29

转载请注明原文地址:https://doc.8miu.com/read-12596.html

最新回复(0)