本发明属于计算机视觉技术与自动驾驶,特别涉及一种行人轨迹预测模型、行人轨迹预测方法及相关装置。
背景技术:
1、行人轨迹预测是指在给定实际场景中观测到的一组行人轨迹信息的基础上,生成这些行人在未来一段时间内的预测轨迹,这一技术在多种实际场景中都有着重要应用。具体示例性的,在自动驾驶场景中,通过行人轨迹预测技术,汽车能够判断行人未来的轨迹,以便提前做出决策;在城市交通场景中,交通摄像头通过行人轨迹预测技术,可追踪行人当前及未来可能的位置,以便高效的管理交通。
2、现有的传统行人轨迹预测方法,其局限性在于主要聚焦于训练场景下的预测精确度,而未能充分考虑模型的泛化能力。对泛化能力的忽视,使得上述现有方法应用于现实生活中多变复杂的场景时,其预测能力往往会出现明显的下降;因此,为了提升行人轨迹预测方法的实际应用效果,迫切需要关注并增强模型的泛化能力。进一步解释性的,轨迹预测模型的泛化能力是指在实际应用中,训练好的模型遇到与训练场景不同的场景时,会出现预测性能大幅下降的情况。
技术实现思路
1、本发明的目的在于提供一种行人轨迹预测模型、行人轨迹预测方法及相关装置,以解决上述存在的一个或多个技术问题。本发明具体公开了一种基于特征逐步对齐的高泛化性的行人轨迹预测模型,提高了行人轨迹预测模型的场景泛化能力;采用本发明构建的行人轨迹预测模型在不同场景下进行行人轨迹预测,均能够获得准确性良好的行人轨迹预测结果。
2、为达到上述目的,本发明采用以下技术方案:
3、本发明第一方面,提供一种行人轨迹预测模型,包括:
4、逐步特征提取器,所述逐步特征提取器基于注意力机制构建,用于输入行人观测轨迹,提取获得行人在每帧的待对齐的交互特征;
5、泛化性轨迹特征提取网络,用于输入行人在每帧的待对齐的交互特征,并按照时序逐步对齐,获得对齐后的高维特征空间;
6、解码器,用于输入对齐后的高维特征空间并进行解码处理,获得行人预测轨迹结果;
7、其中,
8、所述行人轨迹预测模型的训练步骤中,通过获取多个不同场景的行人观测轨迹,根据网络整体损失函数对网络参数进行迭代优化;
9、所述网络整体损失函数为预测损失函数与逐步特征对齐损失函数之和;
10、所述预测损失函数是预测结果与真实未来轨迹之间的均方误差;
11、所述逐步特征对齐损失函数对准损失的目标是最小化源域之间的差异。
12、本发明的进一步改进在于,所述泛化性轨迹特征提取网络,执行所述输入行人在每帧的待对齐的交互特征,并按照时序逐步对齐,获得对齐后的高维特征空间的步骤中,
13、通过将逐步特征对齐损失函数反向传播,使网络不断优化轨迹特征,最终得到对齐后的高维特征空间;
14、其中,
15、所述逐步特征对齐损失函数是通过将特征对齐损失函数应用于rnn的每个gru单元,并将所有的特征对齐损失函数加权求和得到;
16、所述逐步特征对齐损失函数为,
17、
18、式中,lrec表示逐步特征对齐损失函数;m表示不同场景的总数量,p,q表示m中的两个不同场景;t表示第t帧,tobs表示总帧数;sp,t和sq,t分别表示场景p,q下的轨迹的特征空间,||·||h是特征空间在高维希尔伯特空间上的投影;
19、所述特征对齐损失函数表示为,
20、lmmd=||sp,t,sq,t||h;
21、式中,lmmd是两个不同场景p,q的特征对齐损失函数;
22、对于m个不同场景中的任一场景i,
23、式中,n表示场景i中第n个行人,ni表示场景i中的行人总数;si,t是在t帧时场景i中所有轨迹的特征空间;是的隐变量;xi,t为场景i下行人在t帧的待对齐的交互特征。
24、本发明的进一步改进在于,所述泛化性轨迹特征提取网络,执行所述输入行人在每帧的待对齐的交互特征,并按照时序逐步对齐,获得对齐后的高维特征空间的步骤中,
25、使用多层门控循环单元rnn对隐藏状态在场景i中预测的轨迹的时间状态和时间序列水平的高维特征进行建模;
26、其中,对于输入轨迹序列中的每个时间状态信息,每个rnn层计算以下函数,
27、
28、
29、
30、
31、式中,和分别表示rnn中重置、更新和新建门控单元,和br,bz,bg均是可学习参数;σ(·)是激活函数,⊙是对应元素相乘。
32、本发明的进一步改进在于,所述逐步特征提取器中,执行输入行人观测轨迹,提取获得行人在每帧的待对齐的交互特征的步骤具体包括:
33、获取给定目标行人的观测轨迹oi和临近行人的观测轨迹bi,用多层感知机对其进行编码,表示为,
34、
35、
36、式中,和分别为场景i中第t帧给定目标行人和临近行人观测轨迹的特征编码;fo(·)和fb(·)为多层感知机编码器;
37、采用注意机制对每个时间帧的社会交互建模如下,
38、
39、
40、
41、
42、式中,qi,t,ki,t和vi,t分别为注意力机制的查询,键和值;是线性网络;和分别是不同线性网络的可学习参数;ai,t是注意力机制网络的输出结果;dk为注意力机制中的常数;
43、最终,基于每个时间帧的观测值oi,t和逐步注意力机制网络的输出ai,t,场景i下行人在t帧的待对齐的交互特征表示为,
44、xi,t=concat(qi,t,ai,t);
45、式中,concat(·)是连接操作。
46、本发明的进一步改进在于,所述网络整体损失函数ltotal表示为,
47、ltotal=lrec+lpred;
48、
49、式中,lpred表示预测损失函数,lrec表示逐步特征对齐损失函数;i表示第i个场景,m表示不同场景的总数量,n表示场景i中第n个行人,ni表示场景i中的行人总数;表示未来轨迹真实值,表示未来轨迹预测值。
50、本发明的进一步改进在于,所述解码器基于多层感知机构建,行人预测轨迹结果表示为,
51、
52、式中,是预测轨迹;fd(·)是基于多层感知机的解码器;为在场景i、时刻tobs对于行人n的值;是的隐变量,xi,t为场景i下行人在t帧的待对齐的交互特征。
53、本发明第二方面,提供一种行人轨迹预测方法,包括以下步骤:
54、获取待预测的观测行人轨迹;
55、根据待预测的观测行人轨迹,利用本发明第一方面中任一项所述的行人轨迹预测模型进行轨迹预测,获得行人预测轨迹结果。
56、本发明第三方面,提供一种行人轨迹预测装置,包括:
57、数据获取模块,用于获取待预测的观测行人轨迹;
58、轨迹预测模块,所述轨迹预测模块部署有本发明第一方面中任一项所述的行人轨迹预测模型,用于根据待预测的观测行人轨迹进行轨迹预测,获得行人预测轨迹结果。
59、本发明第四方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明第二方面所述的行人轨迹预测方法。
60、本发明第五方面,提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明第二方面所述的行人轨迹预测方法。
61、与现有技术相比,本发明具有以下有益效果:
62、针对现有行人轨迹预测模型泛化能力较差的缺陷,本发明公开了一种基于特征逐步对齐的高泛化性的行人轨迹预测模型;其中,设置了基于逐步对齐损失的特征逐步对齐网络,通过该网络可学习具有高泛化性的轨迹特征,再通过高泛化性的轨迹特征由解码器生成具有高泛化性的预测轨迹结果;通过行人运动时序特征和交互特征分别逐步对齐的方式,提高了轨迹预测模型的场景泛化能力。综上,本发明技术方案中,使用泛化性轨迹特征提取网络获取了具有高泛化性的轨迹特征,以其来生成具有高泛化性的预测轨迹结果,具有较好的准确性和鲁棒性,在一定程度上,解决了行人轨迹预测方法应用于场景多变的现实中出现的性能下降问题。
63、鉴于本发明公开的基于特征逐步对齐的高泛化性的行人轨迹预测模型,本发明进一步公开了行人轨迹预测方法。采用本发明构建的行人轨迹预测模型在不同场景下进行行人轨迹预测,均能够获得准确性良好的行人轨迹预测结果。
1.一种行人轨迹预测模型,其特征在于,包括:
2.根据权利要求1所述的一种行人轨迹预测模型,其特征在于,所述泛化性轨迹特征提取网络,执行所述输入行人在每帧的待对齐的交互特征,并按照时序逐步对齐,获得对齐后的高维特征空间的步骤中,
3.根据权利要求2所述的一种行人轨迹预测模型,其特征在于,所述泛化性轨迹特征提取网络,执行所述输入行人在每帧的待对齐的交互特征,并按照时序逐步对齐,获得对齐后的高维特征空间的步骤中,
4.根据权利要求2所述的一种行人轨迹预测模型,其特征在于,所述逐步特征提取器中,执行输入行人观测轨迹,提取获得行人在每帧的待对齐的交互特征的步骤具体包括:
5.根据权利要求2所述的一种行人轨迹预测模型,其特征在于,所述网络整体损失函数ltotal表示为,
6.根据权利要求1所述的一种行人轨迹预测模型,其特征在于,所述解码器基于多层感知机构建,行人预测轨迹结果表示为,
7.一种行人轨迹预测方法,其特征在于,包括以下步骤:
8.一种行人轨迹预测装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求7所述的行人轨迹预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求7所述的行人轨迹预测方法。
