基于DDPG的航空发动机异形叶片视点自主规划方法

专利2026-04-05 44

本发明涉及三维测量，尤其涉及航空发动机异形叶片视点自主规划方法。

背景技术：

1、发动机是飞机的核心，而航空发动机叶片是航空发动机的核心零部件，叶片表面的微小几何缺陷都会影响其气动性能或效率，特别是在高温高压环境下工作时影响更为明显，因此三维测量在叶片制造中起着至关重要的作用。

2、由于航空发动机异形叶片存在空间自由薄壁曲面的结构特性，从多个随机角度进行扫描得到的三维点云数据难以满足一般配准算法对重叠度的需求，导致无法通过拼接多视角的点云数据得到异形叶片完整的三维点云模型。目前对于叶片三维检测的视点规划仍以人工示教为主，依赖于人工经验，检测效率低且难以获得最优视点。

3、现已知的视点规划方法都是在预设的视点空间中选择最能满足评价标准的候选视点作为下一最优视点，不能保证所选视点是连续视点空间的最优化选择，可能导致无法扫描到某些区域而缺失部分信息，影响测量的准确性和测量的效率。

技术实现思路

1、针对以上技术问题，本发明提供一种基于ddpg的航空发动机异形叶片视点自主规划方法。

2、本发明提供了一种基于ddpg的航空发动机异形叶片视点自主规划方法，所述方法包括以下步骤：

3、s1,在测量系统中导入待测航空发动机异形叶片的标准cad模型，同时设置待测叶片最大覆盖率、扫描设备最大动作次数、强化学习训练次数；

4、s2,基于ddpg定义强化学习环境的状态空间,为减少存储空间，采用体素形式来描述状态，根据待测航空发动机异形叶片的标准cad模型的包围盒体素集合得到观测空间，由观测空间的状态表示得到所述状态空间，将所述状态空间定义为未占有体素、占有体素和未知体素三种体素状态的集合，在扫描设备每次对测航空发动机异形叶片的标准cad模型扫描完成后，对状态空间的体素状态进行更新计算得到占有体素增长率、未知体素减少率、待测叶片覆盖率、待测叶片重叠率；

5、s3，基于ddpg定义强化学习环境的动作空间a，设扫描设备在以待测航空发动机异形叶片的标准cad模型的重心为球心的球体表面上运动，根据扫描设备景深约束得到的动作空间a1和机械臂动作空间约束得到的动作空间a2的交集得到动作空间a,根据扫描设备在动作空间a的位置得到视点，扫描设备由一个视点运动到另一个视点记为动作一次；

6、s4，基于ddpg定义强化学习的奖励函数，为了在满足重叠率要求时用最少的视点达到覆盖率要求，根据占有体素增长率、未知体素减少率和待测叶片重叠率误差惩罚得到奖励函数；

7、s5，基于ddpg定义强化学习训练终止条件,当待测叶片覆盖率达到设置的待测叶片最大覆盖率或扫描设备动作次数达到设置的扫描设备最大动作次数时，一次训练结束；

8、s6，基于ddpg定义强化学习训练过程,基于动作空间a构建动作网络，动作网络根据状态空间得到动作空间a的视点，基于状态空间和奖励函数构建评价网络，将动作空间a的视点输入至评价网络生成评价网络评分，动作网络根据生成的评价网络评分进行动作网络和评价网络的参数训练；

9、s7,重复步骤s2-s6，动作网络和评价网络的参数训练次数达到设置的强化学习训练次数时，得到训练后的动作网络和训练后的评价网络；

10、s8,将待测航空发动机异形叶片的标准cad模型输入到训练后的动作网络和训练后的评价网络中，得到下一个最优视点，循环操作扫描设备运动到下一个最优视点并扫描待测航空发动机异形叶片的标准cad模型后，将更新后的状态空间的体素状态输入到训练后的动作网络和训练后的评价网络，得到更新后的下一个最优视点，至待测叶片覆盖率达到设置的待测叶片最大覆盖率，强化学习训练结束，得到一组最优视点。

11、优选的，步骤s2包括以下具体步骤:

12、s21,根据待测航空发动机异形叶片的标准cad模型的aabb包围盒基础上各面向外扩充一个体素单位得到待测航空发动机异形叶片的标准cad模型的包围盒体素集合，设aabb包围盒长宽高分别为lx,ly,lz，体素为边长为l的正方体，设aabb包围盒最小顶点坐标p0(x,y,z)，则扩充后的包围盒最小顶点坐标p'0(x+l,y+l,z+l)，则待测航空发动机异形叶片的标准cad模型的包围盒边长为lx+2l,ly+2l,lz+2l；

13、s22,将状态空间定义为未占有体素、占有体素和未知体素三种体素状态的集合，将状态空间的未占有体素、占有体素和未知体素分别用0，1，2表示，占有体素由扫描设备进行扫描后直接得到，扫描设备与占有体素之间的区域均为未占有体素，占有体素之后的体素为未知体素，则体素状态由下式确定，

14、

15、上式中，为未占有体素、占有体素和未知体素三种体素状态的集合，pc为扫描设备中心坐标，设扫描设备在pc处扫描后状态空间有k个体素被占有，pkv为扫描仪在pc处扫描后第k个占有体素中心坐标，1≤k≤k，pkn为从扫描仪中心pc向第k个占有体素的方向投射的射线穿过的第n个体素中心坐标，1≤n≤n；

16、s23,在扫描设备每次对待测航空发动机异形叶片的标准cad模型扫描完成后，重复步骤s22对状态空间的体素状态进行更新，同时计算得到占有体素增长率、未知体素减少率、待测叶片覆盖率、待测叶片重叠率。

17、优选的，占有体素增长率、未知体素减少率、待测叶片重叠率计算方式为：

18、

19、

20、

21、上式中rdat为占有体素增长率，rrec为未知体素减少率，re为待测叶片重叠率，num(·)表示计算体素数量，x1、x2分别为状态空间中占有体素和未知体素集合集合，x为三种体素的集合，o0、o1分别为扫描后更新获得的未占有体素集合、占有体素集合，ncad为将待测航空发动机异形叶片的标准cad模型进行重划网格和细分等处理获得模型的占有体素数量。

22、优选的，步骤s3中根据扫描设备景深约束得到动作空间a1，具体为：

23、设扫描设备在以待测航空发动机异形叶片的标准cad模型的重心oa(xa,ya,za)为球心，半径为r的球面上运动，则当r满足下式时，能保证测量模型位于扫描设备景深范围内，

24、

25、上式中：dnear为扫描设备到近平面的距离，dfar为扫描设备到远平面的距离，lx,ly,lz分别为aabb包围盒长宽高；

26、取r＝max(lx,ly,lz)/2+dnear,则根据扫描设备景深约束得到的动作空间a1为:

27、a1＝{(x,y,z)|(x-xa)2+(y-ya)2+(z-za)2＝r}

28、上式中：xa,ya,za分别表示待测航空发动机异形叶片的标准cad模型的重心oa在三轴的投影，r表示球面的半径，x,y,z分别表示扫描设备在三轴的投影。

29、优选的，步骤s3中根据机械臂动作空间约束得到的动作空间a2，具体为：

30、设机械臂的基座坐标ob(xb,yb,zb)，由于空间限制，机械臂一般不会运动到基座平面下方，则机械臂的工作空间a2可定义为下式:

31、

32、上式中d1,d2,d3分别为机械臂3节关节的长度，xb,yb,zb分别为机械臂的基座坐标ob在三轴的投影，x,y,z分别为扫描设备在三轴的投影。

33、优选的，强化学习环境的动作空间a＝a1∩a2。

34、扫描设备在动作空间a的位置用球坐标系的方位角和仰角θ表示，设测航空发动机异形叶片的标准cad模型的重心位于坐标轴原点，设扫描设备位姿为(x,y,z,c),其中c为扫描设备顶端朝向向量，则扫描设备球坐标系映射公式如下式，扫描设备始终朝向球心，

35、

36、上式中，r为球体半径，为方位角，θ为仰角，nz为z轴单位方向向量，ξ为扫描设备朝待测航空发动机异形叶片的标准cad模型的重心的单位向量；

37、优选的，步骤s4中奖励函数公式为：

38、

39、上式中，ri(si,ai)为扫描设备在体素状态si采取执行动作ai时的奖励值，si为状态空间体素状态的具体数学表示，ai为扫描设备在动作空间移动的具体数学表示，w1、w2、w3为权重，rdat为占有体素增长率，rrec为未知体素减少率，re和分别为待测叶片重叠率和待测叶片理想重叠率。

40、优选的，步骤s6进行动作网络和评价网络的参数训练包括更新评价网络参数、更新动作网络的参数和更新目标网络参数，其中更新评价网络参数具体为：

41、设初始化的评价网络q(s,a|θq)参数为θq，初始化的动作网络u(s,a|θu)参数为θu,目标评价网络q′和目标动作网络u′，

42、在动作网络预测出动作后评价网络会给出q(s,a)值作为当前状态s执行动作a后的评价分数,为了能使评价网络精确给出对应的值,更新评价网络参数θq使得l得到最小值:

43、

44、上式中,l为神经网络中的损失函数，n代表从记忆库中选择学习的样本个数,ri代表奖励值,γ代表折扣参数，q(si，ai|θq)表示在体素状态si执行动作ai后获得的评价分数，q′((si+1|θu′)|θq′)表示在体素状态si执行动作后的目标分数。

45、优选的，步骤s6中更新动作网络的参数具体步骤为：

46、在动作网络中为了能使动作网络能够获得更大q值,使用下式来更新动作网络的参数θu:

47、

48、上式中,指在体素状态si下动作网络u中各参数的梯度，n代表从记忆库中选择学习的样本个数,代表梯度,q(s,a|θq)表示评价网络，u(s|θu)表示动作网络，s表示状态值，a表示动作值。

49、优选的，步骤s6更新目标网络参数具体步骤为：

50、θq′←τθq+(1-τ)θq′

51、θu′←τθu+(1-τ)θu′

52、上式中τ代表软更新的参数，θq为初始评价网络参数，θu为初始动作网络的参数，θq′为目标评价网络参数，θu′为目标动作网络的参数。

53、本发明提供的一种基于ddpg的航空发动机异形叶片视点自主规划方法，是在连续的视点空间中选择最优的下一视点，因此能保证所选视点是最优选择，能防止无法扫描到某些区域而缺失部分信息，适用于叶片的薄壁复杂曲面结构。且相比于离散的视点空间，本方法所获得的点云数据更能满足点云数据之间的重叠率要求，保证测量精度的同时最小化视点数量减少三维测量时间。同时本发明将重叠率作为奖励函数的组成部分，促使扫描设备在用较少视点数量完成测量的同时，能保证所获得的数据之间能最大程度满足重叠率要求以提高配准精度。进一步的本发明还充分考虑扫描设备景深约束和机械臂动作空间约束的情况下对网络进行训练，向训练好的网络输入待测物体的标准cad模型即可得到在最佳视点来采集先验三维模型未知的异形叶片的表面三维信息，使求得的最优视点能应用到实际三维测量设备中。

技术特征：

1.基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，步骤s2包括以下具体步骤:

3.根据权利要求2所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，占有体素增长率、未知体素减少率、待测叶片重叠率计算方式为：

4.根据权利要求1所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，步骤s3中根据扫描设备景深约束得到动作空间a1，具体为：

5.根据权利要求4所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，步骤s3中根据机械臂动作空间约束得到动作空间a2，具体为：

6.根据权利要求5所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，根据动作空间止1和动作空间止2的交集得到强化学习环境的动作空间止，即止＝a1∩止2，扫描设备在动作空间止的位置用球坐标系的方位角和仰角θ表示，设待测航空发动机异形叶片的标准cad模型的重心为球心，位于坐标轴原点，设扫描设备位姿为(x，y，z，c)，其中c为扫描设备顶端朝向向量，扫描设备始终朝向待测航空发动机异形叶片的标准cad模型的重心，则扫描设备球坐标系映射公式如下：

7.根据权利要求3所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，步骤s4中奖励函数公式为：

8.根据权利要求7所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，步骤s6中进行动作网络和评价网络的参数训练包括更新评价网络参数、更新动作网络的参数和更新目标网络参数，其中更新评价网络参数具体为：

9.根据权利要求8所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，更新动作网络的参数具体步骤为：

10.根据权利要求9所述基于ddpg的航空发动机异形叶片视点自主规划方法，其特征在于，更新目标网络参数具体步骤为：

技术总结
本发明公开了基于DDPG的航空发动机异形叶片视点自主规划方法，包括以下步骤：S1,导入待测叶片的标准CAD模型；S2,定义强化学习环境的状态空间；S3，定义强化学习环境的动作空间；S4，定义强化学习的奖励函数，根据占有体素增长率、未知体素减少率和待测叶片重叠率误差惩罚得到奖励函数；S5，定义强化学习训练终止条件；S6，定义强化学习训练过程,进行动作网络和评价网络的参数训练；S7,重复步骤S2‑S6，得到训练后的动作网络和训练后的评价网络；S8，强化学习训练结束，得到一组最优视点。本发明是在连续空间内进行最优视点的求取，适用于叶片的薄壁复杂曲面结构，确保所选择的视点为连续空间内最优视点。

技术研发人员：方遒,叶俊,王耀南,肖湘,彭伟星,唐永鹏
受保护的技术使用者：湖南大学
技术研发日：
技术公布日：2024/6/26

转载请注明原文地址:https://doc.8miu.com/read-1828821.html

专利

最新回复(0)