本申请属于航行器自动控制,更具体地,涉及一种基于成像声呐的水下航行器对接控制方法及装置。
背景技术:
1、当前自主水下航行器已广泛应用于各种水下作业领域,如资源勘探、海底测绘、海洋结构维护等。其中欠驱动自主水下航行器由于其良好的水动力特性与简单构型,在水下巡检与搜索等高速、长航程类型任务中占领重要地位。由于水下航行器艇载能源有限,在面对长航程任务时水下航行器需要在作业过程中自主完成对接入坞补充能源并交换数据以间接提升续航能力。因此自主对接是提升水下航行器作业效率的关键技术,其中自主对接控制是保障水下航行器自主对接入坞成功率与作业安全的重要部分。而受限于传感器感知范围,如水下相机与成像声呐,水下航行器自主对接控制在消除位置与姿态误差的同时还需要考虑有限感知范围约束条件,避免在运动过程中丢失回收装置特征导致自主对接失败与安全隐患,尤其对于欠驱动水下航行器还需要结合运动学约束条件。因此,水下航行器对接控制是否能实现高精度对接的同时保持有限感知范围约束下对目标回收装置的特征捕捉是提高对接成功率与航行器安全的关键问题。
2、目前的欠驱动水下航行器的对接技术难以有效的将对回收装置的感知约束和对接运动约束相结合,因此对接过程中容易出现对接目标特征丢失的情况,导致对接最终失败。
技术实现思路
1、针对现有技术的以上缺陷或改进需求,本申请提供了一种水下航行器对接控制方法、装置、设备及存储介质,其目的在于解决欠驱动水下航行器对接运动过程中,对接目标特征易丢失的问题。
2、为实现上述目的,第一方面,本申请提供了一种水下航行器伺服对接控制方法,包括:
3、将航行器和回收装置的深度误差、航行器的纵倾角、速度与角速度作为深度跟踪控制器的输入状态向量,设计强化学习代价函数训练基于深度网络的深度跟踪控制器,实现航行器的深度跟踪控制;
4、将回收装置的相对位置、回收装置和航行器的艏向角之差、航行器的速度、角速度和转向舵的舵角作为伺服对接控制器的输入状态向量,根据所述相对位置和艏向角之差划分三种对接状态,针对不同对接状态分别设计强化学习代价函数训练基于深度网络的伺服对接控制器,实现航行器的水平面对接控制。
5、优选的,所述深度跟踪控制器的输入状态向量具体为:
6、{ez,θ,u,v,w,p,q,r}
7、其中,ez为航行器和回收装置的深度误差,θ为航行器纵倾角,u为航行器前向线速度,v为航行器侧向线速度,w为航行器垂向线速度,p为航行器横滚角速度,q为航行器纵倾角速度,r为航行器艏向角速度。
8、优选的,所述深度跟踪控制器的强化学习代价函数为:
9、rws=-kz|ez|-kθ|0|-kp|p|
10、其中,rws为深度强化学习总代价值,kz为深度误差权重,kθ为纵倾角权重,p为横滚角速度权重。
11、优选的,所述伺服对接控制器的输入状态向量具体为:
12、{x,y,eψ,u,v,w,p,q,δr,δr}
13、其中,x、y分别为回收装置相对于航行器的前向坐标和侧向坐标,eψ为回收装置和航行器的艏向角之差,u为航行器前向线速度,v为航行器侧向线速度,w为航行器垂向线速度,p为航行器横滚角速度,q为航行器纵倾角速度,δr为航行器控制时间间隔内艏向角速度差,δr为航行器转向舵的舵角。
14、优选的,根据所述相对位置和艏向角之差划分三种对接状态,具体为:
15、若满足:则对接状态为艏向右向调整;
16、若满足:则对接状态为艏向左向调整;
17、否则,对接状态为误差调整;
18、其中,为位置偏角,
19、优选的,伺服对接控制器的强化学习代价函数为:
20、艏向右向调整状态下强化学习代价函数为:
21、
22、其中,rws为对接强化学习总代价值,kχ为入坞路径偏距权重,为位置偏角权重,pχ(χ)为入坞路径偏距调和函数,为位置偏角调和函数,kr为艏向角差值权重,为舵角权重,为航行器转向舵的舵角幅值,
23、艏向左向调整状态下强化学习代价函数为:
24、
25、误差调整状态下强化学习代价函数为:
26、
27、优选的,所述入坞路径偏距调和函数pχ(χ)为:
28、
29、其中,χ为入坞路径偏距,χmax为声呐视场宽度的一半,e为自然常数;
30、所述位置偏角调和函数为:
31、
32、其中,ε为常量指数系数。
33、第二方面,本申请提供了一种水下航行器对接控制装置,包括:
34、深度跟踪单元,用于将航行器和回收装置的深度误差、航行器的纵倾角、速度与角速度作为深度跟踪控制器的输入状态向量,设计强化学习代价函数训练基于深度网络的深度跟踪控制器,实现航行器的深度跟踪控制;
35、水平对接单元,用于将回收装置的相对位置、回收装置和航行器的艏向角之差、航行器的速度、角速度和转向舵的舵角作为伺服对接控制器的输入状态向量,根据所述相对位置和艏向角之差划分三种对接状态,针对不同对接状态分别设计强化学习代价函数训练基于深度网络的伺服对接控制器,实现航行器的水平面对接控制。
36、第三方面,本申请提供一种电子设备,包括:存储器,用于存储程序;处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行第一方面或第一方面的任一种可能的实现方式所描述的方法。
37、第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,当计算机程序在处理器上运行时,使得处理器执行第一方面或第一方面的任一种可能的实现方式所描述的方法。
38、总体而言,通过本申请所构思的以上技术方案与现有技术相比,具有以下有益效果:
39、(1)本申请基于强化学习训练深度网络实现伺服对接控制,将水下航行器对接控制分解为深度跟踪控制与水平面对接控制,设计对应的强化学习代价函数训练控制器,通过非线性权重平衡代价函数中的位置误差与视场角,通过强化学习使控制器习得优化控制策略,快速消除位置误差并在成像声呐视场中保持回收装置特征,提高对接成功率并避免目标丢失导致的控制振荡;
40、(2)本申请技术方案可部署于水下航行器艇载工控机上,读取传感器反馈的状态数据与前视成像声呐后端输出,控制升降舵与转向舵执行机构,构成声视觉伺服对接控制系统,实现自主对接。
1.一种基于成像声呐的水下航行器对接控制方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述深度跟踪控制器的输入状态向量具体为:
3.根据权利要求2所述的方法,其特征在于,所述深度跟踪控制器的强化学习代价函数为:
4.根据权利要求1所述的方法,其特征在于,所述伺服对接控制器的输入状态向量具体为:
5.根据权利要求4所述的方法,其特征在于,根据所述相对位置和艏向角之差划分三种对接状态,具体为:
6.根据权利要求5所述的方法,其特征在于,伺服对接控制器的强化学习代价函数为:
7.根据权利要求6所述的方法,其特征在于,所述入坞路径偏距调和函数pχ(χ)为:
8.一种基于成像声呐的水下航行器对接控制装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,当所述计算机程序在处理器上运行时,使得所述处理器执行如权利要求1-7任一所述的方法。
