本发明属于机器模仿学习领域,涉及一种康复机器人控制方法,尤其涉及一种基于概率运动原语(promp)和隐半马尔可夫(hsmm)的康复机器人变阻抗控制方法,优化了康复机器人的在镜像控制下的轨迹产生。
背景技术:
康复机器人是工业机器人和医用机器人的结合,主要是为了迎合医疗护理人员与康复需求,辅助患者运动有障碍的患肢或者关节,以达到帮助患者康复的目的。目前主要分为可穿戴型(外骨骼型)与独立型两种。
在机器学习中,如何让机器泛化示教的运动数据来生成所需的控制参数是一大问题,常用方法可以利用概率运动原语来解决。概率运动原语在运动原语的基础上做了改进,通过概率论的运算,把参数向量用概率分布的形式表示;具有对适应新目标,易于调节控制参数的优点等。
在人机示教中,隐马尔可夫模型常用于分析状态序列,该模型假设下一状态仅与当前状态有关。而隐半马尔可夫模型将某状态驻留的概率用时间概率函数表示,可以更好地表述时间信息。利用高斯线性回归的公式,可以实现对示教的运动数据的泛化。
对于独立型上肢康复机器人,阻抗控制为其常用的控制方式之一,其主要优点为柔顺性高、对扰动和不确定性具有很好的鲁棒性,是实现力控的常用方式,因此非常适合应用在康复场景中,以避免对患者肢体的二次伤害。而变阻抗控制的意义在于能够适时地调整刚度值。
技术实现要素:
为解决上述问题,本发明公开了基于概率运动原语和隐半马尔可夫的康复机器人控制方法,首次将概率运动原语和隐半马尔可夫用于生成康复机器人的控制参数,通过机器学习,模仿健侧上肢运动生成患肢康复运动轨迹,可以有效利用患者健侧肢体辅助康复训练,通过模仿健侧肢体的运动控制康复机器人,可以达到更好的康复训练效果,同时提高康复效率,大大减少了康复医生的工作负担。
为达到上述目的,本发明的技术方案如下:
一种基于概率运动原语和隐半马尔可夫的康复机器人控制方法,包括以下步骤:
(1)记录多次健侧上肢的运动信息,包括手臂末端刚度、轨迹等信息;
(2)通过概率运动原语对步骤(1)记录的刚度进行泛化;
(3)运用隐半马尔可夫模型对步骤(1)中记录的数据进行泛化,生成轨迹。其中隐半马尔可夫模型的参数由em算法(expectation-maximization)估计得到,而后控制参数由高斯回归算法计算;
(4)将泛化的轨迹进行镜像;
(5)通过镜像后的轨迹、变化的刚度信息对康复机器人的末端进行变阻抗控制。
进一步的,所述步骤(1)中,将示教时记录下的刚度、轨迹(包括位置和速度)信息写成向量形式,有:
xd,t=(x1,t,...,xd,t)t
kd,t=(k1,t,...,kd,t)t
其中,d代表自由度,t代表时间。
进一步的,所述步骤(2)中,包括以下分步骤:
(a1)通过步骤(1)中提取的运动信息,确定肌刚度向量yt表达式;
(a2)根据概率运动原语公式,写出yt的高斯分布表达式;
(a3)对示教提取的刚度数据,运用极大似然估计算法,得出μω*,∑ω*;并计算出控制参数
进一步的,所述步骤(3)中,包括以下分步骤:
(b1)对关节的每个自由度分别建立隐半马尔可夫模型,写出表达式;
(b2)使用em算法,对每个自由度中的隐半马尔可夫模型参数进行计算,得出参数值;
(b3)写出在t时刻时在第i个状态的概率的相应表达式;
(b4)利用高斯回归公式,计算控制参数
进一步的,所述步骤(5)中,所采用的方法为变阻抗控制,利用步骤(2)和步骤(3)中计算出的控制参数,通过变阻抗控制相应的策略实现柔顺控制。
本发明的有益效果:
本发明使用机器学习中的概率运动原语和隐半马尔可夫用于生成康复机器人的控制参数,并用变阻抗的方法控制,比传统的直接提取数据控制的方法,柔顺性高,更加能够保护患者肢体免受二次伤害,可以达到更好的康复训练效果。
附图说明
图1为本发明所述的基于概率运动原语和隐半马尔可夫的康复机器人控制方法的流程图。
图2为本发明所述的基于概率运动原语和隐半马尔可夫的康复机器人控制方法中阻抗控制的示意图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
如图所示,一种基于概率运动原语和隐半马尔可夫的康复机器人控制方法,具体包括以下步骤:
(1)记录多次健侧上肢的运动信息,包括手臂末端刚度、轨迹等信息。
(2)通过概率运动原语对(1)记录的刚度进行泛化。
(3)运用隐半马尔可夫模型对(1)中记录的数据进行泛化,生成轨迹。其中隐半马尔可夫模型的参数由em算法(expectation-maximization)估计得到,而后控制参数由高斯回归算法计算。
(4)将泛化的轨迹进行镜像。
(5)通过镜像后的轨迹、变化的刚度信息对康复机器人的末端进行变阻抗控制。
对所述步骤(1),将示教时记录下的刚度,位置和速度信息写成向量形式,有:
xd,t=(x1,t,...,xd,t)t
kd,t=(k1,t,...,kd,t)t
其中,d代表自由度,t代表时间
对所述步骤(2),包括下列分步骤:
(a1)通过(1)中提取的运动信息,确定向量
yt=(k1,t,k2,t,...,kd,t)t=ψtω ∈y
其中,kt为d个自由度的肌刚度数据,t=0,1,...,n为时间,ω为权向量,∈y为期望为0的高斯分布噪声,方差为∑y,φi,t为时间相关的基函数,对重复规律型运动,可令基函数为:
其中,
其中z(t)为任意的时间单调增函数,h为带宽,ci为第i个基函数的中心
(a2)根据概率运动原语公式,有:
其中
(a3)对示教提取的刚度数据,运用极大似然估计算法,得出μω*,∑ω*;并令控制参数
对于所述步骤(3),包括下列分步骤:
(b1)对关节的每个自由度分别建立隐半马尔可夫模型,可通过下列参数,表示为:
其中,πi为第i个状态为初始状态的概率,ai,j为从状态j转移到下一状态i的概率,k为状态总数;
其中t=1,2,...,tmax,
在第i状态的每一个时间t中,观测到的数据服从高斯分布,μi,∑i分别为分布的期望与方差,对此,有:
其中,
(b2)使用em算法,对每个自由度的
(b3)对在t时刻时在第i个状态的概率,有公式:
其中x1为初始位置
(b4)利用高斯回归公式,计算控制参数
其中,
对所述步骤(5),利用(2)中和(3)中计算出的控制参数,有:
其中kj为主对角线是(k1,t*,k2,t*,...,kd,t*)元素的对角阵,dj为相应的阻尼矩阵,τcmd为机械臂的力矩;
通过检测使用者手臂的力信号,根据阻抗控制的公式,输出相应的力矩。
本发明首次将概率运动原语和隐半马尔可夫用于生成康复机器人的控制参数,通过机器学习,模仿健侧上肢运动生成患肢康复运动轨迹,可以有效利用患者健侧肢体辅助康复训练,用变阻抗的方法控制,比传统的直接提取数据控制的方法,柔顺性高,更加能够保护患者肢体免受二次伤害,可以达到更好的康复训练效果;同时提高康复效率,大大减少了康复医生的工作负担。
1.一种基于概率运动原语和隐半马尔可夫的康复机器人控制方法,其特征在于:包括以下步骤:
(1)记录多次健侧上肢的运动信息,包括手臂末端刚度、位置、速度的信息;
(2)通过概率运动原语对步骤(1)记录的刚度进行泛化;
(3)运用隐半马尔可夫模型对步骤(1)中记录的数据进行泛化,生成轨迹;其中隐半马尔可夫模型的参数由em算法估计得到,而后控制参数由高斯回归算法计算;
(4)将泛化的轨迹进行镜像;
(5)通过镜像后的轨迹、变化的刚度信息对康复机器人的末端进行变阻抗控制。
2.根据权利要求1所述的基于概率运动原语和隐半马尔可夫的康复机器人变阻抗控制方法,其特征在于,所述步骤(2)中,包括以下分步骤:
(a1)通过(1)中提取的运动信息,确定肌刚度向量yt表达式;
(a2)根据概率运动原语公式,写出yt的高斯分布表达式;
(a3)对示教提取的刚度数据,运用极大似然估计算法,得出μω*,σω*;并计算出控制参数
3.根据权利要求1所述的基于概率运动原语和隐半马尔可夫的康复机器人变阻抗控制方法,其特征在于,所述步骤(3)中,包括以下分步骤:
(b1)对关节的每个自由度分别建立隐半马尔可夫模型,写出表达式;
(b2)使用em算法,对每个自由度中的隐半马尔可夫模型参数进行计算,得出参数值;
(b3)写出在t时刻时在第i个状态的概率的相应表达式;
(b4)利用高斯回归公式,计算控制参数
4.根据权利要求1所述的基于概率运动原语和隐半马尔可夫的康复机器人变阻抗控制方法,其特征在于,所述步骤(5)中,所采用的方法为变阻抗控制,利用(2)中和(3)中计算出的控制参数,通过变阻抗控制相应的策略实现柔顺控制。
5.根据权利要求1所述的一种基于概率运动原语和隐半马尔可夫的康复机器人控制方法,其特征在于:所述步骤(5)中,所采用的方法为变阻抗控制,利用步骤(2)和步骤(3)中计算出的控制参数,通过变阻抗控制相应的策略实现柔顺控制。
技术总结