一种基于穿戴式六轴传感数据的人体运动状态识别方法与流程

专利2022-05-09  114



1.本发明属于计算机数据挖掘技术领域,尤其是针对基于穿戴式六轴传感数据的人体运动状态识别分析方法。


背景技术:

2.多人群(包括亚健康人群、运动关节受损者、空巢老年人群等)运动安全和日常健康监测、变得非常重要。人们每天有很多运动状态,走路,跑步,坐下,起立等多种运动方式,通过对人体日常运动状态进行监测,可以指导人们制定出健康合理的饮食计划、合理安排每天的运动量,特别对老人,老年痴呆患者,把他们的日常运动数据反馈给医护人员,提高健康生活水平和运动安全有着重要的意义。
3.人体运动状态识别正在成为一个非常热门的研究课题。因人类活动的动作特征的复杂性,目前有很多基于机器学习在运动识别领域的算法研究。研究过程一般都是利用传感器收集数据,然后利用机器学习的算法进行分类。最常用的分类算法包括支持向量机(svm),k近邻(knn),c4.5,人工神经网络(ann),动态贝叶斯网络(dbn),隐马尔可夫模型(hmm),高斯马尔可夫模型(gmm)等。
4.人体运动状态识别是一个典型的分类问题,目标是检测和识别一个人的日常活动。为了更适合老人的穿戴,所设计的设备除了体积小,功耗低,成本低,无干扰外,为了能够精准的识别出人体的行为,并且能够在计算能力有限的嵌入式设备上实现,需要设计高效的识别算法。本发明基于六轴惯性传感器lsm6ds3实时采集数据,通过大数据分析,设计算法实时识别人的走路、跑步、坐下、起立、上楼梯、下楼梯等运动状态。


技术实现要素:

5.本发明公开了一种基于穿戴式六轴传感数据的人体运动状态识别分析方法。方法首先基于戴在身上的手环设备(也可配置在腰、胸等部位)采集六轴传感数据,建立运动状态的数据集;然后通过对数据进行清洗、切片截取等操作,得到与人体活动状态对应的标准数据集;接着对标准数据集通过偏移操作进行数据的增强和扩充;之后以2秒长度的数据为一个批次,提取具有方向无关的36维鲁棒性特征;最后基于随机森林算法搭建运动状态判别模型。方法具有小巧快速等特点,可加载进嵌入式硬件设备上,并接近实时(2秒一次)准确判别人体的当前运动状态。
6.本发明方法与现有技术相比,克服了传统基于时间差和阈值的运动状态识别方法的缺点,利用大数据分析与人工智能技术,自动分类识别,准确性和效率都有了进一步的提升;特别的,对数据的清洗、切片、偏移、增强扩充等操作,使得数据更加均衡和有效,也进一步提高了判断的准确性。本发明方法具有广阔的应用前景。
7.本发明方法的步骤如下:(1)建立六轴活动状态的采集数据集;(2)构建与人体六轴运动状态对应的标准数据集;
(3)对标准数据集进行增强扩充;(4)对人体运动状态进行数据特征提取;(5)基于特征构建六轴运动状态判别的算法模型;(6)基于训练数据集进行随机森林算法模型训练;(7)基于测试数据集进行运动状态识别及识别结果准确率评估。
8.其中,步骤(1)的建立六轴活动状态的采集数据集,具体为: 采用lsm6ds型号的六轴传感器设备进行数据采集,采样频率为每秒10次,读取3d 数字加速度计(x轴加速度、y轴加速度、z轴加速度)和 3d 数字陀螺仪数据(x轴角速度、y轴角速度、z轴角速度)。要检测的运动状态包括:坐下、起立、走路、跑步、上楼梯、下楼梯、睡眠,分别定义为标签:0,1,2,3,4,5,6。获得的数据以“采集设备类型

标签

时间戳

六轴信息”形式保存为文件列表集合。在文件列表集合的基础上构建出初始六轴运动状态数据集。之后对数据进行清洗,通过预先设定的合加速度阈值t1和合角速度阈值t2,根据是否小于阈值筛除掉一些脏数据。其中,合加速度的计算公式为:,其中代表x轴对应的加速度,代表y轴对应的加速度,代表z轴对应的加速度。和角速度的计算公式为:,其中代表x轴对应的角速度,代表y轴对应的角速度,代表z轴对应的角速度。
9.其中,步骤(2)构建与人体六轴运动状态对应的标准数据集,具体为: 首先基于采集数据集划分出有效活动时间的数据区间。有效活动时间是指数据记录过程中,处在运动状态的时间区间。通过对整个数据文件进行数据切片,切成一段一段的数据集合;然后对每段数据内的数据进行计算合加速度之和,求出合加速度之和最大的段将其选为有效数据的中心位置,并以此位置作为中心;最后,依次从近到远遍历邻近数据段,如果数据段的合加速度之和小于事先定义的阈值t,则终止遍历,从而得到数据文件中有效活动时间的数据段。
10.其中,步骤(3)对标准数据集进行增强扩充,有两种数据增强方案,具体为: 第一种数据增强方案是:将有效活动时间对应的数据部分在其所在的数据段中进行整体平移,每移动一个单位数据就得到一个新的数据样本。移动的范围区间为
±
16%*l,其中l为有效活动时间对应的数据长度。通过上述步骤得到第一部分的扩充数据集,该部分数据集只用于训练模型,不用于测试。第二种数据增强方案是:通过找到有效活动时间的中心点,以该点为中心截取2秒长度的数据作为一个批次的数据,并每次向两边偏移一个数据单位,每偏移一个数据单位得到一个数据样本。偏移范围区间为2秒*
±
16%的数据区间,从而得到第二部分的扩充数据集。此部分数据集只用于测试,以更贴合实际应用环境,更好地测试模型的泛化性。
11.其中,步骤(4)对人体运动状态进行数据特征提取,具体为: 在数据特征提取时,每次取2秒长度的数据作为一个批次的数据进行特征提取。分别计算2秒钟内数据的平均值、标准差、最大值、最小值、平方和/长度,以及皮尔逊系数。分别提取2秒长度的六轴数据中每轴的上述统计量,包括每轴对应的平均值、标准差、最大值、最小值、平方和/长度,因此
得到30维的数据统计特征信息。之后基于皮尔逊系数计算2秒钟x、y、z轴加速度不同方向的相关性;以及陀螺仪x、y、z轴对应的角速度不同方向的相关性,共得到6维的数据相关性特征信息。将上述30维的数据统计特征信息,并上6维的数据相关性特征信息,总共得到36维的人体运动状态数据特征。最后获得“36维数据特征

标签”的数据集形式,并将数据集分为了训练集、测试集两部分。
12.其中,步骤(5)基于特征构建六轴运动状态判别的算法模型,具体为: 六轴运动状态判别算法是通过搭建随机森林(random forest,rf)算法模型实现的。随机森林算法主要通过联合多个弱分类器,每个分类器进行投票得到最终结果。随机森林是一个有多个决策树的分类器,并且每个决策树之间是不关联的,当需要测试的数据进入随机森林时,其中的每棵树会进行分类,其输出的类别是由一些树输出结果的众数所决定的,最终在所有决策树中分类最多的结果就是最终的分类。经过随机森林算法对样本数据进行训练并得到运动状态分类器。具体的模型参数如下表。
13.表.随机森林算法的模型参数
14.其中,步骤(6) 基于训练数据集进行随机森林算法模型训练,具体为: 六轴运动状态判断的模型训练和识别流程包括4个阶段:准备数据集、设计学习模型、训练模型和验证模型。其中,准备数据集阶段包括四个步骤,首先采样六轴运动数据,生成六轴数据文件;其次对数据进行数据清洗、数据增强以及数据特征提取;最后反复训练、测试六轴运动状态类型。模型的设计过程包括:评估机器学习模型,选择基本的模型框架,设置超参数等步骤。之后进行模型的训练过程,通过捕捉数据的特征信息进行不断学习并优化模型的参数。将训练后的模型使用测试数据以进行验证模型的效果,测试模型的泛化性。经过随机森林算法对样本数据进行多次迭代训练后,最终得到期望的运动状态分类器模型。
15.其中,步骤(7)基于测试数据集进行运动状态识别及识别结果准确率评估,具体为: 数据集分为训练集和测试集,首先把训练集输入随机森林分类器进行训练,然后利用测试集进行仿真测试。所搭建的基于随机森林的运动状态判别模型在自建的六轴运动状态数据集上识别的准确率为93.9%,具体每个运动状态分类的识别准确率如下表。
16.表.运动状态的准确率评估
附图说明
17.图1是六轴运动状态识别处理的流程图。
18.图2是六轴运动状态识别模型训练和识别的流程模块图。
19.图3随机森林算法的bagging结构。
20.图4是六轴运动状态数据集运动状态识别结果的混淆矩阵。
具体实施方式
21.下面结合附图和实例,对本发明进行详细的描述。
22.运动状态判断是针对用户的运动行为进行各种运动状态的判断。本发明所包含的运动状态包含了坐下、起立、走路、跑步、上楼梯、下楼梯、睡眠。通过用户佩戴的硬件设备读取用户的六轴传感运动数据,进而判断用户的运动状态。
23.在运动状态判断时,由于不同运动动作的持续时间不同,动作姿势多样化,本发明公开了一种基于穿戴式六轴传感数据的人体运动状态识别分析方法。方法通过自建的六轴运动状态数据集,识别用户的运动状态,并应用于分析用户全天的运动状态,跟踪用户的运动特征变化,进而进一步分析用户的身体机能状态。六轴运动状态识别处理的流程图如图1所示。
24.方法首先基于戴在身上的手环设备(也可配置在腰、胸等部位)采集六轴传感数据,建立运动状态的数据集;然后通过对数据进行清洗、切片截取等操作,得到与人体活动状态对应的标准数据集;接着对标准数据集通过偏移操作进行数据的增强和扩充;之后以2秒长度的数据为一个批次,提取具有方向无关的36维鲁棒性特征;最后基于随机森林算法搭建运动状态判别模型。方法具有小巧快速等特点,可加载进嵌入式硬件设备上,并接近实时(2秒一次)准确判别人体的当前运动状态。六轴运动状态识别模型训练和识别的流程模块图如图2所示。方法的具体实施步骤如下。
25.一、建立六轴活动状态的采集数据集。
26.要检测的运动状态包括:坐下、起立、走路、跑步、上楼梯、下楼梯、睡眠,对此我们分别定义标签为:0,1,2,3,4,5,6。数据采集采用lsm6ds型号的六轴传感器设备,采样频率为每秒10次,读取3d 数字加速度计(x轴加速度、y轴加速度、z轴加速度)和 3d 数字陀螺仪数据(x轴角速度、y轴角速度、z轴角速度)。获得的数据以“采集设备类型

标签

时间戳

六轴信息”形式保存为文件列表集合。在文件列表集合的基础上构建出六轴运动状态数据集。
27.为保证数据的有效性,需要对数据进行清洗。在数据清洗的过程中,需要过滤掉数据文件中的脏数据,以达到提升模型准确率的效果。经过统计观察,当用户处于运动状态时,数据的合加速度和合角速度的数值会剧增。因此通过预先设定的合加速度阈值t1和合角速度阈值t2,根据是否小于阈值筛除掉一些脏数据。合加速度的计算公式为:,其中代表x轴对应的加速度,代表y轴对应的加速度,代表z轴对应的加速度。和角速度的计算公式为:,其中代表x轴对应的角速度,代表y轴对应的角速度,代表z轴对应的角速度。
28.二、构建与人体六轴运动状态对应的标准数据集。
29.在采集数据集的基础上,构建与人体六轴运动状态对应的标准数据集。方法首先基于采集数据集划分出有效活动时间的数据区间。有效活动时间是指数据记录过程中,处在运动状态的时间区间。具体步骤为:首先通过对整个数据文件进行数据切片,切成一段一段的数据集合;然后对每段数据内的数据进行计算合加速度之和,求出合加速度之和最大的段将其选为有效数据的中心位置,并以此位置作为中心;最后,依次从近到远遍历邻近数据段,如果数据段的合加速度之和小于事先定义的阈值t,则终止遍历,从而得到数据文件中有效活动时间的数据段。
30.三、对标准数据集进行增强扩充。
31.在数据增强部分采用了两种数据增强方案。
32.第一种数据增强方案是:将有效活动时间对应的数据部分在其所在的数据段中进行整体平移,每移动一个单位数据就得到一个新的数据样本。移动的范围区间为
±
16%*l,其中l为有效活动时间对应的数据长度。通过上述步骤得到第一部分的扩充数据集,该部分数据集只用于训练模型,不用于测试。
33.第二种数据增强方案是:通过找到有效活动时间的中心点,以该点为中心截取2秒长度的数据作为一个批次的数据,并每次向两边偏移一个数据单位,每偏移一个数据单位得到一个数据样本。偏移范围区间为2秒*
±
16%的数据区间,从而得到第二部分的扩充数据集。此部分数据集只用于测试,以更贴合实际应用环境,更好地测试模型的泛化性。
34.四、对人体运动状态进行数据特征提取。
35.在数据特征提取时,每次取2秒长度的数据作为一个批次的数据进行特征提取。分别计算2秒钟内数据的平均值、标准差、最大值、最小值、平方和/长度,以及皮尔逊系数。计算公式如下表1所示。
36.表1 数据特征提取公式表。
37.其中代表2秒长度所对应的六轴数据中其中一维的数据集合。
38.将六轴2秒内的数据压缩转换成维度为36*1的矩阵,具体步骤为:分别提取2秒长度的六轴数据中每轴的上述统计量,包括每轴对应的平均值、标准差、最大值、最小值、平方和/长度,因此得到30维的数据统计特征信息。之后基于皮尔逊系数计算2秒钟x、y、z轴加速度不同方向的相关性;以及陀螺仪x、y、z轴对应的角速度不同方向的相关性,共得到6维的数据相关性特征信息。将上述30维的数据统计特征信息,并上6维的数据相关性特征信息,总共得到36维的人体运动状态数据特征。最后获得“36维数据特征

标签”的数据集形式,并将数据集分为了训练集、测试集两部分。
39.五、基于特征构建六轴运动状态判别的算法模型。
40.六轴运动状态判别算法是通过搭建随机森林(random forest,rf)算法模型实现的。随机森林是一种集成学习算法(ensemble learning),它属于 bagging 类型,随机森林算法的bagging结构如图3所示。随机森林算法主要通过联合多个弱分类器,每个分类器进行投票得到最终结果。随机森林其实就是一个有多个决策树的分类器,并且每个决策树之间是不关联的,当需要测试的数据进入随机森林时,其中的每棵树会进行分类,其输出的类别是由一些树输出结果的众数所决定的,最终在所有决策树中分类最多的结果就是最终的分类。由于“随机”可以使它具有抗过拟合能力,而“森林”使它更加精确,使其能取得很好的分类效果。经过随机森林算法对样本数据进行训练并得到运动状态分类器。具体的模型参数如下表2所示。
41.表2.随机森林算法的模型参数
42.六、基于训练数据集进行随机森林算法模型训练。
43.在搭建六轴运动算法的基础上,结合构建的训练数据集,开始进行模型训练。六轴运动状态判断的模型训练和识别流程如图2所示。包括4个阶段:准备数据集、设计学习模型、训练模型和验证模型。其中,准备数据集阶段包括四个步骤,首先采样六轴运动数据,生成六轴数据文件;其次对数据进行数据清洗、数据增强以及数据特征提取;最后反复训练、测试六轴运动状态类型。模型的设计过程包括:评估机器学习模型,选择基本的模型框架,设置超参数等步骤。之后进行模型的训练过程,通过捕捉数据的特征信息进行不断学习并优化模型的参数。将训练后的模型使用测试数据以进行验证模型的效果,测试模型的泛化性。经过随机森林算法对样本数据进行多次迭代训练后,最终得到我们期望的运动状态分类器模型。
44.七、基于测试数据集进行运动状态识别及识别结果准确率评估。
45.数据集分为训练集和测试集,首先把训练集输入随机森林分类器进行训练,然后利用测试集进行仿真测试。本发明所搭建的基于随机森林的运动状态判别模型在自建的六轴运动状态数据集上识别的准确率为93.9%,状态识别的混淆矩阵如图4所示。具体每个运动状态分类的识别准确率如下表3所示。
46.表3.运动状态的准确率评估
47.综上,本发明提出了一种基于穿戴式六轴传感数据的人体运动状态识别分析方法。方法基于六轴运动状态数据集,通过对采集数据进行清洗、切片截取、偏移增强扩充后,采用随机森林机器学习方法进行模型网络训练;之后运用训练好的模型,基于实时采集到的手环六轴运动数据,准实时(2秒一次)识别用户的运动状态并进行记录。可根据用户的一天的作息安排进行回溯修正之前的运动状态,从而得到用户一天的完整且准确的运动情况。
48.本发明方法尽管为说明目的公开了本发明的具体实施例和附图,其目的在于帮助
理解本发明的内容并据以实施,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是不可能的。因此,本发明不应局限于最佳实施例和附图所公开的内容。当前公开的实施例在所有方面应被理解为说明性的而非对其请求保护的范围的限制。

技术特征:
1.一种基于穿戴式六轴传感数据的人体运动状态识别方法,其特征在于所述方法包括如下步骤:(1)建立六轴活动状态的采集数据集;采用lsm6ds型号的六轴传感器设备进行数据采集,采样频率为每秒10次,读取3d 数字加速度计(x轴加速度、y轴加速度、z轴加速度)和 3d 数字陀螺仪数据(x轴角速度、y轴角速度、z轴角速度);要检测的运动状态包括:坐下、起立、走路 、跑步、上楼梯、下楼梯、睡眠,分别定义为标签:0,1,2,3,4,5,6;获得的数据以“采集设备类型

标签

时间戳

六轴信息”形式保存为文件列表集合;之后对数据进行清洗,通过预先设定的合加速度阈值t1和合角速度阈值t2,根据是否小于阈值筛除掉一些脏数据;(2)构建与人体六轴运动状态对应的标准数据集;基于采集数据集划分出有效活动时间的数据区间;有效活动时间是指数据记录过程中,处在运动状态的时间区间;首先通过对整个数据文件进行数据切片,切成一段一段的数据集合;然后对每段数据内的数据进行计算合加速度之和,求出合加速度之和最大的段将其选为有效数据的中心位置,并以此位置作为中心;最后,依次从近到远遍历邻近数据段,如果数据段的合加速度之和小于事先定义的阈值t,则终止遍历,从而得到数据文件中有效活动时间的数据段;(3)对标准数据集进行增强扩充;采用两种数据增强方案分别用于训练数据和测试数据的增强;训练数据的增强扩充是通过将有效活动时间对应的数据部分在其所在的数据段中进行整体平移,每移动一个单位数据就得到一个新的数据样本,移动的范围区间为
±
16%*l;测试数据的增强是通过找到有效活动时间的中心点,以该点为中心截取2秒长度的数据作为一个批次的数据,并每次向两边偏移一个数据单位,每偏移一个数据单位得到一个数据样本;偏移范围区间为2秒*
±
16%的数据区间;(4)对人体运动状态进行数据特征提取;每次取2秒长度的数据作为一个批次的数据进行特征提取;分别提取2秒长度的六轴数据中每轴的上述统计量,包括每轴对应的平均值、标准差、最大值、最小值、平方和/长度;得到30维的数据统计特征信息;之后基于皮尔逊系数计算2秒钟x、y、z轴加速度不同方向的相关性;以及陀螺仪x、y、z轴对应的角速度不同方向的相关性,共得到6维的数据相关性特征信息;最后综合得到36维的人体运动状态数据特征;(5)基于特征构建六轴运动状态判别的算法模型;六轴运动状态判别算法是通过搭建随机森林(random forest,rf)算法模型实现的;主要通过联合多个弱分类器,每个分类器进行投票得到最终结果;经过随机森林算法对样本数据进行训练并得到运动状态分类器;(6)基于训练数据集进行随机森林算法模型训练;模型训练和识别流程包括4个阶段:准备数据集、设计学习模型、训练模型和验证模型;其中,准备数据集阶段包括四个步骤:采样六轴运动数据、数据清洗、数据增强以及数据特征提取;模型的设计过程包括:评估机器学习模型,选择基本的模型框架,设置超参数等步骤;之后进行模型的训练过程,通过捕捉数据的特征信息进行不断学习并优化模型的参数;(7)基于测试数据集进行运动状态识别及识别结果准确率评估;首先把训练集输入随机森林分类器进行训练,然后利用测试集进行仿真测试;所搭建的基于随机森林的运动状态判别模型在自建的六轴运动状态数据集上识别的准确率为93.9%。2.根据权利要求1所述的一种基于穿戴式六轴传感数据的人体运动状态识别方法,其特征在于对标准数据集进行的增强扩充方案;
第一种数据增强方案是:将有效活动时间对应的数据部分在其所在的数据段中进行整体平移,每移动一个单位数据就得到一个新的数据样本;移动的范围区间为
±
16%*l,其中l为有效活动时间对应的数据长度;通过上述步骤得到第一部分的扩充数据集,该部分数据集只用于训练模型,不用于测试;第二种数据增强方案是:通过找到有效活动时间的中心点,以该点为中心截取2秒长度的数据作为一个批次的数据,并每次向两边偏移一个数据单位,每偏移一个数据单位得到一个数据样本;偏移范围区间为2秒*
±
16%的数据区间,从而得到第二部分的扩充数据集;此部分数据集只用于测试,以更贴合实际应用环境,更好地测试模型的泛化性。3.根据权利要求1所述的一种基于穿戴式六轴传感数据的人体运动状态识别方法,其特征在于对人体运动状态进行的数据特征提取;在数据特征提取时,每次取2秒长度的数据作为一个批次的数据进行特征提取;分别计算2秒钟内数据的平均值、标准差、最大值、最小值、平方和/长度,以及皮尔逊系数;分别提取2秒长度的六轴数据中每轴的上述统计量,包括每轴对应的平均值、标准差、最大值、最小值、平方和/长度,因此得到30维的数据统计特征信息;之后基于皮尔逊系数计算2秒钟x、y、z轴加速度不同方向的相关性;以及陀螺仪x、y、z轴对应的角速度不同方向的相关性,共得到6维的数据相关性特征信息;将上述30维的数据统计特征信息,并上6维的数据相关性特征信息,总共得到36维的人体运动状态数据特征;最后获得“36维数据特征

标签”的数据集形式,并将数据集分为了训练集、测试集两部分。
技术总结
本发明公开了一种基于穿戴式六轴传感数据的人体运动状态识别分析方法。方法首先基于戴在身上的手环设备(也可配置在腰、胸等部位)采集六轴传感数据,建立运动状态的数据集;然后通过对数据进行清洗、切片截取等操作,得到与人体活动状态对应的标准数据集;接着对标准数据集通过偏移操作进行数据的增强和扩充;之后以2秒长度的数据为一个批次,提取具有方向无关的36维鲁棒性特征;最后基于随机森林算法搭建运动状态判别模型。方法具有小巧快速等特点,可加载进嵌入式硬件设备上,并接近实时(2秒一次)准确判别人体的当前运动状态。秒一次)准确判别人体的当前运动状态。秒一次)准确判别人体的当前运动状态。


技术研发人员:洪志令 张恒彰 曹玉萍
受保护的技术使用者:厦门中翎易优创科技有限公司
技术研发日:2021.03.26
技术公布日:2021/7/8

转载请注明原文地址:https://doc.8miu.com/read-576900.html

最新回复(0)