《一种改进的DTW算法的动作感知研究》-工学论文，计算机论文-论文范文参考-科学狗论文网

标题

一种改进的DTW算法的动作感知研究

范文

何剑彬　王建兴　孙瑞敏

摘要： Kinect深度图像的出现为人体动作识别提供了新的方法。在对Kinect深度图像数据二次移动平均滤波平滑的基础上，运用改进的DTW算法进行了人体动作识别研究，并在NTU-RGB数据集下进行验证。结果表明了该方法能够有效降低运行时间，提高动作感知的准确性。

关键词： Kinect； DTW算法；二次移动滤波器；动作识别

中图分类号：TP399 文献标志码：A 文章编号：1006-8228（2018）08-51-03

Research on action sensing with improved DTW algorithm

He Jianbin， Wang Jianxing， Sun Ruimin

（Department of Physics and Electronic Information Engineering， Minjiang University， Fuzhou， Fujian 350108， China）

Abstract： Kinect depth image provides new method for human action recognition. On the basis of using double moving average filter to smooth depth image data， the paper presents an improved DTW algorithm to research human action recognition， which is validated under the NTU-RGB data set. The results show that this method can effectively reduce the running time and improve the accuracy.

Key words： Kinect； DTW algorithm； double moving filter； action recognition

0 引言

人体姿态识别作为人机交互的重要领域，受到了越来越多的重视。它涉及传感器技术，计算机图像学，模式识别等多个学科。

近十年来，国内外的科研人员对人体姿态识别进行了深入研究，东华大学刘飞[1]通过Kinect获取深度图像数据，提出了一种改进的DTW算法，韩旭[2]研究了基于BP神经网络和DTW算法的在线行为识别，王松等[3]人通过深度图像投影提出Gabor特征，通过这些特征训练极限学习分类机进行分类。LV等人[4]设计了一种多个人体关节点相联合的局部空间特征，使用隐马尔可夫模式（HMM）为弱分类器对特征和动作建立时序性，使用AdaBoost结合一种动态规划（DP）算法的分类系统。Wang等人[5]使用骨架和点云数据使用局部占有模型连接特征向量，Yao等人[6]使用姿态特征编码骨架使用霍夫森林建立行为模型。姜新波[7]提出了通过建立高层模型，采用基于加权图行为方法从每一类行为的帧提出聚类中心，组成加权图的顶点，聚类中心两两之间的时间相关性，组成加权图的边，通过计算加权图和特征序列的距离来分类人体行为。

当前主流识别算法主要归纳为两类：基于机器学习的方法和基于深度学习的方法。DTW算法最初用于孤立语音识别属于动态规划思想，能够处理长短音识别问题，本文提出了一种改进的DTW算法，并在NTU RGB-D数据集下验证可行性。

1 特征向量的提取

由于现有的人体识别算法没有统一的特征向量，所以每一位研究者的特征向量提取各不相同，一般分为空时兴趣点，模型重构，形状信息。本文基于Kinect独有的深度骨骼信息，提取特征向量。Kinect2.0提供的关节数据为一个结构体，代表了关节姿态四元数jiontorientation=（w，x，y，z），其中w为旋度，x，y，z为笛卡尔坐标系下的坐标值。Kinect25个关节点分布如下：

與任何测量系统一样Kinect获取的关节坐标数据包含了噪声，经过实验测试分析表明，虽然Kinect提供了平滑处理的方法，可以满足对于普通的效果重现，但是无法满足实时性强的人体连续动作。考虑到每一个动作数据需要变化平稳，本文采用二次移动平均滤波预先处理数据。

通过二次移动平均滤波可以将原有的数据处理得到可靠的平滑数据，建立标准动作数据库，统一命名以及构建关节角度，比如，左肩关节点ShoudlderRight，左肘关节点ElbowRight，左腕关节点WristRight。构造为一个关节角度向量，命名为θWRR-ELR-SHR；根据此命名规则，可以构造下列关节向量θSHL-ELL-WRL，θHIR-KNR-ANR，θHIL-KNL-ANL，θELR-SHR-SPS，θELL-SHL-SPS，θKER-HIR-SPB，θELR-SPB-SPR，θHIL-SPB-KEL，θELR-SPB-WRR，θELL-SPB-WRL，θKER-SPB-ANR，θHIR-SPB-KER，θKER-SPB-ANL，θKEL-SPB-ANL，θWRR-ELR-SHR，一共十五个关节角度，人体体型与习惯不同，同一个连续动作所构成的特征向量也有有所不同，但是由于人体行为动作的变化是大体一致的，各个动作关节角度变化是相似的，本文提取的运动特征向量参数是基于实时关节角度，是一组时变信号，向量间距离测量采用余弦相似度，可以消除近大远小以及人体体态高矮胖瘦不同所带来的差异。

（θ为0?到180?）

人体姿态向量表示为一组15维的向量组：

其中i为帧数。

2 改进的DTW算法

DTW属于模板匹配算法。通知给定距离矩阵，找到一条从左上角到右下角的路径，以便路径传递的元素值之和为最小。

DTW算法在运行时，每次都要规划路径，存在巨大的计算量和占用大量空间等问题。本文结合文献[15-16]提出了一种新的全局路径窗口（切比雪夫窗），减少运算量并且不降低正确率。

以下讲述切比雪夫窗的DTW算法构造过程：

⑴ 针对当前动作的关节角度进行权重分配，根据影响不同分配不同的权重；

⑵ 确定窗口长度；

⑶ 对齐两运动序列坐标位置，对齐变换矩阵。

3 实验以及结果分析

本文采用南洋理工大学NTU-RGB数据集在MATLAB进行验证。NTU RGB+D动作识别数据集由56880个动作样本组成，每个样本包含4种不同的数据模式RGB视频、深度图序列、3D骨骼数据、红外线视频。其共有60个样本分类，每个文件中含有每个动作的每一帧25个关节点三维位置。

本文选择了六类动作分别喝水，跳跃，坐下，站起来，拍手，挥手进行识别验证。

本文将六类动作进行人工分类并标记标签，分别为1-6。通过DTW算法验证的所得结果如表1所示。

由表1可以看出，根据改进的DTW算法，总体识别率到达95.2%，高于传统DTW方法，见表2。

同时实验也表明：①不同动作之间时序曲线相似导致了错误识别动作类别；②基于欧式距离的方法不能对齐时间序列的相对延后或者超前，使得结果有一定的偏差。

4 结束语

本文采用改进版的DTW算法，整體识别率达到了95.2%的正确率，相比于传统DTW算法有了进步。下一步要改进算法的正确率，改进特征向量提取，针对不同动作提出不同的特征向量构建。在实际中Kinect会出现关节点坐标丢失，这一点需要采用双Kinect摄像头甚至多Kinect摄像头，虽然Kinect的深度图像在人体动作识别有着较大的优势，但不能完全取代RGB，深度摄像头有一定的空间范围，对于超出距离的仍需要从2维RGB图像进行识别。

参考文献（References）：

[1] 刘飞.基于Kinect骨架信息的人体动作识别[D].东华大学硕

士学位论文，2014.

[2] 韩旭.应用Kinect的人体行为识别方法研究与系统设计[D].

山东大学硕士学位论文，2013.

[3] 王松，党建武，王阳萍等.实时动作识别方法研究[J].计算机工

程与应用，2017.53（3）：28-31

[4] Lv F， Nevatia R. Recognition and Segmentation of 3-D

Human Action Using HMM and Multi-class AdaBoost[J]，2006.

[5] Wang P， Li W， Gao Z， et al. Action Recognition From

Depth Maps Using Deep Convolutional Neural Networks[J]. IEEE Transactions on Human-Machine Systems，2016.46（4）：498-509

[6] Gall J， Yao A， Razavi N， et al. Hough forests for object

detection， tracking， and action recognition[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence，2011.33（11）：2188

[7] 姜新波.基于三维骨架序列的人体行为识别研究[D].山东大

学硕士学位论文，2015.

[8] 付中华，赵荣椿.用窗口法在小存储器中实现DTW算法[J].西

北工业大学学报，2002.20（4）：540-543

[9] 刘贤梅，赵丹，郝爱民.基于优化的DTW算法的人体运动数据

检索[J].模式识别与人工智能，2012.2：352-360

[10] Taubin G. Distance approximations for rasterizing implicit

curves[M].ACM，1994.

随便看

科学优质学术资源、百科知识分享平台，免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。