手势控制

2024-09-01

手势控制(共12篇)

手势控制 篇1

0 引言

近年来,嵌入多种MEMS(Micro-Electro-Mechanical System)传感器的可穿戴电子设备发展迅速,如谷歌眼镜、阿迪达斯运动鞋和爱心运动手环等。同时,将人机交互和可穿戴设备相结合逐渐成为研究热点,其中手势识别技术在人机交互领域扮演着一个重要的角色[1]。在手势识别技术中,基于运动传感器的手势识别技术[2,3]相比基于图像的手势识别方法避免了环境因素的干扰,成为了一种简单的交互方式,国内外学者基于此做了大量研究。Min等利用K均值聚类算法提取手势模板,在识别阶段通过动态时间规整算法进行输入手势与手势模板的匹配计算,从手势数据中计算特征量,利用贝叶斯分类器对手势进行预分类,再与相应类中的手势模板进行匹配[5]。Thomas等开发了一种手持Wii控制器,算法中通过量化三维加速度向量和建立隐性马尔科夫模型进行手势识别,平均识别率为90%[6]。XU等提出了符号序列结合霍普菲尔德(Hopfield)神经网络、速度增量和符号序列结合模板匹配三种算法,分别对手势的速度数据进行编码,识别率为95.6%[7]。黄刘松[8]等提出一种基于加速度传感器的乒乓球击球动作识别算法,利用固定阈值法截取手势数据,提取能量信号和手势长度等特征,识别过程采用K近邻和决策树算法。

基于以上分析,本文设计了一种可穿戴于手指上的手势识别控制器,相比传统的手持设备,其获取手势的方式更加自由随意,提高了用户的体验性;同时,采用特征提取的方法实现手势识别,利用特征量阈值进行分类提高手势识别算法的准确率,相比于其他方法不仅计算量小,而且省去了复杂的模板建立过程,提高了手势识别算法的个体适应性。

1 系统的总体设计方案

可穿戴手势识别控制器组成如图1所示,主控芯片ATmega328控制各模块运行,接收姿态模块MPU6050传感器采集的三轴加速度、角速度和和通过姿态解算得到的三轴姿态角,然后将数据由Wi Fi模块传给上位机,进行手势数据的截取,通过提取运动手势的特征量进行手势分类。

设备体积大小只有2.3 cm×1.4 cm×0.8 cm,通过5 V锂电池为系统供电,控制器的实物图正、反面如图2所示,穿戴于食指的第二个关节上。

2 手势定义

手势动作的定义应易于学习与使用,且具有明显的特征。本文定义六类简单手势,如表1所示。

3 手势识别算法

3.1 手势数据预处理

微惯性传感器能够采集动态的手势数据,但由于敏感原件的固有特性会产生随机噪声,所以采用卡尔曼滤波方法(Kalman)对获取的加速度、角速度数据等进行平稳去噪处理。卡尔曼滤波方法仅需知道前一时刻的估算值和当前测量值,通过时间更新和观测更新方程不断迭代获得当前状态信息和滤波增益[9],相比于小波变换[10]、傅里叶变换方法节省了数据的存储空间和算法的编译时间。通过设定观测噪声协方差和过程噪声协方差矩阵相近的取值,可以剔除手势数据中的高频噪声,角速度的滤波效果如图3所示。

3.2 手势数据截取

控制器在平稳状态下输出相对稳定的数据,当手指操作时,传感器采集的加速度和角速度都会有明显变化,因此采用差分值法进行手势数据截取,如式(1):

其中,Xkacc、Ykacc、Zkacc表示k时刻下的三轴加速度,Xkagr、Ykagr、Zkagr表示k时刻下的三轴角速度。在6种手势中敲击运动的加速度与角速度变化量最小,所以本设计通过敲击类的起止点阈值进行手势数据的截取。经过测试,加速度起点及终点的阈值δth1=0.3 m/s2,当加速度差分值在5个数据点内满足△acc N>δth1时,确定为手势加速度起点,满足△acc N<δth1时,判断为加速度终点,角速度起点及终点的阈值δth2=8 rad/s,当角速度差分值在5个数据点满足△agr N>δth2时,确定为手势角速度起点,满足△agr N<δth2时,判断为角速度终点。如图4所示。

3.3 特征量提取

在手势识别过程中,惯性传感器设备坐标系不断改变,最终产生的数据有很大差异,所以需将设备坐标转变为用户坐标系,然后分析这些手势数据。确定了6个特征量对手势进行分类:

(1)手势长度L:手势运动中从起点到终点的手势数据采样个数。

(2)手势能量E:手势在运动过程中的剧烈程度被称为手势能量,计算为从手势起点到终点的所有三轴角速度和三轴加速度之和,如式(2):

其中,L为手势长度,wxi、wyi、wzi为手势在X、Y、Z轴上的角速度,axi、ayi、azi分别为手势在三轴上的加速度,g为重力加速度。

(3)角速度能量最大轴:每个轴角速度能量计算方法如式(3)所示,角速度能量最大轴为分别计算各轴角速度总和之后比较得出的最大者,即max(Ewx,Ewy,Ewz)所在的坐标轴。

(4)加速度波峰数:即三轴加速度波峰数之和,每个坐标轴的波峰数提取方法如图5所示。首先找出手势加速度数据与横轴的所有交点A1、A2、A3、A4、A5……,然后在这些相邻两交点间找出加速度绝对值最大值点B1、B2、B3、B4……,它们中大于波峰数阈值范围的个数为加速度波峰数。

(5)姿态角变化量△a:控制器在运动起点与终点时的三轴姿态角的分别差值的总和,如下式:

式中,θA、φA、γA分别为手势开始时的设备姿态角,θB、φB、γB分别为手势结束时的设备姿态角。

(6)单符号角速度:手势操作时,任何一个坐标轴上的角速度始终为正值或负值,为单符号角速度。

3.4 手势分类与识别

操作可穿戴设备过程中,一些不规则手势将会影响手势识别的准确率,所以经过分析6种手势数据后,本算法将手势动作不满足手势长度L>30或手势能量E>50的条件当做误动作去除。手势能量E范围在1 500以内,不规则手势运动的手势能量大于该阈值时同样将判为误动作不进行手势分类与识别,从而提高手势识别算法的鲁棒性。本文采用决策树分类器对6种手势进行分类,如图6所示。

第一层:敲击手势持续时间短,产生手势数据个数少且运动剧烈程度小,因此根据手势长度、手势能量两个特征量阈值区分出敲击类手势。

第二层:翻转手势主要是绕X轴作旋转运动,角速度能量主要集中于X轴,所以利用X轴是否为角速度能量最大轴即可识别出翻转手势。

第三层:划叉、晃动、划钩、甩动手势间的手势长度、手势能量、加速度波峰数特征量都有一定的交集,所以利用Fisher线性分类算法将4种手势分为两类:f=43×L+65×E+124×P-29 900,当f>0为划叉和晃动类手势,反之为划钩和甩动类手势。

第四层:分析晃动和划叉手势的起止点的三轴姿态角数据,得出划叉比晃动手势的姿态角变化量大,以此区分这两类手势。甩动手势是绕Z坐标轴作单方向的旋转运动,满足单符号角速度特征,因此和划钩手势进行区分。

4 实验结果

考虑到用时最短的敲击手势频率小于10 Hz,只要采样频率大于手势动作的2~3倍就可以获得完整的动作数据信息,所以本设计分别以不同的频率进行数据采样,按照以上识别算法进行平均识别时间和准确率测试如表2所示。随着采样频率增加,采集数据增加,编译时间增加和准确率提高,但当采样频率过大时则采集数据过多导致计算量增大反而影响准确率,实时性降低。为保证算法的实时性和控制计算量,将控制器的采样频率设为50 Hz,分类算法的编译和识别可以在0.085 s内完成,不会影响设备的下次数据采样。

本文选择了20位实验者对设备进行测试,他们分别操作6种手势各20次。敲击手势的加速度数据和手势能量较小,如图7所示,翻转手势X轴的角速度能量远大于Y轴和Z轴的角速度数据,如图8所示。甩动类手势满足单符号角速度特征,其角速度数据如图9。划钩手势不具有单符号角速度特征而易于被识别,其角速度数据如图10所示。晃动和划叉手势因姿态角变化量特征被区分,其手势数据分别如图11、12所示。

手势分类结果如表3所示,第一列是手势动作的输入,第一行代表手势识别输出结果,识别准确率依次为:敲击-100%、翻转-100%,甩动-94.5%、晃动-96.5%、划叉-95.25%、划钩-95.75%。实验证明控制器对6种手势的平均识别率达到了97%。

其中的误差主要是由于甩动手势在操作前有极短的反方向运动过程而不满足单符号角速度特征,易被识别为划钩手势;当甩动力度过大时,手势能量和波峰数增加,将导致Fisher函数值大于零,且甩动手势的姿态角变化量较小,所以也可能被划分为晃动手势。同理,当晃动手势动作幅度过小时,分类器出现误差,且不具有单符号角速度特性,有被识别为划钩手势的可能。划钩手势力度过大和因姿态角变化量较大将被识别为划叉类,操作划叉手势力度过小时和不具有单符号角速度特征将被分类为划钩手势。

5 结论

本文提出了一种具有手势识别功能的可穿戴控制器的设计方法。控制器充分运用了惯性传感器的加速度计和陀螺仪的输出数据,依据特征量提取的方法对手势数据进行分析,成功实现了对6种手势的识别,确保了分类算法的准确率。该设计方法首先对控制器进行设备姿态更新,消除了以往仅使用加速度计对设备姿态的限制,提高了设备的用户体验性和实用性。而且使用者无需经过训练提取模板,减小了个体差异引起的误差,同时该手势识别算法省去了传统算法中模板匹配过程的计算量,确保了算法的简单性。

参考文献

[1]王万良,杨经纬,蒋一波.基于运动传感器的手势识别[J].传感技术学报,2011,24(12):1723-1727.

[2]Liu Yu.Inertial sensor-based mobile phone gesture recognition[J].Application of Electronic Technique,2011,37(12):76-79.

[3]黄启友,戴永,胡明清.基于陀螺传感器的三维手势识别方案[J].计算机工程,2011,37(22):72-76.

[4]Yin Liang,Dong Mingzhi,Duan Ying.A high-performance training-free approach for hand gesture recognition with accelerometer[J].Multimedia Tools and Applications,2014(1):843-864.

[5]Jun-Ki Min,Bongwhan Choe,Sung-Bae Cho.A selective template matching algorithm for short and intuitive gesture UI for accelerometer built-in mobile phones[C].IEEE Second World Congress on Nature and Biologically Inspired Computing.Fukuoka,2010:660-665.

[6]SCHLLOMER T.Gesture recognition with a Wii controller[C].Proceedings of the 2nd International Conference on Tangible and Embedded Interaction.Bonn,2008:11-14.

[7]Xu Ruize,Zhou Shengli,WEN J,et al.MEMS accelerometer based nonspecific-user hand gesture recognition[J].IEEE Sensors Journal,2012,12(5):1166-1173.

[8]黄刘松,储岳中,张学锋.基于加速度传感器的乒乓球击球动作识别[J].传感器与微系统,2016,35(1):56-58.

[9]张海鹏,房建成.MEMS陀螺仪短时漂移特性试验研究[J].中国惯性技术学报,2007,15(2):100-104.

手势控制 篇2

常用十种手势含义

1.“请进”手势

引导客人时,接待人员要言行并举。

餐厅礼仪培训中,首先轻声地对客人说“您请”,然后可采用“横摆式”手势,五指伸直并拢,手掌自然伸直,手心向上,肘作弯曲,腕低与肘。以肘关节为轴,手从腹前抬起向右摆动至身体右前方,不要将手臂摆至体侧或身后。同时,脚站成右丁字步。头部和上身微向伸出手地一侧倾斜,另一手下垂或背在背后,目视宾客,面带微笑。

2.前摆式

如果右手拿着东西或扶着门时,这时要向宾客作向右“请”的`手势时,可以用前摆式,五指并拢,手掌伸直,由身体一侧由下向上抬起,以肩关节为轴,手臂稍曲,到腰的高度再由身前向右方摆去,摆到距身体5厘米,并不超过躯干的位置时停止。目视来宾,面带微笑,也可双手前摆。

3.“请往前走”手势

酒店礼仪培训中,为客人指引方向时,可采用“直臂式”手势,五指伸直并拢,手心斜向上,曲肘由腹前抬起,向应到的方向摆去,摆到肩的高度时停止,肘关节基本伸直,

应注意在指引方向时,身体要侧向来宾,眼睛要兼顾所指方向和来宾。

4.“请坐”手势

接待来宾并请其入座时采用“斜摆式”手势,即要用双手扶椅背将椅子拉出,然后左手或右手屈臂由前抬起,以肘关节为轴,前臂由上向下摆动,使手臂向下成一斜线,表示请来宾入座。

5.“诸位请”

当来宾较多时,表示“请”可以动作大一些,采用双臂横摆式。两臂从身体两侧向前上方抬起,两肘微曲,向两侧摆出。指向前方向一侧的臂应抬高一些,伸直一些,另一手稍低一些,曲一些。

6.“介绍”手势

为他人做介绍时,手势动作应文雅。无论介绍哪一方,都应手心朝上,手背朝下,四指并拢,拇指张开,手掌基本上抬至肩的高度,并指向被介绍的一方,面带微笑。在正式场合,不可以用手指点或拍打被介绍一方的肩和背。

7.鼓掌

鼓掌时,用右手掌轻击左手掌,表示喝彩或欢迎。掌心向上的手势表示诚意、尊重他人,掌心向下的手势意味着不够坦诚、缺乏诚意等。

8.举手致意

举手致意时,要面向对方、手臂上伸、掌心向外、切勿乱拜。

9.挥手道别

挥手道别时,要做到:身体站直、目视对方、手臂前伸、掌心向外、左右挥动。

10.递接物品

手势控制 篇3

更轻更薄的笔记本&平板电脑

今年晚些时候,用户们将从比最新款iPad还要薄的平板电脑获得标准PC的性能;他们还可以连接上薄如纸张的键盘,让平板电脑摇身变成比MacBook Air还要薄的笔记本电脑。

华硕借助Transformer T300 Chi双功能设备展示了这样一款产品,作为平板电脑用时仅厚6.8mm。英特尔则展示了其Llama Mountain参考设计平板电脑,厚度为7.2mm。它们都搭载英特尔的最新款酷睿M处理器,而不是为了延长电池续航时间而需要牺牲性能的低功耗凌动处理器。

更普及的无线技术

英特尔终于在解决令人头痛的连线凌乱问题,它想从2016年开始让电脑真正做到摆脱连线。

这家公司正在研发技术,那样电脑就可以与显示器、键盘、鼠标及其他外设实现无线通信,这有望让用户可以摆脱USB、HDMI或DisplayPort等连线。英特尔希望通过WiGig无线技术实现这一幕,这项技术的速度比当前的802.11ac Wi-Fi快大概3倍。在未来几年,这家芯片生产商会将WiGig模块添加到PC和屏幕中。

无线充电

英特尔正在研发一系列技术,有望让无线充电技术进入笔记本电脑。这家芯片生产商已加入了A4WP组织,该组织大力倡导将笔记本电脑和平板电脑放在充电站上,以实现磁共振无线充电。联想、戴尔和富士通等笔记本电脑生产商已加入这个联盟,所以笔记本电脑实现无线充电不是太遥远的事情。

统一充电器

如果制定标准的组织USB实施者论坛(USB Implementers Forum)能如愿以偿,USB有望成为家中所有设备的通用充电器。USB规范可以提供100W电力,所以大有潜力。展会上亮相的DockPort等其他技术也有望为PC充电。

交互式电脑

手势和识别以及与PC进行类似Kinect的交互将变得更普通。AMD的一场演示表明了如何使用手势和台式机玩《愤怒的小鸟》和《Candy Crush》,不过电脑的反应有点慢。网络摄像头捕捉到手部动作后,借助算法进行处理,手势在游戏中得到了体现。

英特尔希望借助其感知计算(Perceptual Computing)项目,在此基础上能更进一步。这个项目让更多种形式的感知输入可以简化人机交互。

配备3D摄像头的PC可以跟踪运动、识别人的情感,并捕捉习惯,这种摄像头将在今年年底开始交付。一些厂商正通过英特尔的软件开发工具包开发实现这种交互的应用软件。

手势控制 篇4

随着人民生活水平提高, 对于危险作业、有毒作业、行动不便人员护理等提出越来越多的实际情况要求, 而机械手可以实现远程的非接触控制。为了使机械手能够像人一样工作, 其必须模仿人手的动作。 本文设计了一种利用基于Lab VIEW的远程机械臂手势控制系统。本系统设计中操作者可以通过手势动作来控制机械手抓取目标的行为, 体感控制器将人体运动转化为控制信号, 在摆脱了复杂的机械操作的同时利用Zig Bee无线通信技术实现对机械手的远程控制[1,2,3,4], 使得机械手的操作更为简便直观。

1总体设计

系统总体设计方案如图1所示, 通过手势模块采集手势信息, 该信息通过USB传输到上位机, 利用Lab VIEW处理信息, 将处理后的信息通过远程通信传输到机械手控制模块, 控制六自由度机械手模块实现对手势的模仿。

2系统硬件设计

如图1所示, 系统硬件主要由以STM32F103为核心的嵌入式系统及六自由度机械手组成。 STM32F103单片机控制系统与Zig Bee模块通过UART串口相连, 接收由上位机发送而来的控制信号, 实现对机械手六个舵机的控制, 进而实现机械手的相应动作[2]。本文主要进行了手势识别模块和远程通信模块的设计。

2.1手势识别模块

常用手势有快速左右移动、上下移动、握拳、 手指伸屈等, 结合国内外研究现状[2,3,5,6,7,8], 选体感传感器Leap Motion (简称LM) 、采用双摄像头的立体视觉原理, 能对物体进行坐标定位, 精度达0.01 mm, 在4立方英尺 (约0.113 m3) 内可识别范围中能精确地捕捉到手部姿态, 如单个或者多个手指运动以及双手运动方向和速率等。本系统中利用LM采集双手在空间中的运动方向和速度的功能, 提取上位机所需的控制信号, 作为整个系统最初的输入数据。

2.2远程通信模块

远程通信模块设计基于操作方便和布线简单的原则, 采用远程无线方式将上位机控制指令传输给下位机控制单元, 同时为保证一定的距离, 设计视距传输距离不少于100 m。鉴于现实生活生产中绝大多数蓝牙和WIFI信号的频段处于2.4 GHz, 系统设计中考虑到需要一个工作频段可避免2.4 GHz的传输信号, 故选用广州晓网电子出品的WLT系列Zig Bee数据传输模块, 其视距传输距离可达500 m, 工作频段2.380~2.500 Ghz可调, 能有效避开WIFI、蓝牙等其他2.4 G信号干扰, 在本系统中采用2.390 GHz工作频段, 同时使用点对点传输模式, 保证信号的稳定性, 图2为Zig Bee模块与单片机连接图。

3系统软件设计

3.1上位机软件设计

上位机软件使用Lab VIEW编程, 通过调用LVH Leap模块实现和Leap Motion的通信;通过对所采集的手势信息 (即手在空间的移动方向和移动速度等) 的分析处理, 得出后续控制指令;调用VISA串口函数实现上位机与Zig Bee模块通信, 完成对下位机的信息传输和控制。图3是上位机程序流程图。

3.1.1 LVH Leap库函数

在软件编写中, LVH Leap库函数的出现无疑大大提高了Lab Vi EW与Leap Motion的结合程度和编写效率。LVH Leap是Lab VIEW库函数中专门用于对Leap Motion的信息采集与处理函数, 运行对应的库函数, 分别能得到Leap Motion采集到人手信号中例如手掌移动速度、手掌姿势、画圈手势等。图4是LVH Leap的库函数功能设定模块图。

3.1.2机械手运动的实现

为便于控制, 将六自由度机械手的六个驱动电机 (舵机) 分为三个一组, 每个舵机运动由一个手掌的一维方向数据控制。例如底座舵机正反转由右手空间坐标系中的X轴上的数据决定, 数据包括坐标以及移动速率。为防止误动作, 手势运动到一定速度才用机械手复现。图5是移动坐标和速率预设值判断程序框图。

3.2下位机软件编写

下位机软件编写使用KEIL编程环境, 通过对STM32库函数和寄存器的运用, 实现对机械手的控制。STM32单片机与Zig Bee模块通过UART接口相连, 调用STM32F103VCT6中USART1, 设定波特率为115 200, 8位数据位, 无奇偶校验位。程序中, 通过串口通信, 进入串口中断, 在中断函数中调用TIM2、 TIM3资源, 生成用于控制舵机的6个PWM波形信号, 周期为50 Hz, 占空比可调时间为0.5~2.5 ms。图6是下位机程序框图。

4实验结果

经过实验结果显示, 机械手实现了抓取物品的功能, 机械手抓取范围为200 mm, 可抓取最大物品质量为1 000 g。图7是机械手抓取初始化状态图, 图8是机械手抓取物品状态图, 图9是机械手抓取物品后搬运状态图。

5结语

本系统实现了利用手势进行机器臂的远程控制, 如通过加装摄像头模块、角传感器模块等还可以进一步提高系统的实用性和功能性。

摘要:设计了一种利用人的手势实现对机械手进行控制的系统。该系统首先识别人手的动作、速度等参数, 然后将这些参数分解构建机机械手的动作, 通过无线远程通信方式实现控制。实验结果表明系统操作方便, 反应灵敏, 控制精准度高且稳定、安全。

关键词:远程,机械臂,手势,控制

参考文献

[1]黄俊, 景红基.于Leap Motion的手势控制技术初探计算机系统应用, 2015, 24 (10) :259-263.

[2]李振.基于手势识别的远程控制机械手的设计[D].武汉:武汉理工大学, 2014:1-80.

[3]杜钊君.基于体感传感器的手势识别及人机交互系统研究[D].武汉:武汉科技大学, 2013:1-57.

[4]裴岩明.基于Kinect的远程机械臂体感控制系统研究[D].大连:大连理工大学, 2013:1-68.

[5]董毅, 何勇.基于PC机和单片机的多机械手远程控制系统[J].微电脑应用, 2004, 26 (6) :41-43.

[6]胡继康, 刘廷章.基于Zig Bee的远程电机控制系统[J].信息通信, 2015 (5) :64-65.

[7]丁茹, 郑桐.基于Zig Bee技术的全方位移动机器人本体设计[J].机床与液压, 2008, 36 (7) :354-375.

的演讲手势 篇5

(1)拇指、小指并用式。拇指与小指同时伸出,其余三指并拢弯曲,表示六、六十、六百……。

(2)拇指、食指、中指并用式。三指相捏向前表示“这”、“这些”,用力一点表示强调,也表示数字七、七十、七百……。

(3)拇指、食指并用式。并拢表示肯定、赞赏之意;二者弯曲靠拢但未接触,则表示“微小”、“精细”之意;分开伸出,其余 (4)拇指式。竖起大拇指,其余四指弯曲,表示强大、肯定、赞美、第一等意; 三指弯曲表示八、八十、八百……;

(5)小指式。竖起小指,其余四指弯曲合拢,表示精细、微不足道或蔑视对方。这一手势演讲中用得不多。

(6)食指式。食指伸出,其余四指弯曲并拢,这一手势在演讲中被大量采用,用来指称人物、事物、方向,或者表示观点甚至表示肯定。胳膊向上伸直,食指向空中则表示强调,也可以表示数字“一”、“十”、“百”、“千”、“万”。手指不要太直,因为面对听众手指太直,针对性太强。弯曲或钩形表示九、九十、九百……齐肩划线表示直线,在空中划弧线表示弧形。

(7)食指、中指并用式。食指、中指伸直分开,其余三指弯曲。这一手势在一些欧美国家及非洲国家表示胜利的含义,由英国首相邱吉尔在演讲中大量推广。也表示二、二十、二百……之意。

(8)中指、无名指、小指三指并用式。表示三、三十、三百……。

(9)食指、中指、无名指、小指四指并用式。表示四、四十、四百……。

(10)五指并用式。如果是五指并伸且分开,表示五、五十、五百……。指尖并拢并向上,掌心向外推出,表示“向前”、“希望”等含义,显示出坚定与力量,又叫手推式。

(11)手切式。手剪式的一种变式。五指并拢,手掌挺直,像一把斧子用力劈下,表示果断、坚决、排除之意。

(12)手啄式。五指并拢呈簸箕形,指尖向前。表示“提醒注意”之意,有很强的针对性、指向性,并带有一定的挑衅性。

(13)手包式。五指相夹相触,指尖向上,就像一个收紧了开口的钱包,用于强调主题和重点,也表示探讨之意。

(14)手剪式。五指并拢,手掌挺直,掌心向下,左右两手同时运用,随着有声语言左右分开,表示强烈拒绝。

(15)“O”型手式。又叫圆型手势,曾风行欧美。表示“好”、“行”的意思,也表示“零”。

(16)仰手式。掌心向上,拇指自然张开,其余弯曲,表示包容量很大。手部抬高表示“赞美”、“欢欣”、“希望”之意;平放是“乞求”,“请施舍”之意;手部放低表示无可奈何,很坦诚。

(17)俯手式。掌心向下,其余弯曲。表示审慎提醒,抑制听众情绪,进而达到控场的目的,同时表示反对、否定之意;有时表示安慰、许可之意;有时又用以指示方向。

(18)手抓式。五指稍弯、分开、开口向上。这种手势主要用来吸引听众,控制大厅气氛。

(19)手压式。手臂自然伸直,掌心向下,手掌一下一下向下压去。当听众情绪激动时,可用这手势平息。

(20)手推式。见“五指并用式”。

(21)抚身式。五指自然并拢,抚摸自己身体的某一部分。抚胸表示沉思、谦逊、反躬自问;抚头表示懊恼、回忆等。

(22)挥手式。手举过头挥动,表示兴奋、致意;双手同时挥动表示热情致意。

(23)掌分式。双手自然撑掌,用力分开。掌心向上表示“开展”、“行动起来”等意,向下表示“排除”、“取缔”等;平行伸开还表示“面积”、“平面”之意。

(24)举拳式。单手或双手握掌,平举胸前,表示示威、报复;高举过肩或挥动或直锤或斜击,表示愤怒、呐喊等。这种手势有较大的排他性,演讲中不宜多用。

(25)拳击式。双手握拳在胸前作撞击动作,表示事物间的矛盾冲突。

(26)拍肩式。用手指拍肩击膀,表示担负工作,责任和使命的意思。

(27)拍头式。用手掌拍头,表示猛醒、省悟、恍然大悟等意。

(28)捶胸式。用拳捶胸,辅之以跺脚、顿足,表示愤恨、哀戚、伤悲。演讲中不太多用。

肥皂的手势 篇6

不久前布鲁塞尔的一家设计机构妄图通过一项特别调查来研究出“美的公式”。

受调查者们从取暖器、吸尘器、热水瓶、手表和自行车这五种生活日用品中挑选出他们认为最美的,结果令人惊讶。大多数人像商量好了似的,都喜欢流线型的热水瓶、水管状的取暖器、传统型自行车、简单的手表和不花哨的吸尘器。至于那些过分注重装饰和自我意识的现代设计,大都被列为丑陋。

由此可见,绝大多数人对“美”有相当一致的看法,我们心里对所谓的美都是有某种早已设定的期待值的,而这种期待值也是习惯性思维的一部分。也就是说,热水瓶要长得像热水瓶而不是个纸口袋,吸尘器也要简单好用而不是像操作一台高科技电脑。

但我们人类也是动物中最具创新精神的。我们有强烈的好奇心,勇于尝试新事物,我们对“新”和“陌生”的渴望一点不亚于我们对“旧”和“熟悉”的依恋。

“手肥皂”是居住在美国印第安纳州的一个女艺术家玛丽·嘉德斯基的创造。她以旧货店里收来的洋娃娃们的手为模型,做了几百块肥皂陈列为装置艺术。展示结束后,她实在没地方放这么多肥皂,就开始分发给朋友,最后发展到售卖。

手和肥皂结合在一起,成了一个全新的概念,甚至很多人一开始根本无法接受。好多人的最初反应是强烈的反感,觉得“手肥皂”好诡异、好可怕、好恶心。可是随着网上销售量的不断增加,越来越多的人爱上了这些用山羊奶和蔬菜甘油制成的肉乎乎的粉色小手。这些小手都是手工制作的,嘉德斯基的工作室每天最多只能做八双,或者二十套超迷你型的,所以现在排着等手的队伍已经拉得很长很长了。

尽管长得不像肥皂的“手肥皂”目前很受欢迎,但它毕竟只在整个肥皂市场上占了很小很小的比例。大多数标新立异的另类设计品都只为小众服务,像嘉德斯基这样的另类设计师能做到这一步就已经是成功,因为她本来也没想把“小手们”通过流水生产线送进连锁超市。更多“四不像”另类产品惨得连小众市场都挤不上,完全符合了消费心理的研究结果。“手肥皂”之所以崭露头角,还是有它为人熟悉的因素——人手。嘉德斯基先是把人们熟悉的两样东西:手和肥皂搞成了新发明;等人们看多几遍、心理适应之后,这新发明又成了熟悉的东西——手和肥皂。

这个轮回蜕变过程值得很多新手们好好琢磨,而对嘉德斯基来说,只不过是她装置艺术剩余物资再利用的意外收获而已。

手势礼仪 篇7

我们都知道在工作岗位中, 对于站坐走等姿态有规范的要求, 这些姿态是动态美和静态美的结合。在这些动作举止中都离不开手势。手势是人的两只手臂所呈现出的各种动作和体位的姿势。手是人体富有灵性的器官, 是人心灵的触角和指向。因而手势是人体语言中最丰富、最有表现力的体态语言, 它具有模拟、象征、情意、形象、指示等功能。通常人们说话时, 为了加强语气、语调, 强调内容, 手势可以辅助我们的表达与他人进行沟通, 描画出人们心中的言外之意。

手势是人的两只手臂所呈现出的各种动作和体位的姿势, 它是静态美和动态美的结合。手是人体富有灵性的器官, 是人的心灵的触角和指向。因而手势是人体语言中最丰富最有表现力的体态语言, 它具有模拟、象征、情意、形象、指示等功能。通常人们说话时为了加强语气、语调, 强调内容, 手势可以辅助我们的表达与他人进行沟通, 描画出人们心中的言外之意。模拟手势可以用手势形状代表某种意义, 如“V”字形手势表示胜利。象征手势, 可以透露人们心中所期望的事实, 也可以反映比较抽象的意向, 如讲话时掌心向上暗示了明快的心理和坦诚的态度。情意手势, 可以增进人与人之间的感情, 正如一些研究结果所表明:有声语言是用来传递信息的, 肢体语言是用来表达人与人之间的情感、态度和性格的。形象手势, 可以为一个人的形象增辉, 如招手示意、挥手告别、握手问好、拍手称赞、拱手答谢、举手赞同、垂手听命等等。指示手势, 可以用来指示具体的对象, 如指引方向、请、挥手道别等手势是人们日常生活和工作常用的手势。

手势是由挥动的速度、力度、幅度和弧度等四部分构成的综合体态语言。手势表现力越强, 其动作要求的标准越高。

手势的速度即手势的快慢程度。它通常和一个人的情绪波动有关, 缓慢的手势表达出和谐或无聊的心情;快速的手势则透露出兴奋或紧张的情绪。

手势的力度即手势的轻重程度。它通常与一个人的决心和信念有关, 力度大的手势表现出果断和坚定的信心;力度小的手势表现出优柔寡断的犹豫感;但服务行业的手势力度要求不宜过重或过轻, 要轻重适度, “柔中带刚”。

手势的幅度即手势的空间活动范围。它通常与一件事情的重要程度有关, 手势越大, 事情就越重要。但要注意, 两臂无论如何挥动比划, 两腋都要微微夹住, 两肘部分尽量靠近自身为原则。两臂横张时的距离不应超过两尺半。

手势的弧度即手指、手掌和手臂共同挥出的空间轨迹。它通常与对人尊重的程度有关, 手势越规范、标准、优美, 就越体现出对他人的敬意。手部动作要如水一般地流畅、柔顺, 表达心思时能自由得像风一样自然。

手势的总体原则不宜过多、过大、过高。否则给人造成目不暇接, 给人以压迫感, 分散人的注意力, 甚至令人产生轻佻的感觉。最高只能到指尖达耳的界限。例如接递物品时应为双手, 不方便使用双手时可以用右手, 但绝不可以用左手。并应主动, 递送时最好直接递至对方手中并且要方便对方接取。递送有文字、图案、正方面的物品时, 要正面向上且朝向对方;接取物品时, 要缓而且稳, 不可急于抢取。递送带尖、带刃或其他易于伤人的物品时, 应使其朝向自己或朝向他处, 切不可朝向对方。

运用手势在生活中有一些值得注意的问题:要了解手掌势语, 手掌的姿势可分为三种:掌心向上、掌心向下、手掌紧握且食指伸出。掌心向上表示诚实、谦虚和屈从, 不带有任何威胁性, 使对方易于服从、顺从;掌心向下表示命令、强制、约束, 带有一种强制性, 使人产生一种抵触情绪;第三种手势语是最令人不愉快的手势之一, 它犹如敲打人的一根棍棒, 具有强烈的强制性、镇压性、威胁性, 是一种粗俗无礼的恶习, 有指斥和教训他人的意味, 需要加以克服。

生活中的手势语同样可以透露出一个人的心理活动:“用手捂嘴”是企图阻止谎言户口的一种人体显示信号, 通常是自己对别人撒谎或认为别人说谎时使用的信号。“触摸鼻子”即用手触摸鼻尖或在鼻子底下轻摸几下, 它是用手捂嘴的另一种表现形式, 只不过更隐蔽、更微妙。“搔耳朵”即用手抓耳朵或挖耳朵, 它是人们企图阻止逆言入耳的一种消极人体信号。“抻衣领”是当人们生气或感到沮丧不安时使用的手势。“评价手势”通常用手握拳贴在面颊则表示赞赏、欣慰的一种积极的人体信号;用手掌支撑头部或用手指支撑下巴或面颊的姿势是暗示厌恶、抵触的手势;“捋下巴”是一种做决定的人体信号。

仪态是一种无声的肢体语言, 任何一种行为举止都毫无掩饰地反映了一个人当时的某种心理状态和一个人的内在修养。正如达芬奇所说:“从仪态了解一个人的内心世界, 把握人的本来面目, 往往具有相当的准确性与可靠性。”可见仪态的重要, 也就是说我们要在生活中更加注重细节。一个人能在举手投足之间显出自然而优雅的气质, 必须靠适当的教导和不断的练习, 将肢体语言的训练运用到很纯属的地步, 直到化为是自己生活的一部分, 这时的仪态才能显出自然优美的效果。

摘要:本文着重对工作和生活中的手势礼节进行探讨, 更加注重的礼节在工作中的应用。

手势识别综述 篇8

通常在人机交互领域手势定义为:人类通过手掌和手指的不同姿势组合形成的具有特定含义的信息的集合体称为手势。

手势通常可以分为操作性手势和交流性手势:如钢琴伴奏家在弹奏钢琴时的手指动作属于操作性手势, 通过十个手指的不同组合, 在键盘上发出不同声音形成乐曲的弹奏, 只有操作的含义, 不含有视觉上信息。马路上交警指挥路况时手上的动作属于交流性手势, 通过司机观察交通警察手上不同动作理解警察的意思, 含有视觉上的信息。

按照手势在表达的信息中所处的地位分为自主性手势和非自主性手势:哑语演示时表演者手上的手势动作完全表达了哑语表演者的思想, 手势在语义交流中占主导地位, 属于自主性手势, 演员表演节目时有时为了更好的表达情感会用手势加深语义表达, 但是手势只是为了更好表达意思, 起到对演员表达思想的补充, 这种手势动作这属于非自主性手势, 在语义表达中不占主导地位。按照手势在交流活动中手势的作用对象分为离心手势和向心手势:比如说话人在下命令时手指向受命人这种手势属于离心手势, 例如交通警察在交通管制中的手势属于离心手势, 当听到某消息时听者会有相应的情感反应这时的手势属于向心手势, 例如小朋友表示不同意时摇手即为向心手势。当操作者利用手势表达思想的时候有两种方式, 一种是手臂不动完全通过手指和手掌的运动来表达操作者的意思, 还有一种是忽略手指的运动, 通过手的运动轨迹来表达思想。当我们做研究时会遇到手和手指同时运动的情况这时为了分类方便, 需要做相应约束, 当手是动的应忽略手指的动作, 反之如果手指在动这时应忽略手的运动轨迹。因为基于表观的手势识别最终面临的是手的2D图像如果手和手指的运动同时考虑的话会给分类造成不必要的麻烦。

2 手势识别的分类

按照对手势数据采集的方式分为数据手套型和摄像头型。

2.1 数据手套

虚拟现实中重要组成部分, 是一种通用的人机接口他可以将手指的复杂动作通过传感器反应到虚拟环境中去, 在虚拟环境中真实再现手部动作。数据手套使用的效果关键是手套能不能将手指、手掌、手腕的弯曲真实的以数据形势反演到系统数据库中, 让系统根据模型对手势进行有效识别, 由于手部软组织和计算复杂性, 数据手套的计算速度总是存在延时, 同时从人机交互的角度手套佩戴也十分不方便, 如果多人使用还存在卫生等问题, 因此数据手套目前来说只是应用在试验阶段, 真正推广到社会应用还有很多问题要解决。例如由海军某课题组开发的某型飞机训练仿真系统采用了数据手套, 将人的动作如拉升飞机操纵杆通过数据手套反应到系统中, 但是不足之处是手套存在一定的延时, 通常第二个动作都准备做了, 第一个动作系统往往还没执行, 这和真实的飞机操作存在很大的差别, 但是要想系统及时接受数据手套传感来的数据, 往往对系统的中央处理器要求很高, 需要大量投入经费和人力, 存在一定的矛盾。因此数据手套在虚拟仿真中往往只是完成简单的非连续的动作, 对于连续复杂动作目前从技术上还不是很成熟。但是用数据手套来进行数据采集抗干扰性非常好, 在数据采集的时候不容易手的外界环境的影响, 例如光线照射等等。市面上比较成熟的产品有RME公司在上世纪80年代生产的DATAGLOVE, 适用于VR的医学应用, 不足之处是对用户手形要求高, 对于特别大或者小的手使用存在不足。Cyber glove是Virtual Technologies公司1992年生产的数据手套, 重量轻易于抓举使用方便。

2.2 基于摄像头

基于摄像头数据采集方式的手势识别系统从数据采集的角度来说要比数据手套方便, 摄像头采集到的手部数据后比较麻烦的是要从背景中将手分割出来, 通常会用肤色分割的方法基于皮肤的色调将不同于周围背景手的区域分离出来, 但是会受到光线等因素干扰, 分离出手后需要用合适的模型对手的动作建模, 之后从模型中估算出参数, 根据估算出的参数对手势进行分类, 得出结论。由于在数据采集时容易受到背景干扰, 往往要求背景颜色和手的颜色有较好的区分度。例如日本RT公司研发的基于单个摄像头的电视操作平面, 对外界环境要求较高, 当黄昏光线不好的时候, 位于电视上的原装摄像头对手的变化反应迟钝, 切 (下转第19页) (上接第79页) 换节目的速度不如白天的效果好。同时该系统要求电视的操作者只能有一个, 即在摄像头前如果同时有两个人在操作, 电视识别系统无法分辨出哪个操作应当执行, 即对干扰的滤除存在需要改进的方面。

3 手势识别的关键技术

手势的识别过程比较复杂, 但是它基本从认知的角度可以分为建模、分析、判定三个过程, 三个过程是按顺序逐一进行的, 最终形成结论。

3.1 手势建模

我们知道在研究手势时必须要抓住它共性的特征, 无论是动态手势还是静态手势它们必然有可以反映其规律的特征, 人为的把这些特征形成的集合就是建模, 所谓手势建模就是将手的静态姿势和动态动作用某种一般规律进行描述这样在分析某种具体动作时就可以从模型中提取相应参数, 用该参数来表征该动作的分类问题。

通常有基于三维和表观两种方式建模。基于3D方式需要对手的关节进行复杂的数学描述, 理论上任何手势都可以用3D方式来描述, 但是由于数学的限制在描述手势时并不尽人意, 特别是复杂的动作, 因此在一些简单的动作的描述上我们倾向于基本表观的方式来对手势建模。

基于表观的手势建模通常有基于平面灰度图像、变形模板、图像属性、图像运动参数四种。本文采用了基于手势平面灰度图像傅里叶描述子来对手势建模。

3.2 手势分析与手势判定

所谓手势分析就是对从摄像头中采集到的手势数据需要进行去除噪声, 目标定位, 轮廓提取。所谓手势判定就是从手势模型中估算出手势的参数, 利用参数对手势进行分类, 通常采用经典的欧式距离比较法对手势分类, 利用采集到的手势的傅里叶描述子, 逐一和模板库中的手势进行比对, 取欧式距离最小模板作为该手势。当然也有别的距离可以作为识别的判据, 如马氏距离、切比雪夫距离等。

3.3 动态判定

在动态手势判定过程中我们采用的是对视频流进行离散采样的方法具体如下:将动态手势分解成若干序列, 取有代表性的序列形成模板库, 然后对采集到的手势和模板库序列逐一比对, 用欧式距离判定。当状态都能比对上时, 确认该手势。S

[责任编辑:王洪泽]

摘要:介绍了手势识别的定义、分类, 手势识别的过程, 动态手势识别的过程。

教师手势管理机智探析 篇9

一、教师手势的作用

1. 传递信息, 辅助语言管理

实践证明, 课堂管理的效果与学生对有用信息的接受量成正比。因此, 教师在课堂管理中要扩大学生对信息的接受量, 最有效的方法就是增强对学生的感官刺激。因而教师在用语言管理学生的同时必须融入自己的感情和体态语言, 而最重要和常用的体态语言就是手势。教师在用语言传递管理信息的同时, 适当地以手势作用于学生的视觉系统, 这可以极大地扩大教师管理的信息量。

教师的“举手投足”都传递着不同的管理信息。在语言管理的基础上, 手势能更加引起和刺激学生大脑皮层的兴奋, 他们会不自觉地摄取这些信息, 提高课堂管理的效率。教师可以根据学生在课堂中的不同反应、表现, 通过手势传递不同的信息, 如当学生遵守纪律时, 给予鼓励的手势。教师手势的运用可以补充、辅助语言的管理, 有意义地将教师的情感融入到情景中。

2. 尊重学生, 满足学生爱的需要

教师在课堂管理中首要遵循的原则就是尊重学生, 满足其发展和爱的需要。教师用关爱的手势管理学生时, 他们更会感到被尊重、被重视。在管理过程中, 教师通过手势将自己的爱传给学生。

教师在向学生传递管理信息时往往使用有声的语言, 而语言上的一些措辞不当, 会对学生造成一定的心理伤害。管理是爱的艺术, 教师爱心的表达有时仅仅只需要一个手势。大多数学生的在课堂上的问题行为只是为了寻求注意, 尤其是低年级的学生, 可能只需教师的一个抚摸的手势就可以让学生专心听讲。

3. 简洁管理, 提高教学效率

课堂管理制度是为了使学生参加有意义的学习活动达到最高程度, 而不只是为了将不良行为降到最低程度。[1]有些教师在处理课堂问题行为时, 对学生违反纪律的行为采取的训斥或说教, 甚至花费教学的时间进行教育, 容易使学生产生逆反心理, 治标不治本。

手势可以在短时间内把抽象的语言直观、形象地展现给学生, 一个手势、一个动作都传递着教师管理的信息。教师的手势作为一种管理方式, 简洁、灵活地调控学生的不良行为, 保证课堂秩序。

二、教师手势的主要特点

1. 丰富性

手势是灵活多样的, 你可能只用一种语言传递信息, 却能用几种手势发出信号。教师手指、腕、双臂、双手等的综合运用组成了丰富多彩的手势。而根据学生的不同特点, 采取的手势也不尽相同。手势的力道不同、使用的频率不同都会产生不同的效果。

2. 直接性

手势不以语言作为表现形式, 而是以人体自身的动作来表现。手势在传递信息时, 基本上不需要中介环节就可以表示赞扬、批评、支持和反对等信号, 它比语言更加简洁易懂。教师在长期的课堂管理活动中形成一套固定的“手势语言”之后, 无须更多的解释和沟通, 学生会形成条件反射。

教师的手势由一系列动作完成, 它比语言简单得多, 如教师的一两个拍手就可以使违纪的学生安静下来。学生一直在接受教师的语言刺激, 突然一个简单的手势停顿更会引起其注意。

3. 辅助性

教师的手势可以补充、支持语言管理, 从而强化效果。手势通过强化语言的力量而引起学生重视, 进而增强语言的说服力和威慑力, 可以说, 语言和手势是教师有效管理的“左膀右臂”。因此语言的表达与手势应该“珠联璧合”, 才不至于使教师的管理刻板。

研究体态语较早的伯德惠斯特尔在研究的基础上提出统计数据:每人每天平均只用10分到11分钟的时间讲话, 平均每句话占2.5秒钟——人在面对面交流时, 有声部分低于35%, 而65%的交际信号是无声的。[2]教师手势的辅助性主要是加强感情色彩, 加深学生对语言的理解。教师的口头表达有时意犹未尽, 不能尽善尽美地表达自己的思想, 而手势的恰当使用可以产生一种让学生心领神会的奇效。

三、教师手势在课堂管理中的运用

没有丰富、协调一致的手势运用就不可能有良好的管理效果, 受学生仰慕的教师无疑是手势运用的佼佼者。一个理解的手势, 会让学生如沐春风, 敞开自己的心扉。

1. 象征手势

课堂管理象征性的手势是教师用来传递管理信息、大部分学生所理解的具有固定意义的一种姿势。教师在课堂管理中经常使用象征性的手势, 这些手势并不是教师创造的, 而是大家所公认的。对于教师象征性的手势, 学生能明确是对某些违规行为的标识性动作。它不需要学生的揣摩和猜测, 而是一种习惯性的反应, 即教师作出一类手势, 学生就明白要纠正哪一类行为, 这是一种不言而喻的默契。

教师在课堂上经常使用的是指势、掌势。人的手指很少处在静止状态, 而且它的灵活度和灵敏度都很高。拇指在课堂管理中有很大的妙用, 拇指向上, 其余四个手指弯曲向内, 可以表示对学生的鼓励、赞美。经常违反纪律的学生在课堂表现优秀时, 尤其需要老师的肯定。当然, 在管理中教师伸出手指多表示警告、指示和引导。食指在维持课堂秩序方面不亚于语言的作用。例如, 教师指定几位同学在讲台上演练课文, 这几位同学在精心表演的时候, 下面的学生可能小声议论, 教师面向学生, 用食指靠近嘴唇, 这就表示让大家安静下来。教师的这一手势既制止了学生私下说话的行为, 又避免了对演练同学的干扰。

教师的手掌是显示态度和感情的一扇窗。在管理中, 教师常用的是单手下按, 它引申的意思是“停止做某件事情”。教师在使用时幅度不要太大, 一般情景下不会对学生造成伤害。手掌使用的另一状态是双手下按, 此动作一般是维持大部分同学的课堂秩序。如课堂上话题讨论结束之后, 仍有学生在窃窃私语, 教师可以用双手下按的方式提醒学生。教师也可以成丁字形手势, 即一掌在上平放, 一掌垂直在下, 其含义是暗示学生要停止。

2. 调和手势

调和手势是教师管理学生时缓和氛围、和谐师生关系的管理手段, 它可以将教师的情感有意义地引入到管理中去, 达到激励的效果。课堂管理中, 教师的口头表扬和物质奖励固然可以引起学生的注意, 而一个细微的调和手势, 则可以创造一种理解与关心的情感氛围。

教师抚摸的手势让学生感到那是一把遮风避雨的小伞。在习题课上, 难免有个别同学东张西望, 坐姿不正, 在相对安静的环境下, 教师如果用语言制止, 势必会让学生难堪, 进而造成师生之间的隔阂。这时, 教师的手可以抚摸一下学生的肩膀, 调整他的坐姿。这鼓励性的抚摸是很有效的管理, 它既保全了学生的自尊, 又不影响正常的教学。

小学生的注意力容易分散, 上课经常分神, 会影响教学效果。面对分神的学生, 教师可以自然地走近他的身旁, 柔和地拍拍他的肩膀, 这其实是一种近距离的控制。在一般情况下, 较强的语言刺激会造成学生诚惶诚恐, 很难安心听讲, 这一抚摸的动作可以让学生安心。教师的调和手势要根据学生的性格、特点来运用, 不可“一刀切”。

古罗马雄辩家西塞罗说:“一切心理活动都伴有指手画脚等动作。手势恰如人体的一种语言, 这种语言甚至连最野蛮的人都能理解。”可以说, 教师的手势是课堂管理中最容易被学生理解的管理技巧之一, 但是它需要教师长期不断的摸索才能运用得炉火纯青。通过这种动作的语言, 一个共享的现实才得以成功地塑造。通过动作, 学生的身体进入了动作带来的意义的领域。[3]

教师手势的运用既要有针对性, 又要符合学生的个性和心理特点。手势要适量、适度、明确化, 切忌繁杂、做作, 让学生感到眼花缭乱, 无所适从。教师的“手”留余香, 学生就会伴着教师手势的“花语”健康快乐地成长。

参考文献

[1]琼斯.全面课堂管理:创建一个共同的班集体[M].北京:中国轻工业出版社, 2002:21.

[2]庄锦英, 李振村.教师体态语言艺术[M].济南:山东教育出版社, 1993:11.

手势动作识别分类的研究 篇10

1 s EMG的特征提取与特征选择

表面肌电信号的特征提取对手势动作的识别率有直接影响。本文采用时域、频域及时频域的特征作为不同手势动作的特征。但是, 特征太多会给计算带来困难, 而且会造成分类效果的恶化。因此本文采用K-W检验的方法对时域、频域及时频域的单个特征进行评价, 选择最具有分离度的特征。本文将提取的特征作为改进PNN神经网络的输入信息对7种手势动作识别分类, 并与传统的神经网络进行识别率对比分析。

2 改进PNN神经网络模型

PNN神经网络是1990年由Specht提出的一种径向基函数 (RBF) 网络的重要变形。它的训练学习过程是一个完全正向的过程这一点与传统神经网络不同, 大大减少了点问题。

训练时间。不仅如此该网络不易陷入局部极小值点, 非常适合模式识别研究。在进行仿真实验时, 传播率的改变对识别结果的影响明显, 总会有一个值能使识别率最高但是在概率神经网络中该参数一般是手工设定, 增加了训练时间, 为了提高效率本文通过仿真实验, 在多次试验中找使结果最好的取值。粒子群优化算法被广泛应用与优化数值的求解, 本文采用该方法选取最优的传播率参数。

3 仿真实验及结果分析

将本文的改进算法统传统的算法进行比较分析, 改进PNN神经网络算法记为P1算法, 传统BP神经网络算法记为P2算法。对于P1算法:设计的PNN网络的结构为:输入层有4个神经元, 输出层有7个神经元, 中间层的传递函数为高斯函数, 输出层的传递函数为线性函数。将第1通道均值、第2通道均值、第1通道功率谱密度、第2通道功率谱密度作为输入特征, 进行仿真实验研究。

4 结论

传统的神经网络训练时间长且易陷入局部极小值, 在手势动作识别研究中正确识别率也并不高, 本文针对这些问题提出的改进PNN神经网络有效克服了这些不足, 识别率提高到90%左右, 并且训练时间也缩短了一半。有效的改善了手势动作识别效果。

改进PNN神经网络的提出为手势动作识别分类提供了理论基础, 为智能假肢的研究提高的科学依据, 但是, 为了将手势动作的识别算法应用于智能假肢, 改进的概率神经网络识别算法的识别率仍有待提高。因此, 寻找更有效的识别算法, 提高手势动作的识别准确率是今后的研究热

摘要:手势动作识别分类已成为当今的热点研究问题, 但目前所采用的识别方法识别率较低。为了寻找高识别率的手势识别方法, 本文提出了一种基于改进的PNN神经网络手势识别算法。主要对传播率参数进行优化, 克服了传统传播率需要人工设置的缺点。经过仿真实验研究, 改进算法平均正确识别率均在90%以上, 而传统算法的正确率仅为80%左右, 即改进的PNN神经网络算法具有更短的训练时间和更强的分类能力。

关键词:手势动作识别,PNN,传播率,识别率

参考文献

[1]JIN D W, WANG R CH.Artif iciallntelligent prosthesis[J].Chinese J.Clinical Rehabilitation, 2002, 5 (20) :2994-2995.

[2]Paclik P, Novovicova J, Pudil P.Roadsign classification using Laplace classifier[J].Pattern Recognition Letters, 2000, 21 (13-14) :1165-1173.

[3]Sueteus P, Fua P, Hanson A J.Com-putation alstrategies for objectrecognition[J].ACM Computing Surveys, 1992, 24 (1) :5-61.

[4]Specht D.Probabilistic neural network[J].Neural Networks, 1990, 3 (1) :109-1 1 8.

[5]McDuff R J, Simpson P K.An Inves-tigation of Neural Networks for F-16Fault Dignosis:II.System Performance[C]//SPIE 1294 Application of Arti-ficial Neural Networks.1990:42-45.

[6]飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社, 2005.

最不会说谎的手势 篇11

手势更传情达意

心理学研究发现,与说话相比,手势等肢体语言携带着更多的信息,可以传递更为丰富和精准的情绪体验。

另外,与口头语言相比,手势等各种肢体语言很难“造假”,即使极力掩饰,它们仍会悄悄地泄露我们的本心。所以,经验丰富的研究者可以通过类似哑剧的手语发现“说话者”的真实意图。

打手势因为太激动

为什么有些人喜欢一边说话一边“手舞足蹈”呢?一些研究认为,手势可以有效地反映情绪。当说话者的情绪非常饱满,想要传达的信息非常强烈时,言语本身已不足以携带全部的信息,这时,手势等肢体语言就能很好地帮助我们传递这些能量。所以,慷慨激昂时我们会挥舞手臂,义愤填膺时我们会攥紧拳头。

还有研究认为,当一定的情绪体验产生时,身体的交感与副交感神经系统都会发生变化,引发去甲肾上腺素等激素水平发生相应的变化,从而引起躯体产生细微的、不自主的运动。

摸耳朵是不耐烦

更重要的是,当说话时传递的信息与本心不完全相符时,会产生一些不协調的负性能量对抗,身体的自然生理防御机制将会潜意识地寻找途径将这些能量释放出去,而手势则是最简单的释放方式。

遮嘴。说话时用手遮一下嘴,在很大程度上传递着所说内容不大可信的信息,而这种行为的变种是说话时摸鼻子。

摸耳朵。如果发生在倾听者的身上时,尤其当摸耳朵、侧脸、拉伸耳垂等动作频繁出现时,倾诉一方或者是正在滔滔不绝的演讲者就要小心了:你的发言已经让听众不耐烦了,你最好马上结束发言、调整话题或者更改说话的方式。

3D手势识别背后的技术 篇12

2D视觉的局限

计算机视觉技术一直在努力向堪比人类智慧的智能方向发展,以更好地了解场景。如果不能解释周围的世界,计算机就无法与人实现自然交流对接。计算机在了解周围场景方面面临的主要问题包括细分、对象表征、机器学习与识别等。由于2D场景表征本身存在局限性,手势识别系统必须应用其它各种提示信息才能得到包含更有用信息的更好结果。在可能性信息包含整个身体跟踪时,尽管将多种提示信息整合在一起,单靠2D表征也很难获得超越手势识别的任何信息。

“z”(深度)创新

向3D视觉及手势识别发展过程中的挑战一直都是第三坐标—z轴坐标的获取。人眼能看到3D对象,能自然识别(x,y,z)坐标轴,从而能够看到一切事物,而后大脑能够以3D影像的形式表达这些坐标轴。机器无法获得3D视觉的一大挑战就在于影像分析技术。目前有3种应对3D采集问题的常见解决方案,每种方案都有其独特的功能与特定的用途。这三种方案分别为:立体视觉、结构光模式以及渡越时间(TOF)。有了这些技术提供的3D影像输出,就可实现手势识别技术。

立体视觉

立体视觉系统可能是最为人所熟知的3D采集系统。该系统使用2个摄像机获得左右立体影像,该影像有些轻微偏移,与人眼同序。计算机通过比较这两个影像,就可获得对应于影像中物体位移的不同影像。该不同影像或地图可以是彩色的,也可以为灰阶,具体取决于特定系统的需求。立体视觉系统目前通常用于3D电影,能带来低成本而又震撼人心的娱乐体验。

结构光模式

结构光模式可用来测量或扫描3D对象。在该类系统中,可在整个对象上照射结构光模式,光模式可使用激光照明干扰创建,也可使用投影影像创建。使用类似于立体视觉系统的摄像机,有助于结构光模式系统获得对象的3D坐标。此外,单个2D摄像机系统也可用来测量任何单条的移位,然后通过软件分析获得坐标。无论使用什么系统,都可使用坐标来创建对象外形的数字3D图形。

渡越时间(TOF)

渡越时间(TOF)传感器是一种相对较新的深度信息系统。TOF系统是一种光雷达(LIDAR)系统,同样可从发射极向对象发射光脉冲。接收器则可通过计算光脉冲从发射器到对象,再以像素格式返回到接收器的运行时间来确定被测量对象的距离。

TOF系统不是扫描仪,因为其不支持点对点测量。TOF系统可同时获得整个场景,确定3D范围影像。利用测量得到的对象坐标可创建3D影像,并可用于机器人、制造、医疗技术以及数码摄影等领域的设备控制。

实施TOF系统所需的半导体器件现已开始供货。目前的器件支持实现TOF系统所需的处理性能、速度与带宽。

3 D视觉技术的比较

不同的应用或市场适用于不同的3D视觉技术。图1显示了不同3D视觉技术的比较及其相关响应时间、软件复杂性、成本及准确性的相对优缺点。

立体视觉技术需要极高的软件复杂性才能获得高精度3 D深度数据,其通常可通过数字信号处理器(DSP)或多内核标量处理器进行处理。立体视觉系统支持小巧的外形与低成本,是移动电话等消费类设备的良好选择。不过,立体视觉系统的精确度与响应时间不及其它技术,因此对于制造质量控制系统等要求高精度的系统来说不太理想。

结构光技术是包括3D计算机辅助设计(CAD)系统在内的3D对象扫描的良好解决方案。这些系统的相关软件复杂性可通过硬接线逻辑解决(如ASIC与FPGA等),其需要高昂的开发及材料成本。此外,该计算复杂性还可导致较慢的响应时间。在实现微观层面上的高精度方面,结构光模式技术优于其它3D视觉技术。

TOF系统取得了性能与成本的平衡,非常适用于需要快速响应时间的制造与消费类电子设备等应用领域的设备控制。TOF系统软件复杂程度通常较低,不过这些系统需要昂贵的照明部件(LED、激光二极管)以及高速接口相关部件(快速ADC、快速串行/并行接口、快速PWM驱动器),这将提升材料成本。图1显示了这三种3D传感器技术的对比情况。

“z”(深度)如何影响人机界面

随着“z”坐标的加入,显示与影像更接近自然,更贴近人类。人们在显示屏上能看到人眼从周边环境所看到的逼真事物。增加这第三维坐标改变了可使用的显示与应用类型。

显示

立体显示屏

立体显示屏通常需要用户佩戴3D眼镜。这种显示屏为左右眼提供不同的影像,两眼看到的影像不同,让大脑误以为看到了3D影像。这种显示屏目前广泛用于众多3D电视与3D电影院。

多视点显示屏

多视点显视屏不同于立体显示屏,无需佩戴特殊眼镜。这些显示屏可同时投射多个影像,每个影像稍微有些位移,形成适当的角度,让用户可在每个视点角度看到相同对象的不同投射影像。这些显示屏支持全息摄影效果,在不久的将来将实现全新的3D体验。

检测与应用

处理并显示“z”坐标的功能将实现全新的应用,其中包括游戏、制造控制、安全、互动数字标牌、远程医疗、汽车以及机器人视觉等。图2是身体骨架与深度映射传感技术所支持的某些应用领域视图。

人类手势识别(消费类)

人类手势识别是一项深受欢迎的新技术,可为游戏、消费类以及移动产品带来新的输入方式。用户能够以极其自然、直观的方法与设备进行互动,从而可促进产品推广。这些人类手势识别产品包括从160 x 120像素到640 x 480像素,30到60 fps的各种分辨率的3D数据。原始数据到z深度解析、双手跟踪以及全身跟踪等软件模块需要数字信号处理器(DSP)对3D数据进行高效快速处理,才能实现实时游戏与跟踪。

工业

工业与制造传感器等大多数3D视觉工业应用都采用至少1像素至数100k像素的影像系统。3D影像可使用DSP技术进行控制分析,确定制造瑕疵或者从部件集中选择正确的部件。

互动数字标牌(精确定位的市场营销工具)

每天我们都在遭受广告的轰炸,无论是看电视、开车还是在机场登机都是如此。有了互动数字标牌,企业就可通过精确定位的市场营销工具提供适合每位消费者的内容。例如,有人走过一个数字标牌,标牌上可能就会马上显示额外的消息确认该客户。如果客户停下来阅读信息,该标牌可能会理解为客户对产品感兴趣,并提供更有针对性的消息。麦克风则将让广告牌检测并识别关键短语,进一步精确定位所提供的消息。

这些互动数字标牌系统将需要3D传感器进行全面的身体跟踪,2D传感器进行面部识别,并需要麦克风进行语音识别。这些系统的软件将运行在更高级的DSP及通用处理器(GPP)上,不但可实现面部识别、全面的身体跟踪以及Flash媒体播放器等应用,而且还可提供诸如MPEG4视频解码等功能。

医疗(无故障虚拟/远程护理)

3D视觉将为医疗领域带来前所未有的全新应用。医生无需跟患者共处一室就可问诊。远程虚拟护理采用高精度3D传感器支持的医学机器人视觉系统,可确保为每一位患者提供最优质的医疗护理,无论他们身处何方。

汽车(安全)

近期,汽车应用在交通信号、车道以及障碍检测方面使用2D传感器技术取得了长足发展。随着3D传感技术的到来,3D传感器的“z”数据将大幅提升场景分析的可靠性。汽车通过使用3D视觉系统,现已有了预防事故的新途径,无论白天还是夜间都非常适用。采用3D传感器,车辆能可靠检测并解读周边环境,确定对象是否对车辆及车内乘客构成安全威胁。这些系统要求软硬件支持3D视觉系统,并需要密集型DSP及GPP处理性能在极短时间内解读3D图形,避免事故。

视频会议

视觉会议技术经过多年发展,已经从间断脱节传输影像发展成当前的高清系统。未来增强型视频会议将充分发挥3D传感器的优势,提供更真实、更具互动性的视频会议体验。该增强型视频会议系统具有集成型2D传感器以及3D传感器及麦克风组合,将能够与其它增强型系统连接,实现高质量的视频处理、面部识别、3D影像、噪声消除以及内容播放器(Flash等)等应用。随着这种密集型音视频处理需求的出现,需要具备最佳性能及外设组合的DSP。

技术处理步骤

对许多应用而言,需要同时具备2D和3D摄像机系统才能充分实现应用技术。图3显示了这些系统的基本数据路径。从传感器获取数据,然后进行视觉分析,这并不像数据路径示意图看上去那么简单。具体而言,TOF传感器需要的带宽相当于2D传感器的16倍之多,这可导致高输入/输出(I/O)问题。另一个瓶颈则存在于原始3D数据向3D点云转换的处理过程中。通过正确的软硬件组合解决这些问题,对于手势识别及3D的成功应用至关重要。当前数据路径可通过DSP/GPP处理器组合加上分立式模拟组件及软件库实现。

3D视觉嵌入式系统的挑战

输入挑战

如前所述,输入带宽限制对3D视觉嵌入式系统提出了极大的挑战。此外,输入接口也没有标准化。设计人员可为2D传感器与通用外部存储器接口选择采用不同的输入选项,其中包括串行与并行接口。在支持最佳带宽的标准输入接口出现之前,设计人员只能使用现有的接口。

两种不同的处理器架构

图3所示的3D深度映射处理可分为两类:一是以数据为中心的视觉专用处理,二是应用上层处理。以数据为中心的视觉专用处理需要处理器架构能够执行单指令多数据(SIMD)快速浮点乘法及加法运算,以及快速搜索算法。DSP是快速可靠执行这种处理功能的完美选择。对于应用上层处理而言,高级操作系统(OS)及协议栈则可提供任何应用上层所需的必要特性集。

根据两种处理器架构要求,提供高数据速率I/O GPP+DSP+SIMD处理器的片上系统(SoC)非常适合3D视觉处理,其可支持必要的数据及应用上层处理。

缺乏标准中间件

3D视觉处理领域的中间件是多种来源的众多不同组件的整合,包括开源(如OpenCV)与专有商业源等。商业库主要针对身体跟踪应用,这是一种特定的3D视觉应用。目前尚未开发出针对所有不同3D视觉应用标准化的中间件接口。

“z”(深度)之后会有什么精彩?

没有人质疑3D视觉的诱人因素。工程师早已在期待未来的应用发展。那么不久的将来会出现哪些最新技术?研究人员已经在开发针对人和对象的各种视觉技术了。全球研究人员正在使用多路径光分析技术,探索实现转角视觉或绕开对象的视觉途径。透明研究将带来可透视对象和材料的系统,而运动检测系统则将带来查看人类大脑内部的应用,从而可检验一个人是否在撒谎。

上一篇:小学生习惯养成下一篇:建模软件