动作时间

2024-10-21

动作时间（共5篇）

动作时间篇1

在农网和城网改造中, 推广使用剩余电流动作保护器 (RCD) , 极大地提高了安全用电水平。但在长期的使用过程中, 经常出现剩余电流动作保护器三次自动重合闸失败而闭锁的情况, 需人工送电。为此, 笔者设计了一套时间可调的自动重合闸装置, 提高了恢复送电的可靠性和及时性, 降低了台区责任人的劳动强度。

1 一般RCD接线

如图1所示, 正常运行时, SDLB-9型RCD不动作, 即跳闸继电器K不动作, K的动断触点闭合, KM得电吸合, 主触点闭合。在故障情况下, 零序电流互感器TA0将检测到的剩余电流信号送给SDLB-9, 进行比较放大, 然后给跳闸继电器输出一个指令, 使跳闸继电器K动作, 动断触点断开, KM失电释放, 主触点断开。SDLB-9有三次自动重合闸功能, 一般时间为20―30 s。当现场故障未排除, 三次合闸不成功, 则闭锁。

2 时间任意可调的RCD接线

如图2所示, 时间任意可调的剩余电流动作保护器增加了中间继电器KA和时间继电器KT, 其中KA型号为JZ7-44 (额定电压AC 220 V) , KT型号为ASY-3D (额定电压AC 220 V) 。从图2可以知道, 合上QF, KT得电, 延时一定的时间, 其延时闭合的动合触点闭合, KA得电, KA动合触点闭合, KM和SDLB-9同时得电并自锁, 主触点闭合, 进入运行状态。因为KM得电并自锁, 辅助动断触点断开, KA与KT失电释放。一旦线路出故障, 零序电流互感器TA0将检测到的剩余电流信号送给SDLB-9, 进行比较放大, 然后给跳闸继电器输出一个指令, 使跳闸继电器K动作, 动断触点断开, KM失电释放, 主触点断开, 辅助动合触点断开, SDLB-9失电, 退出运行, 失去自动重合闸功能。因为KM失电释放, 辅助动合触点闭合, 使KT又得电, 在故障已排除的情况下, KM和SDLB-9同时得电, 完成合闸。一般延时时间调到10 min比较合适, 可以解决短时间由于连续雷击、接地、漏电等造成保护器跳闸后, 自动重合闸失败而闭锁的缺陷。

动作时间篇2

2、惊风飘白日，光景西驰流。

3、时间落到懒汉手里，永远是一张白纸。

4、尽可多创造快乐去填满时间，哪可活活缚着时间来陪着快乐。

5、世界上最快而又最慢，最长而又最短，最平凡而又最珍贵，最易被忽视而又最令人后悔的就是时间。

6、昙花一现蜉蝣朝生暮死都有过最美的一瞬人的一生相对于万物的永恒来说却不过弹指一瞬

7、无可奈何花落去，似曾相识燕归来。 (宋)晏殊《浣溪沙》

8、重回首，去时年，揽尽风雨苦亦甜。夜阑珊，读无眠，听尽春言，每天都是新的一片，不再清闲，望着洒满月光的星星一路向前。

9、时间是人的财富，全部财富，正如时间是国家的财富一样，因为任何财富都是时间与行动化合之后的成果。

动作时间篇3

关键词：电客车,关门报警,关门动作,响应时间,逻辑改进

1 背景

广州地铁A3型电客车采用长客庞巴迪公司生产的4动2拖六节编组A型地铁车辆，现该型列车主要应用于广州地铁一号线运营。但该型车在运营过程中部分乘客反映列车存在关门报警与关门动作时间同步的情况，对乘客及时上下车造成一定影响。

本文基于此问题，组织对A2、A3型列车的关门报警与关门动作响应时间进行了调查分析，找出问题的原因，为今后的地铁设计提供参考依据。

2 问题调查

广州地铁一号线A3型车与二、八号线A2型车在车门的关门动作与关门报警的控制逻辑原理相同：司机按压司机室8S03/8S04关门按钮，同时4A18控制模块受到关门信号，发出车门报警信号给广播控制系统CACU实现车门关门报警，设定该响应时间为T1，如图1所示[1,2]。

司机按压8S03/8S04关门按钮的同时列车8K07/8K08继电器失电，导致8K03/8K04继电器失电后列车所有车门控制器ECDU收到关门信号，设定该响应时间为T2，如图2所示[1,2]。

为调查在司机按压关门按钮后车门报警与车门关闭动作响应时间的差别，首先利用示波器对A3型车的关门报警响应时间T1进行测试。通过示波器捕捉广播系统的X1107脚与车门关闭继电器8K07 A1脚(或8K08 A1脚)分别得电时间，两者时间差即可计算车门关门报警响应时间T1为2.1s，如图3所示。

查阅相关资料，广州地铁一号线A3型列车车门控制器(EDCU)设定有一个关闭前的警告延迟时间T_cw_1，暂设定为时间2)，如图4所示。目前广州地铁A2、A3型列车所有车门控制单元该参数值均设定为2s。

由于EDCU收到车门关闭信号是受8K03�4继电器控制，该时间应为继电器的得电动作时间，为毫秒级，可视为8K07�8继电器A1脚得电时间。由于车门EDCU软件逻辑中设定了一个车门关闭前的警告延迟时间T_cw_1=2s，所以可知司机在按压关门按钮2s后列车车门才开始执行关闭动作，车门关闭响应时间T2=2s。通过分析可知，车门关门报警响应时间T1=2.1s，车门关闭动作响应时间为T2=2s，二者响应时间几乎同步。

随即对广州地铁A2型列车进行了同样的测试，通过示波器捕捉结果如图5所示。测试结果显示关门信号给出与车门关门报警开始之间的间隔仅为0.3s，即车门关闭报警响应时间T1=0.3s。而一号线A3型车及二、八号线车A2型车的车门参数设置是完全一致的，即EDCU车门关闭延迟时间设置均为2s,T2=2s。T1与T2的时间差为1.7s,A2型列车关门动作响应时间与车门关门报警与存在1.7s的延迟，可实现车门报警的提前预警效果。

因此，通过对比测试可以明显的发现，广州地铁一号线A3型车相较于二、八线A2型车，CACU接收到关门信号的延迟要大1.6s左右。这是造成一号线A3型列车车在正线运营时存在关门报警与关门动作同步的情况发生的根本原因。

3 解决方案

3.1 调整A3型列车EDCU车门关闭延迟时间T＿cw＿1

通过前期调查知T2=T_cw_1，查阅A3型列车车门控制单元的相关资料知，T_cw_1该设定值可以进行人工调整，将T2时间适当增加可满足T1、T2两者时间存在间隔。车辆人员利用A3型车车门软件将T_cw_1时间调整到5s后，实际试验关门时，关门报警声比车门关闭动作先给出2～3响，可实现关门时提前预警的效果，起到关门警示的作用。

此方案可操作性较强，仅需使用PTU对原有车门控制器设定参数进行修改。但T_cw_1修改关门时提前发出关门报警2声，但修改参数后T_cw_1延长3s，司机每站操作关门按钮到门关好所需时间比修改前多出3s，造成每个站车门关好延迟3s，站停时间相应增加3s，广州地铁一号线共设车站16座累积延长时间48s。目前一号线正线日均客流已突破95万人次/日，正线行车密度大，由此造成的每趟车次约50s延误会给正线运行图的准点兑现造成影响。此方案经综合评估后可行性不高。

3.2 消除DX模块的响应延迟

A3型列车04A18控制模块在接受到车门关门按钮给出的关门信号后，送出广播报警信号时产生2.1s延迟。鉴于二、八号线A2型车T1=0.3s，远小于A3型车的2.1s，而广州地铁A2、A3型列车是基于同一设计框架上生产制造的，该时间差异不是由硬件造成，可以判断两种车型在T1时间的差异是由列车诊断控制系统VTCU的运算逻辑差异造成的。由于A3型车车门关闭报警响应时间T1的延迟造成车门关门报警的提前预警功能失效，对乘客的正常上、下车造成一定影响，这一问题属厂家设计缺陷。

目前就此问题地铁公司已要求厂方更新诊断系统的控制逻辑软件，要求重新修改后的列车控制软件应不存在关门报警响应延迟问题。

4 结束语

广州地铁A3型列车由于列车诊断控制系统中的逻辑设定偏差导致列车关门报警响应时间出现明显滞后，造成列车关门动作与关门报警响应同步问题的出现，对地铁乘客的正常上、下车造成了一定影响。

基于此问题，在今后的地铁列车设计中应充分发挥为乘客服务的人性化设计理念，明确列车关门报警提示音的响应时间应优先于列车客室车门的动作响应时间这一技术要求，以避免类似问题再次出现。

参考文献

[1]长春长客-庞巴迪轨道车辆有限公司.广州地铁二号线车辆维修手册[Z].2006.

[2]长春长客-庞巴迪轨道车辆有限公司.广州地铁二号线车辆电路图[Z].2006.

动作时间篇4

基于双馈感应发电机(DFIG)的双馈式风电机组具有利用率高、逆变器容量小、功率可解耦控制[1]等优点。因此,被广泛应用于当前风力发电系统中。但是,双馈式风电机组的电磁暂态特性十分复杂,当电网故障导致机端电压跌落较严重时,定转子侧都会产生过电流。为了保护机组和变流器的安全,目前较多的是在转子侧投入撬棒保护,将撬棒电阻串接到转子侧,以减小系统短路电流[2]。此时,与传统同步发电机向电网注入的短路电流相比,双馈式风电机组的短路电流特性会发生较明显的变化。因此有必要对电网故障时,双馈式风电机组在低电压穿越期间的暂态特性进行全面、深入的研究。

文献[3]指出,双馈机组提供的短路电流与传统同步机组提供的短路电流具有明显的差异。当双馈机组进行故障穿越运行时,其馈入电网的故障电流具有“多态”变化特征,将改变电网的故障特性。文献[4]采用物理过程法分析了机端发生三相对称短路时,定、转子短路电流的频率成分及其计算表达式,适用于假设转子电压保持不变的情况。文献[5]通过类比异步电机的方法分析了DFIG在空载故障时投入撬棒(Crowbar)保护的短路电流峰值。文献[6]采用磁链守恒原理给出了机端发生三相对称故障,撬棒保护动作后的短路电流分析方法。文献[7-8]给出了双馈式风电机组在电网发生不对称故障时的短路电流解析表达式,并分析了撬棒保护动作后频率成分和衰减时间常数的变化。

上述文献在分析双馈式风电机组的短路电流特性时,均假设撬棒保护瞬时动作。但是实际上撬棒保护并非瞬时动作,而是根据故障严重程度带有不同的动作延时。本文提出一种可以考虑撬棒保护的动作延时对双馈式风电机组短路电流特性影响的分析方法。根据故障特征将故障过程分解为两个阶段:第1个阶段是电网发生故障,电压已经跌落,但撬棒保护还未动作;第2个阶段是经过短暂延时,电流或电压已经达到阈值,撬棒保护动作,同时转子侧变频器闭锁。将第1个阶段的末状态作为第2个阶段的初始状态,通过求解两个过程的短路电流计算式,来分析撬棒保护的动作时间对DFIG短路电流特性的影响。

1 DFIG的正负序矢量模型

本文采用DFIG的空间矢量模型[8-9],定转子侧都采用电动机惯例,忽略磁饱和现象。

DFIG绕组一般为不带中线的星形接线,没有零序分量。因此,发生不对称电压跌落时,可将DFIG定转子侧电压、电流、磁链等空间矢量分解为正向和反向两个同步旋转坐标系中对应的正、负序矢量形式[10-11],如下式所示:

式中:F表示电压、电流或磁链等电气量;下标“αβ”表示两相静止坐标系,“+”和“-”分别表示正向和反向同步旋转坐标系;上标P和N分别表示正序和负序分量;ω1为同步旋转角速度。

式(2)为DFIG正向同步旋转坐标系下的正序矢量数学模型,式(3)为DFIG反向同步旋转坐标系下的负序矢量数学模型[11]。本文中如无特殊说明,正向同步旋转坐标系下的正序矢量简述为“正序分量”,反向同步旋转坐标系下的负序矢量简述为“负序分量”。

式中:uPs,+,iPs,+,ψPs,+,uPr,+,iPr,+,ψPr,+分别为正向同步旋转坐标系下的正序定转子电压、电流、磁链矢量;uNs,-,iNs,-,ψNs,-,uNr,-,iNr,-,ψNr,-分别为反向同步旋转坐标系下的负序定转子电压、电流、磁链矢量;Rs和Rr分别为定转子侧的绕组;Ls,Lr,Lm分别为定转子侧的自感及互感;ωs为转差角速度,ωs=ω1-ωr,其中ωr为转子角速度;s为转差频率;D为微分算子d/dt。

2 计及撬棒保护动作时间的短路电流特性

2.1 撬棒保护动作过程分析

双馈式风电机组结构及其转子侧撬棒保护电路如图1所示。

当双馈式风电机组发生机端电压严重跌落时,从故障发生到撬棒保护动作短接转子绕组存在一定的延时。该过程可以分解为两个阶段:第1个阶段为从故障发生到撬棒保护动作,该阶段定子侧电压跌落;第2个阶段为故障后电流或电压达到撬棒保护动作阈值,撬棒电阻短接转子绕组,转子侧变频器闭锁,双馈式风电机组作异步运行。根据式(2)或式(3),可得

式中:M =LsLr-L2m;A=-Lm/M ;B=Ls/M 。

式(4)和式(5)既适用于正序矢量模型,也适用于负序矢量模型。因此,分析第1和第2阶段磁链的计算式,进而可求得整个故障过程的短路电流表达式。

设us′为故障后的电压矢量,有

式中:usP,+和usN,-分别为故障后机端正、负序电压矢量。

2.2 撬棒保护动作前故障电流解析

设t=0时刻故障发生,t=t0时刻撬棒保护投入运行,即0

故障发生前,系统稳态运行。采用电动机惯例,t=0时刻定子电流和磁链如下式所示:

式中:is为稳态运行时的定子电流矢量;ψs为稳态运行时的定子磁链矢量;us为稳定运行时的机端电压矢量;S为风电机组输出的复功率;“*”表示共轭运算。

系统故障前三相对称运行,没有负序分量,即定转子负序磁链在t =0 时刻的值都为零。根据式(2)、式(3),给出故障后第1阶段所需电气量初值如下式所示:

忽略定子电阻,求解式(2)中定子正序电压矢量方程,考虑定子衰减时间常数的影响,并根据式(8)中定子正序磁链初始值,可得第1阶段定子正序磁链如式(9)所示,求解过程见附录A。

式中:Ts=M/(LrRs),为定子衰减时间常数[12]。

将式(5)代入式(2)中的转子正序电压方程,可得第1阶段转子正序磁链微分方程如下式所示:

求解式(10)可得,第1 阶段转子正序磁链如式(11)所示,求解过程见附录A。

式中:Tr=M/(LsRr),为转子衰减时间常数;C1为积分常数,其值见附录B。

根据式(9)和式(11),第1 阶段定子正序电流为:

同理,忽略定子电阻,求解式(3)中定子负序电压方程。考虑定子衰减时间常数的影响,并根据式(8)中定子负序磁链初始值,可得第1阶段定子负序磁链如下式所示:

由于假设转子电压在该过程中保持不变,且只存在转子正序电压分量,因此转子负序电压分量为零,即urN,-=0。将式(5)代入式(3)中,可得第1阶段转子负序磁链微分方程如下式所示:

求解式(14)可得,第1阶段转子负序磁链为:

式中:C2为积分常数,其值见附录B。

根据式(13)和式(15),第1阶段定子负序电流表达式为:

综上,第1阶段定子电流为:

2.3 撬棒保护动作后故障电流解析

t>t0为第2个阶段,该阶段撬棒保护动作。若将撬棒电阻等效为转子绕组的一部分,则撬棒动作等效为转子绕组端口发生三相短路,端口电压为零。转子侧电阻变为Rt,且有Rt=Rr+Rc,其中Rc为撬棒电阻的阻值。

第2阶段的初始值为第1阶段在末状态的值,相关量的初始值如下式所示:

第2阶段定子正序电压方程与第1阶段相同,故定子正序磁链为:

将式(5)代入式(2)中的转子正序电压方程,并根据转子电压为零,可求得第2阶段转子正序磁链的微分方程如下式所示:

求解式(20)可得,第2阶段转子正序磁链为:

式中:Tr1=M/(LsRt),为撬棒动作后转子侧衰减时间常数;C3为积分常数,根据式(18)可得其值(见附录B)。

根据式(19)和式(21),可得第2阶段定子正序电流为:

同理,第2阶段定子负序电压方程与第1阶段相同,故定子负序磁链为:

将式(5)代入式(3)中的转子负序电压方程中,并根据转子电压为零,可得第2阶段转子负序磁链微分方程如下式所示:

求解式(24),得到第2阶段转子负序磁链为:

式中:C4为积分常数,根据式(18)可得其值(见附录B)。

根据式(23)和式(25),可得第2阶段定子负序电流为:

综上,第2阶段定子短路电流为:

2.4 短路全电流特性分析

综合式(17)和式(27),整个短路过程的定子电流为:

式中:B1=B;C1=C;A,C,D,A1,D1的数值见附录C。

若t0趋近于无穷大,其实质即为不考虑撬棒投入情况下的短路电流计算式(前提条件假设转子电压不变)[4];若t0趋近于零,其实质即为故障后撬棒瞬时投入的短路电流计算式。

根据式(28)可得,短路全电流中包含4种频率成分,依次为正向工频分量、反向工频分量、直流衰减分量和转速频率分量。各频率成分的幅值及其影响因素如表1 所示,表中“√”代表与该因素有关,“×”代表与该因素无关。

结合式(28)和表1可得,若机端电压完全跌落,则故障后定子正负序电压均为零,因此正向和反向工频分量不存在,只存在直流衰减分量和转速频率衰减分量,其中转速频率分量以Tr1快速衰减完,直流分量以Ts缓慢衰减直至为零。若机端电压不对称跌落,则故障后定子正负序电压均不为零,因此存在4种频率分量,除了以Ts衰减的转速频率分量和以Tr1衰减的直流分量外,还存在稳定运行的正向和反向工频分量。

可以看出短路电流计算式极为复杂,撬棒保护动作延时的影响,并不能从撬棒投入前后的短路电流表达式中直观进行对比分析,但从理论上讲,撬棒保护的快速动作会对短路电流峰值起到抑制作用。

3 仿真验证

以MATLAB/Simulink提供的1.5 MW双馈式风电机组仿真模型为参考,验证本文给出的计及撬棒保护动作时间影响的短路电流计算表达式的有效性。DFIG的基本参数和撬棒阻值见附录D。

3.1 对称性故障仿真

t=0ms时,机端发生三相短路,机端电压跌落为零,此时A相电压的初相角α=90°;t0=5ms时,撬棒保护投入运行。图2所示为定子ABC三相短路电流的解析计算波形与仿真波形对比图。

由图2可以看出,解析计算波形可以较准确地复现仿真波形。根据式(28),频率成分中只有快速衰减的转速频率分量和缓慢衰减的直流分量。计算短路电流时假设转子侧电压不变,而仿真中转子侧电压受控制系统影响会发生一定程度的变化,由于两者的不一致造成了部分误差的存在。

为分析对称故障情况下撬棒保护动作时间对短路电流特性的影响,同样令t=0 ms时机端发生三相短路,机端电压跌落为零,分别作出撬棒保护动作时间t0为0,3,5,7 ms时,DFIG定子A相短路电流的解析计算波形与仿真波形对比图,如图3所示。

结合图3和式(28)可知,无论是解析计算波形还是仿真波形,当机端电压对称性跌落时,随撬棒保护动作延时的增加,短路电流中交流分量的幅值会相应增加,但是直流衰减分量不受影响。当延时小于3ms时,对短路电流的峰值影响较小,但当延时大于3ms时,对短路电流的峰值影响较大。

3.2 不对称性故障仿真

t=0ms时,机端发生BC两相相间短路,A相电压不变,BC相都变为A相的反方向,且幅值为A相的一半,此时A相电压的初相角 α=0°。当t0=5ms时,撬棒保护投入运行,DFIG定子ABC三相的短路电流解析计算波形与仿真波形对比图,如图4 所示。

根据式(28)可知,当机端发生不对称故障时,短路电流的频率成分除了衰减的转速频率分量和直流分量外,还存在稳定的正、反向工频分量。

分别作出撬棒保护动作时间t0为0,3,5,7ms,机端发生BC两相相间短路故障时,DFIG定子C相(故障相)短路电流的解析计算波形与仿真波形对比图,如图5所示。

结合图5和式(28)可知,当机端电压不对称性跌落时,撬棒保护的动作延时对短路电流的峰值有一定的影响,当延时小于5ms时影响较小,而当延时大于5ms时影响较大。

4 结语

本文对双馈式风电机组在低电压穿越过程中投入撬棒保护的故障过程进行了系统分析。针对撬棒保护并非瞬时投入运行,而是根据故障严重程度带有不同的动作延时这一问题,提出按照撬棒保护动作时刻将故障过程分解为前后两个阶段考虑的解析方法。以不对称故障为例,分析推导了考虑撬棒保护动作时间的短路全电流的计算表达式。通过该计算表达式,分析了撬棒保护动作时间对短路电流特性的影响。研究结果表明,机端电压跌落情况下,撬棒保护的动作延时会增大短路电流的幅值。从抑制短路电流的角度出发,应加快撬棒保护的动作速度,但撬棒保护动作的同时加速了短路电流的衰减,可能带来故障特征消失,其与保护的协调配合问题仍有待更深入的研究。

动作时间篇5

人体动作识别主要涉及到三个相互关联问题:身体骨架、身形分析以及特征提取。骨架的提取比较容易, 是一种有效的形状压缩表示方法。文献[3]提出采用骨架提取法分析动作。该方法生成身体轮廓的骨架, 用以辨别行走、奔跑和步态。Ziaeefard和Ebrahimnezhad对该方法进行了改进, 他们介绍了一种规格化极性直方图, 该直方图从“星”骨架获得, 对应于一个动作周期的累积骨架。特别是他们对比了几种骨架提取方法, 并提出了一种支持向量机 (SVM) 分类技术用于动作识别。文献[5]采用不同的骨骼提取方法, 在同样的数据集上取得了更好的效果。但是由于他们采用极性直方图代替基于时间的直方图, 因此时态信息会丢失。文献[6]提出了基于动作捕捉技术的解决方案, 其动作行为是通过虚拟关键姿态建模而成, 类似于绘制代表重要动作的关键姿态或者动作各部分之间的转换。该方法受到关键姿态数量的限制, 且计算复杂。文献[7]解决了利用运动模板进行动作识别的问题。他们从一个序列的动画中提取模式来识别动作, 将识别问题转化为易于解决的模式识别问题。文献[1]在游戏应用中利用关节角度作为特征来识别舞蹈动作。该方法受到动作数量的限制, 当不同动作数量很大时, 识别错误率会显著提高。文献[2]提出actionlet的概念, 将关节和相邻深度聚类使之更容易被辨识。然而, 运动捕捉数据必须总是包括深度信息, 这是不可能的。文献[8]依据运动历史图像 (MHI) 引出运动模板的概念, 将识别问题变为匹配问题。尽管该方法比经典的机器学习法更快, 但对扩展数据库来说仍然是耗时的且不够灵活。文献[9]采用轮廓的“样例”范式解决数据库的有效性问题。尽管该方法在增加新动作时有效果, 但仍然存在轮廓固有的视野依赖问题。与“复杂”的动作识别相比, 这种解决方案更适合“简单”的手势识别。文献[10]提出圆柱直方图的概念, 是采用多视点构建的三维立体直方图。文献[11]采用三维直方图处理样本范式, 依据多视点实现不依赖视野的学习方法。文献[12]提出了一种复合方法, 对轮廓的各部分作标签。尽管该方法对于步态分析很有效果, 但是对一般的动作识别会受标签方法的限制。文献[13]采用轮廓的马尔科夫模型识别主要的简单动作。文献[14]将轮廓作为二维表面, 通过一系列时空剪影构建三维曲面。然后, 从三维曲面提取兴趣点, 生成了类似动作轨迹线的图像。但是该方法不是实时的, 需要花费大量的时间建立三维曲面。此外, 获取的轨迹图取决于三维曲面的质量, 而这很容易产生误差。文献[15]提出了一种运动历史图像 (MHI) 的扩展, 使用支持向量机 (SVM) 聚类动作行为。由于在系统中使用的参数太多, 很难从他们的结果得出强有力的结论。文献[16]开发了剪影为基础的方法, 以轮廓作为特征向量。该方法使用降维方法聚类动作, 然后采用识别阶段的时序图设计了K邻近算法。因为他们的解决方案取决于所提取轮廓的质量, 识别成功率受此影响。

提出了一种新的基于范例策略的人体动作识别系统, 以动态捕捉的姿态数据作为输入。首先, 将直方图的概念扩展到姿态, 然后, 聚类各种时空姿态建立动作的统计表示。为了识别持续的动作, 引入了增量及有效内存的结构———积分直方图。最后, 根据动态时间规整 (DTW) 方法设计了动态程序算法, 并用于分解的动作比较以及多人动作实例中的识别能力计算。直方图的有效规划能够使其在进行过程中学习并识别动作。在著名的基准数据集上对提出的方法进行了广泛的验证测试, 并与几种先进的方法进行了比较, 结果表明, 即使在有噪声或类似行为的数据集中, 提出的方案仍然有效。

1 基于直方图的比较

介绍基于直方图的方法, 用于从动态捕捉数据中进行动作分类。设P为从视频中提取的所有姿态集合。使A= (p0, …, pN) 为一组时间序列姿态组成的动作, 假定A从时间t0开始, 到时间tN结束。不失一般性, 设定t0=0。一个姿势可以有简单的人体骨架几何表示, 包含一系列三维关节及其之间的层次关系。由于运动中的噪声扰动以及速度变化, 不同的动作可能获得完全相同的姿势, 而相同的动作会稍有不同。为了解决这个问题, 把一个动作的所有姿势分组, 基于相似性判据将姿势分到一组聚类集合中。然后, 每个聚类用一个代表性的元素定义, 用p~表示, 称为代表。采用已知的Hausdorff距离定量表示两个姿态p1和p2之间的相似度, 用Dp表示。为了实现姿势的聚类, 还要定义ε为两个姿势之间的等效阈值。

定义1:用Dp表示两个姿态p1和p2的距离, ε为两个姿势之间的已知等效值。

式 (1) 中, p1, p2∈P2。

式中, |·|是基础姿势。

注意当t≤tN时, 动作A的时间区间为[0, t]。在全部动作完成之前进行动作识别时, 这个区间的限制很有用。要这么做, 需要评估随时间推移的动态捕捉数据是预先学习过动作的可能性, 定义了基于姿态的积分直方图, 用以计算识别决策进程的可能性。

定义2:动作A的基于姿态的积分直方图H, 有

采用巴氏距离x测量两个直方图的相似性, 用DH表示动作A和B直方图距离。

式 (5) 中

根据式 (5) 可以推出评估动作A和B相似性的费用函数。

式 (7) 中, TA和TB分别表示动作A和B的时间长度。

2 在线识别

2.1 分段动作比较

由于积分直方图缺少时态信息, 因此将动作分解为时间序列的分动作。对于动作A, 定义一组时间序列姿势 (p0, …, pn) , 对于所有的分解可能, 其长度范围从1到n+1, 可有下面递归算法定义。

A只有1个姿势:A= (p0) 。

A有2个姿势:A= (p0, p1) 。

A有3个姿势:A= (p0, p1, p3) 。

A有n+1个姿势:A= (p0, …, pn) 。

式 (11) 中,

式 (12) 中, 0≤a≤b≤n-1, 对于A= (p0, …, pn) , (pi) *表示序列 (pi) 重复0到N次, 如式 (13) 表示。

在对动作A和B比较时, 根据式 (7) , 可以找到最优分解方法以获得最小费用值。为了这个目的, 将每个分解动作建立直方图, 可获得整个动作的直方图时间序列。例如, 动作A包含4个姿势, 可分为3个分解动作, 可用3个直方图的时间序列表示

因此, 一个动作的分解可以看作是时间序列的子积分直方图, 用长度不超过N的矢量 (h0, …, hN) 表示。

采用动态编程范式计算动作的最优分解, 这是最好的选择。为了比较两个动作A和B, 对所有可能的分解进行评估并选取最好的费用值 (Cost*) , 通过下式计算

式 (15) 中, (h0A, …, hNA) 和 (h0B, …, hMB) 分别适用于A和B。

2.2 多重假设

每个动作使用只含一个样例的训练集不能获取较高的识别率。这是由于人体活动是多样化的, 导致不同的身体比例和运动模式, 同样动作的两个样例可能稍有不同。为了解决这个问题, 每个动作的训练集需要包含同一动作的多个样例, 这些多个实例被翻译成多个直方图。使用多个直方图来表示一个动作, 而不是把多个直方图结合到一个直方图里。将这些表示一个动作的多个直方图称为假设。尽管使用相同动作的n个范例作为训练集, 但最终生成少于n的假设量。因此, 需要将非常相似的样例聚类打包到一个假设中。通过实验, 采用K-medoids算法成功实现了这个聚类处理, K-medoids算法与K-means算法有许多相似之处。这两种算法的不同处在于中间值的选取。K-means算法中, 中间值为聚类集合的重心元素, K-medoids算法中, 其中间值为重心最近的元素。

算法1:K-medoids。找到分割成K组的最佳方案, 返回每个中心最近的元素。

K-medoids算法中的distance函数由式 (7) 定义, 每个medoid就是一个辨识单个假设的直方图。

换句话说, 假如“非常相似”的直方图不如单独一个好, 那就只要保留描述相同动作的“不同”样例的直方图。这些“不同”直方图的集合用HA表示, 用于描述识别阶段中相同动作的多重假设。因此, 识别得分可用式 (16) 计算

式 (16) 中, HA是关于动作A的多种假设集合, hB是正在识别的动作的直方图。

3 实验

通过HDM、CMU、TUM和MSR Action3D数据集对上述的方法进行测试。HDM和CMU都是用于游戏方向的, 其动作是为了电脑动画而设计。这两种数据集主要由容易定义的短动作组成, 很容易评估识别成绩。TUM和MSR Action3D数据集更真实, 是由复杂自然环境下的真人动作组成的。通过这两个数据集, 可以测试所提方法的健壮性, 并和其他解决方案进行对比。

3.1 游戏性数据集

在HDM数据集上对本文设计的系统进行了测试。该数据集包含130类, 2 337个动作 (从较长的动作捕捉数据中截取) , 这些动作分别由5个表演者完成。可以分为两种情况考虑:单一假设和多重假设。针对第一种情况, 从每个类 (随机执行, 随机表演者) 中随机选取一个动作样例, 作为训练集。针对第二种情况, 从每个类中随机选取几个动作样例, 只用三个样例描述一个动作。同时构建另一个数据集, 包括9类53个动作 (表1) , 这些数据从大而复杂的CMU数据集中提取。

文献[8]使用了一个CMU数据集的类似子集, 识别率在75%左右。与其结果相比, 本文提出的解决方案的效果更好, 单一假设和多重假设情况下识别率分别是86.63%和90.92%。

图1中 (a) 和 (b) 所示为通过混淆矩阵计算ε=1.0时单一假设的结果, 这两个图表明本位方法对于不同动作具有很高的辨别能力, 同时也突出相似动作, 例如“拳击”, “喝水”和“吃东西”, 这3个动作均涉及手部活动。图1中的 (c) 和 (d) 显示多重假设解决方案, 显然具备更高的辨识力, 这正是因为其允许更多的类内变化。注意在多重假设解决方案下, 为了在语义上与处理2D动作的通常方法相一致, 将最初的130类手动减少到33个的类。由此产生的数据集实际上对基于范例的方法而言更具挑战性。事实上, 33类比最初的130类反而有更多的类内变化。本文使用每类3个实例用于训练, 在类内变化上的任何增加都会给识别方法添加额外的难度。事实上, 如果简单添加一些训练样本, 保留所有初始的130级, 那任务会更容易。难度增加来自额外的类内变化 (如行走时左/右起步次数) , 这对于任意基准范例识别方法来说都是更具挑战性的环境。另一方面, 传统的机器学习方法使用更大的训练集, 本文的方法使得在类的数量较小时能具备更好的辨识能力, 如图2所示。

表4列出了更多量化成绩, 与其他方法相比, 本文的方法显然具有更出色的效果。单一假设的识别率超过三分之二先前的研究工作, 在一对一策略时效果不理想。然而, 全自动多重假设解决方案在类似的环境下优于所有三种方法。例如, 文献[8]提出的方法有80%的平均识别率, 而多重假设方案在同一数据集取得了96.67%的识别率。还要注意, 文献[8]中用于查询的关键帧需要手动选择。

3.2 活动数据集

3.2.1 TUM

为了将提出的解决方案与活动识别方法进行比较, 实验使用TUM数据集, 它是由20个按表中设定的人物序列组成, 并制成表。与文献[14]相似, 应用两种不同的策略:使用一组序列{0-2, 0-4, 0-6, 0-8, 0-10, 0-11, 1-6}作为测试集, 而其他则用于训练。为与文献[6, 7, 14]的方法一致, 使用10个不同的类, 并用“站立”和“行走”划分。如表2所示, 文献[14]的方法使用TUM数据集中的2D特征和动态捕捉信息, 取得很好的比较结果, 识别率为81.5%。其结果也好于文献[7]的方法, 由于只使用了2D特征信息, 识别率仅为67%。最后, 方案的结果优于文献[6]的62.77%的识别率, 即使该方法有额外为门使用了传感器。

a:CMU行走, b:HDM躺下, c:CMU奔跑, d:HDM座椅子, e:CMU跳, f:HDM肘碰膝

本文还实验了一对一情况或一次训练情况, 将训练集中每个动作的第一个实例用于训练。将结果与其他三种经典机器学习算法进行比较:基于径向基核的支持向量机 (SVM) 、K近邻算法 (k NN) 、树分类算法 (Tree) 。训练集与文献[6, 7, 14]的一致。表3中一对一的项表示的是全序列0-2的识别得分, 使用了序列0-12的活动。虽然该数据集模糊少, 但由于其执行的复杂性和类内变化信息的缺乏, 有些行为不能设别。

在表2中对比较结果进行的汇总, 一对一学习时, 本方案的结果比SVM、k NN和Tree这三种方法稍好, 多重假设学习时, 结果显著好于所有六种方法 (SVM、k NN、Tree和文献[6, 7, 14]) 。

注:“-”表示未公布结果。

3.2.2 MSR Action3D

MSR Action3D是一个新数据库, 在2010年由微软亚洲研究院 (Microsoft Research) , 其设计目标是为动作识别提供三维数据。该数据集是由10个表演者完成的20个动作构建的, 每个表演者有3个范例。数据集包含以下动作:高挥臂 (high arm wave) 、低挥臂 (horizontal arm wave) 、敲打 (hammer) 、手抓 (hand catch) 、冲拳 (forward punch) 、高抛 (high throw) 、画X (draw x) 、画勾 (draw tick) 、画圆 (draw circle) 、拍手 (hand clap) 、双手挥 (two hand wave) 、侧拳 (side boxing) 、弯腰 (bend) 、向前踢 (forward kick) 、侧踢 (side kick) 、慢跑 (jogging) 、网球挥拍 (tennis swing) 、网球式发球 (tennis serve) 、高尔夫挥杆 (golf swing) 、捡起 (pick up) 和扔 (throw) 。动作中只需要一只手臂或一条蹆时, 只用右边完成动作。这些动作的深度图通过微软体感传感器获得, 骨架有文献[5]的方法提取, 如图3所示。该数据的难度在于所提取骨骼存在噪声干扰。骨骼所含噪声比TUM数据集更多, 甚至比HDM和CMU数据集的也多。

使用这些数据集, 将本文的方案与最先进的五种算法进行比较。除了文献[9]使用深度图作为输入, 其他四种方法和本文一样, 使用视频中提取的骨骼作为输入, 通过动作图像模拟动态行为。本文使用了文献[11, 13, 15]在MSR Action3D数据集上的测试结果, 该结果发表在文献[10]中。表3总结了这些比较结果, 并列出了详细数据。本文的多重假设结果明显好于其他五种方法。甚至在使用一对一策略时, 本文的方法仍然表现良好。

在表4中总结了所有数据集的结果, 概括了本文与其他方法比较的性能。这些结果表明, 当动态捕捉数据 (三维骨骼) 有效时, 本文的方法是最适合动作识别的方案。此外, 由于本文的方法是基于样例的, 当具有小训练集或者在线快速训练效果满意时, 本文的方法是更好的。

(“-”表示未公布结果)

3.3 早期识别

本文的方法在动作完成之前进行识别很有潜力, 现在就给出早期识别的结果。图4列出了所有数据集上的识别率, 分通常和一对一的学习情况, 其中动作完成的范围为50%~100%。

TUM数据集的动作比较复杂, 从图4可以看出, 动作全部完成的识别率与动作完成50%时相比没有显著增加。其主要原因是该数据集中大部分辨别信息包含在动作的早期阶段。然而, CMU数据的动作更长且迥然不同, 其识别精度随时间推移而增加。HDM数据的动作较短, 动作进程为50%时识别准确率已经很高。对于动态编程方法执行的匹配过程来说这是一个重要结论, 短动作能几乎完全匹配, 导致类似的极高的得分。

3.4 讨论参数设定

与其他动作识别方法类似, 本文方法取决于两个参数:两个姿势间的距离临界值ε (式 (1) ) 和动作的假设数, 影响结果如图5所示。

第一个参数ε是距离临界值, 决定了典型姿势 (代表) 的数量。该参数直接影响了识别进程的计算时间, 如图5。后者表明本文方法是总是实时的, 除了ε的取值小于1 mm。可是, 1 mm的距离临界值太小, 导致太多的代表数, 例如在TUM训练集中, 其代表数为26 046。此外, 动态捕捉数据的准确度大致为几厘米[6]。本文对所有测试取ε为20 mm, 既超过了数据误差, 又确保识别进程总是实时的。例如, ε为20 mm, 对TUM数据集, 有5 799个代表。从后者选取一个特定动作, 例如序列0-2, 共有957个姿势, 识别进程花费12.075 6 s, 不到39 s长度序列的1/3。

第二个重要参数是每个动作的假定数量。距离临界值用于确定两个直方图是否不同, 影响了一个动作的假定数。使用“行走”实验来研究该参数的影响, 选用“行走”是因为它比较短且是多变的, 对假设分割具有高可能性。结果发现, 当距离阈值低于0.5时, 假定数仍然很高且不变。相反, 距离阈值超过0.5时, 假定数快速减小。因此, 距离阈值取值应在0.5~0.9, 取决于所需的粒度级别。本文中对所有测试, 该参数设为0.5, 以保持大部分类内变化。

4 结束语

提出了一种持续行为识别的新技术, 采用一种新的直方图表示法识别动作捕捉数据中的姿势流, 相比大多数现有的方法, 就所需空间和计算时间来说, 使用直方图可以使本文的解决方案更为有效。提出将经典直方图拓展到积分直方图, 并且运用实例模式作为一种学习方法, 积分直方图和实例模式的结合应用便于扩展训练数据集, 甚至可在识别过程中进行。这种持续识别方法开辟了动作识别领域新的可能性, 特别是在人机交互新的应用方面, 用户可以通过运行时的新姿态自由地扩展其应用程序。针对简单设置下的人类典型行为, 诸如走、跑、跳等等, 基于不同数据集进行了广泛的测试, 验证了本文的方法。结果表明, 与很多已知的先进的方法相比, 本文的方法针对四个不同的数据集取得了更好的识别率。当三维动态捕捉数据有效时, 基于多假设范例的方法是最适用的, 因为其更准确、更具时效性。

未来工作将致力于将该方法向多用户的语义法延伸, 通过每个用户动作的交叉验证, 提高系统的动作识别能力。

摘要：针对现有持续人体动作识别算法实时性不高的问题, 提出了一种基于动态时间规整 (DTW) 积分直方图的动态捕捉方法。首先, 利用积分直方图对原始动作进行分类;然后, 聚类各种时空姿态建立动作的统计表示, 并采用巴氏距离测量两个直方图的相似性;最后, 根据动态时间规整方法设计了动态程序识别算法。通过大型数据集的测试以及与几种最新方法的比较证明了方法的高效性, 即使在数据库包含噪声和相似动作的情况下, 方法仍然取得了很好的识别效果。

【动作时间】推荐阅读：

动作模式07-21

动作要素05-14

动作保护05-18

误动作06-04

动作性06-12

动作分解06-15

动作设计06-28

武术动作07-13

动作发展08-02

基本动作08-21

>> 查看更多相关文档