在线特征选择(共8篇)
在线特征选择 篇1
0 引言
随着智能电网的发展与电网自动化程度的提高, 电力系统运行与控制中数据来源十分广泛, 有来自电气信息采集系统 ( CIS ) 、广域测量系统 ( WAMS) 和能量管理系统 ( EMS) 等电网内部数据, 也有来自气象信息系统、地理信息系统 ( GIS) 等电网外部数据[1]。这些电力系统运行与控制中产生数据有如下特点: 1数据规模越来越大, 数据洪流由传统意义上的GB上升到TB, PB水平; 2数据类型丰富, 包含结构化、半结构化和非结构化的数据; 3数据快速产生, 从而数据处理需要达到快速、实时的要求; 4数据的价值密度低, 由于数据规模大、类型多、产生速率快, 对发电企业、电网公司和用户有着巨大的潜在价值, 但价值密度却不高。不难发现, 电力系统运行与控制中产生的数据具有信息通信技术 ( ICT) 行业大数据典型的“4V”特征, 即规模性 ( volume) , 多样性 ( variety) , 高速性 ( velocity) 和价值性 ( value) [2], 这些数据中蕴含着复杂的相关性, 传统数据处理技术在数据存储、查询和分析等方面遇到瓶颈, 所以亟须研究电力系统大数据环境下的数据挖掘与处理技术[3,4]。
随着交直流电网的快速发展以及可再生能源的不断接入, 大电网运行方式时变性和复杂性日益增强, 其安全运行的特征和规律越来越难以把握, 极大地增加了电网运行风险和控制难度。近些年来国内外一系列的电网安全运行事故[5,6]都说明: 电网运行人员要依托电网安全稳定分析技术[7,8,9], 充分掌握电网安全运行的特征和规律, 迅速、精确地明晰电网薄弱点[10], 才能避免电网运行事故的发生。文献中有利用相量测量单元 ( PMU) 和故障录波器 ( DFR) 等实际量测大数据[11,12], 分析电力系统安全稳定问题和故障原因; 而本文关注到电力系统中海量的计算资源, 故可以利用电网安全稳定分析中的仿真大数据, 采用大数据机器学习与数据挖掘的方法, 在线挖掘出电网运行的关键安全特征。
特征选择和特征抽取是典型的两种数据降维技术。特征选择将原始的高维特征空间, 通过某种标准筛选出一个最优或最有效的特征子集, 剔除冗余特征, 从而达到降低维数的目标。而特征抽取是将原始的高维特征空间, 通过特定的变换投影到数据特征相对容易表达的低维特征空间[13,14]。在电力系统运行与分析中, 特征选择方法更为广泛接受。一方面, 由于量测和仿真数据规模较大, 维数较高, 特征选择方法计算复杂度相对较低; 另一方面, 特征选择方法在原有特征空间中进行属性筛选, 结果更加直观, 更易被电网运行人员所接受。
近些年来, 关于特征选择的研究主要集中于信息技术与统计学领域, 并在文本识别、人脸识别、生物学等领域取得了突破性的应用, 但特征选择方法在电力系统领域的研究与应用较少。2000 年后, 清华大学电机系针对电力系统安全运行知识自动发现方法进行了深入地研究, 展望了未来电网调度中心可以利用自动学习技术对电网进行智能调度[15], 在此基础上提出在线指导电网安全运行的精细规则这一概念[16], 并对其中的关键技术, 包括安全特征选择方法进行了细致的研究[17,18,19]。相对于传统的专家制定离线运行规则方式, 精细规则能更好地适应复杂多变的电网运行方式[20,21]。
然而随着电网规模扩大和间歇式新能源接入, 电网运行数据规模不断增长。传统的特征选择算法不再适应新的需求, 会存在大数据环境下的“维数灾难”问题: 第一, 在特征选择过程中, 样本数量相对属性数量是非常稀疏的, 单纯通过提高样本数量来提升特征选择方法性能的方法是不经济的, 容易造成算法的准确性降低, 计算时间显著增长, 算法的稳定性下降等问题。第二, 由于大规模电网运行数据的数据量庞大, 对于单台机器来说无论是存储还是计算都存在问题。“分布式”理念是解决这一问题的关键, 所以亟须建立一种分布式的特征选择方法来解决上述问题。通常将属性分成不同的组, 将不同组的属性分布到不同的计算节点上进行计算, 最后将结果进行整合, 提高计算效率, 以更好适应高维数据[22,23]。但目前的文献中特征选择方法一方面没有具体描述分组的原则, 另一方面也没有针对电力系统的设计与应用。
本文结合电力系统实际, 提出了一种基于电网运行大数据的在线分布式安全特征选择方法。首先, 依据本文特征选择任务的特点, 设计单个计算节点上特征选择方法。第二, 由于输电网潮流有功无功解耦, 电力系统运行调度时采用分层分区调度等解耦特点, 所以提出了一种基于电网特征量相关性分组的分布式特征选择方法。最后, 将这一特征选择方法应用于IEEE 9 节点系统和广东实际省网系统中, 说明该算法准确性和计算速度方面的优势, 且算法具有良好的稳定性。
不难发现在引入“大数据”和“分布式”理念后, 能更加合理地利用计算资源, 缓解电力系统运行大数据中“维数灾难”问题, 迅速、精确地挖掘出电网运行的薄弱点, 帮助电网运行人员快速、准确、定量地把握电网安全运行特征, 避免电网运行事故的发生。
1 基于电网运行大数据的分布式在线安全特征选择的框架
本文提出基于电网运行大数据的在线分布式安全特征选择的框架如图1 所示。
首先, 从EMS中获取电网在线运行状态, 包括获取电网的实时拓扑结构与潮流分布。
第二, 通过在线关键断面自动发现模块[19], 实时发现安全裕度较小的关键断面, 它反映出电网中薄弱的环节, 其极限传输容量 ( total transfer capability, TTC) 是调度员需要重点关注的。本文采用连续潮流法计算断面极限传输容量, 其中在计算每一步潮流增长时, 均考虑了N - 1 静态安全校核和N - 1 暂态安全校核[24]。安全特征选择的目的是筛选出影响关键断面极限传输容量的关键因素。
第三, 利用蒙特卡洛方法对电网的运行方式进行在线分布式海量样本仿真, 形成海量的随机电网仿真样本。每个随机电网仿真样本包括每一个随机的电网运行方式以及该运行方式下各个关键断面的极限传输容量。形成海量随机电网仿真样本库的过程, 可以分布在不同的计算节点上进行, 从而节约时间、提高效率。
第四, 在海量仿真样本库的基础上, 进行在线分布式安全特征选择。影响在线关键断面极限传输容量的首要因素是网架结构, 其次是功率分布。故在计算关键断面极限传输容量时, 每一步潮流增长均考虑了N - 1 安全校核, 即该极限传输容量保证任一独立元件发生故障切除, 这一网架结构变化后, 电力系统的稳定性。下文重点考虑在电网运行状态变化不大的短时间内, 从众多电网的潮流特征量 ( 例如: 发电机电压、发电机出力等) 筛选出影响关键断面极限传输容量的关键因素, 形成特征属性库。这是本文的研究重点, 也电力系统安全运行知识自动发现方法的核心。
最后, 基于特征属性库和海量仿真样本库, 利用知识发现算法, 在在线电网运行状态的小邻域内形成增量线性化的精细规则。本文认为在短时内电网运行状态不会发生剧烈变化, 利用线性化的知识表述方法能够描述非线性的电力系统在短时内的安全稳定特性, 寻求众多电网的潮流特征量与关键断面极限传输容量的数值关系, 其形式如式 ( 1) 所示:
式中: PTTC0为关键断面在线极限传输容量; PTTC为电网运行状态改变 Δx后关键断面极限传输容量的预测值; Δx1, Δx2, …, Δxm为m个影响关键断面极限传输容量的关键潮流因素的增量; b1, b2, …, bm为各关键特征对于其极限传输容量 ( TTC) 的灵敏度。该精细规则作为一种电网安全运行知识, 可以在电网运行状态变化不大的短时间内, 指导电网安全运行。分布式安全特征选择采用在线应用、在线刷新的方式。若网架结构发生了重大变化, 需要重新进行分布式安全特征选择, 发现并更新电网安全运行知识。因为这时候已经不满足, 电网运行状态变化不大这一设定。
2 关键技术
2. 1 单个计算节点上特征选择方法
特征选择基本框架图由Dash等人给出[14], 如附录A图A1 所示, 初始特征集通过一定的搜索策略形成特征子集, 依据一定的评价原则对特征子集进行评价, 并通过停止准则判断算法是否结束, 由此筛选出最优的特征子集, 最后检验特征选择结果的性能。
本文重点关注特征选择算法的核心内容: 评价函数的制定。结合电力系统安全特征选择的特点, 本文采用互信息评价, 依照R. Battiti提出雏形[25], 重新定义评价准则函数为:
式中: f为候选电网特征量; S为已选电网特征集; s为已选电网特征量。
评价准则函数J由两部分组成, 对其解释如下:第一项I ( PTTC; f) 为关键断面极限传输容量PTTC与候选电网特征量f之间的互信息, 该值越大, 说明PTTC和候选电网特征量f之间关系越紧密, 则该候选电网特征量f偏向于入选; 第二项中I ( s; f) 体现了已选电网特征量s和候选电网特征量f之间的互信息量, 求和的值越大, 说明已选电网特征集S和候选电网特征量f之间的关系越紧密, 候选电网特征量f较为冗余, 则该候选电网特征量f偏向于不入选, 通常情况下 η∈ ( 0, 1) 。
因此, 该评价函数能够筛选出与关键断面极限传输容量PTTC联系紧密, 且已选电网特征量之间相对独立的属性集合, 使得特征选择结果的可解释性强、冗余程度低。
2. 2 分布式特征选择方法
初始电网特征集INP是描述电网运行状况的电网特征量inpl组成的一个集合:
式中: inpl ( l = 1, 2, …, n) 为电网的潮流特征量, 如发电机电压、发电机出力等。每一个电网特征量inpl是一个m维向量, 描述了m种不同场景下的电网特征。
正如引言中的分析, 电网运行数据的数据量庞大, 传统的集中式特征选择方法存在“维数灾难”, 所以本文设计一种面向电力系统的分布式特征选择方法, 算法的过程如下。
步骤1: 依据初始电网特征集的维度n, 将其分成K组, 形成初始电网特征子集INP1, INP2, …, INPK。
步骤2: 在不同的计算节点上, 对每一个初始电网特征子集INPi分布式地进行2. 1 节中的特征选择, 形成K个特征属性子集S1, S2, …, SK。
步骤3: 在协调节点上, 将特征属性子集Si合并形成SF= S1∪S2∪…∪SK, 对SF进行2. 1 节中的特征选择, 得到最终的特征选择结果SR。
以上分布式特征选择方法的优势在于步骤2中, 将初始电网特征集分成K组, 一方面将其维度降至原来的1 /K, 从而在很大程度上解决了特征选择算法中遇到的“维数灾难”问题; 另一方面, 也适合将任务分布到不同节点上进行计算。
2. 3 基于电网特征量相关性分组的思想
由于单个计算节点上特征选择方法并不完全有效, 所以分组数K的大小和分组情况INPi ( i =1, 2, …, K) 会对分布式特征选择结果的准确性和稳定性产生一定的影响。为了充分考虑电网特征量之间的相关性, 同时避免协调节点上计算量过大, 在分组时尽量保证同一组内的电网特征量相关性较大, 不同分组间的电网特征量相关性较小 ( 原因见附录说明) , 设计了如下分组算法:
首先, 定义电网特征量之间相关性。本文采用皮尔逊积矩相关系数[26]的绝对值来衡量电网特征量inpl与inpk的相关性R ( inpl, inpk) 为:
式中: Cov ( inpl, inpk) 为电网特征量inpl和inpk之间的协方差, 计算公式为:
式中:为m种不同场景下电网特征量inpl的均值。
协方差的物理意义体现在两个方面: 1电网特征量inpl和inpk之间的协方差绝对值越大, 说明两者之间的关系越紧密; 2电网特征量inpl和inpk之间的协方差为正值, 则说明两者之间是正相关的, 反之则为负相关。所以电网特征量的相关性可从电网特征量的协方差中得到, 式 ( 4) 所示的相关系数R是两个电网特征量协方差的绝对值除以两个电网特征量的标准差。相关系数R介于0 ~ 1 之间, R越大, 说明相关性越强。相关系数R仅是一个比率系数, 并不是等单位量度, 所以相关系数只能比较大小, 不能进行数值运算。
其次, 定义电网特征子集之间的相关度。这个问题类似于聚类分析中, 已知个体间距离的定义, 如何定义类间距离的问题, 该问题通常是对不同的类间距离定义进行尝试, 择优选取。借鉴聚类分析中类间距离定义的思想, 一方面考虑到相关系数R不能进行数值运算, 另一方面结合实际尝试经验, 认为电网特征子集之间的相关度可采用最小相关度与最大相关度, 这两种相关度在一般情况下均有较好的分组结果, 定义如下。
最小相关度:
最大相关度:
故基于电网特征量的相关性分组算法如下。
步骤1: 初始化电网特征子集; 依据初始电网特征集的维度n, 将每个电网特征量单独作为一个电网特征子集INP1, INP2, …, INPn。
步骤2: 求取每个电网特征子集之间的相关度R ( INPi, INPj) 。
步骤3: 合并相关度最大的电网特征子集; 若满足终止条件, 则停止; 否则跳回步骤2; 其中, 终止条件为任意电网特征子集之间的相关度达最小阈值, 即满足式 ( 8) 。
故基于电网特征量相关性分组的分布式特征选择方法流程如图2 所示。
为了充分利用计算能力, 要根据计算资源, 选取适合的分组数, 通常认为分组数应该取成计算节点数量的整数倍。同时, 考虑到电网运行数据中, 相邻时间运行状态下初始电网特征集变化不会太大, 对上一次分组的结果微调后, 可以在邻近时刻的分布式特征选择中继续使用。
2.4评价指标
首先定义计算结果精度的评价指标, 为通用的相对精度P, 表达式为:
式中:为电网运行状态改变后关键断面极限传输容量的预测值。其次定义算法的并行性评价指标, 为通用的加速比S, 表达式为:
式中: t为单机运行的时间; T为集群运行的时间。
3 算例分析
本文针对IEEE 9 节点系统和广东实际系统进行算例分析。计算断面极限传输容量采用连续潮流法, 其中在计算每一步潮流增长时, 均考虑了N - 1静态安全校核和N - 1 暂态安全校核[24]。
3. 1 IEEE 9 节点系统算例分析
参数修改后IEEE 9 节点系统如图3 所示。
图3 中标出了系统中的节点、发电机、负荷的编号。以该算例说明基于电网特征量相关性分组的分布式特征选择方法原理, 并与随机均分式分组方法和集中式方法进行对比。
该系统初始的运行方式如表1 和表2 所示。算例中数据为标幺值, 其中功率基值为100 MW, 并假设电网中所有输电线热稳定极限值为100 MW。
在该运行方式下, 图3 中红色虚线所割的输电通道为系统重载的输电通道, 通道的负载率较高, 安全裕度较小, 它反映了电网中薄弱的环节, 是调度员需要重点关注的关键断面。
利用蒙特卡洛法生成海量仿真样本, 控制各个发电机有功出力的85% ~ 115% 、机端电压的95% ~ 105% , 形成2 000 个仿真样本, 80% 的仿真样本用于分布式特征选择和生成精细规则, 20% 的仿真样本用于检验。
本文着重关注在电网运行状态变化不大的短时间内, 从众多电网的潮流特征量 ( 例如发电机电压、发电机出力等) 筛选出影响关键断面极限传输容量的关键因素, 所以选取发电机有功出力PG1—PG3, 各母线电压UG1—UG3及UL1—UL3作为初始电网特征集 ( 输入属性集) 。首先进行基于电网特征量的相关性分组。为了说明分布式特征选择方法的原理, 假设存在两个分布计算节点。根据计算节点的计算资源, 选取适合的分组数, 以充分利用计算能力, 通常认为分组数应该取成计算节点数量的整数倍。图4的横坐标表示各个电网特征量, 纵坐标表示分组 ( 电网特征子集) 之间的相关度, 其中分组之间的相关度采用最小相关度。在分组数从最大分组数不断凝聚到一个分组的过程中, 相关度最大的分组首先合并, 反之最后合并, 取阈值条件 ξmin= 0. 20 时, 分成两组如图4中虚线所示。
类似, 图5 分组之间的相关度采用最大相关度, 取 ξmax= 0. 30 时, 也分成两组如图5 虚线所示。
从图4 和图5 中均可以看出: 1由于有功无功解耦特性, 使得节点电压与发电机有功出力之间的相关性并不高; 2全网电压之间的相关性较大, 特别是发电机节点与负荷节点之间电压的联系较为紧密, 所以两者之间的相关性均较高, 而发电机节点之间的电压相对独立; 3与全网电压之间相关性相比, 各发电机有功出力之间的相关性较低, 这是因为有功出力之间相对独立, 仅需要满足P发电= P负荷+P网损这一个相对较弱的耦合。对比图4 和图5 可以看出: 两种相关度定义下, 属性分组情况相同, 可见对电网特征子集之间相关度的定义并不敏感。所以分组后, 形成电网特征子集INP1为UG1—UG3, UL1—UL3, 电网特征子集INP2为PG1—PG3。
接着进行分布式特征选择。将电网特征子集INP1和INP2分布到计算节点上进行分组特征选择, 得到特征属性子集S1为UG1, UL2, 特征属性子集S2为PG1, PG2。例如, 对于特征属性子集S1物理解释是:图3 中关键断面的有功潮流从左下的发电区流向右上的负荷区, 发电区与负荷区电压能在很大程度上决定系统的暂态稳定性, 提升发电区电压UL2和负荷区电压UG1有助于提升算例系统的暂态稳定性, 从而提升关键断面极限传输容量, 所以节点电压UG1, UL2对关键断面极限传输容量PTTC的影响较大。
然后将特征属性子集Si合并为SF, 在协调节点上进行特征选择, 得到分布式特征选择的最终结果SR为PG1, PG2, UL2, 其过程如附录A图A2 所示。类似的, 随机均分式与集中式特征选择方法的过程如附录A图A2 所示。
最后, 得到在线电网运行状态的小邻域内形成增量线性化的精细规则, 并用测试集数据检验其精度。将基于相关属性分组的分布式特征选择方法、集中式特征选择方法和随机均分式特征选择方法作对比, 得到各个方法特征选择结果与精细规则形式、精度和计算时间如表3 所示。分布式特征选择方法与集中式特征选择方法的计算结果完全相同, 而随机均分式特征选择方法筛选出的特征属性与集中式方法略有不一致, 且精度略低。
由图6 可知, 分布式方法在计算节点和协调节点分别耗时0. 55 s和0. 35 s, 一共耗时0. 90 s, 小于集中式方法的耗时, 但略大于随机均分式方法的耗时。分布式算法所用的时间仅为集中式算法的71% , 即加速比为1. 40。权衡结果的精度和计算时间, 认为基于电网特征量相关性分组的分布式特征选择方法更加高效, 但由于系统规模较小, 相比于随机均分式特征选择方法的优势不明显, 因此设计了广东实际系统说明其优势。
3. 2 广东实际系统算例分析
以广东电网2013 年12 月5 日12: 00 的拓扑与潮流数据进行分析, 该时刻广东省网投运220 k V及以上电压等级的线路1 260 条, 220 k V及以上电压等级的厂站554 个。在该运行方式下, 附录A图A3中蓝色粗实线所割的输电通道“HH线+ LK甲线+LK乙线”为系统重载的输电通道, 通道的负载率较高, 安全裕度较小, 它反映了电网中薄弱的环节, 是调度员需要重点关注的关键断面。
利用蒙特卡洛法生成海量仿真样本, 控制各个发电机有功出力的85% ~ 115% , 机端电压的95% ~ 105% , 形成20 000 个仿真样本, 80% 的仿真样本用于分布式特征选择和生成精细规则, 20% 的仿真样本用于检验。
本文着重关注在电网运行状态变化不大的短时间内, 从众多电网的潮流特征量中筛选出影响关键断面极限传输容量的关键因素, 所以选取发电机有功出力、500 k V母线电压共162 个属性作为初始电网特征集 ( 输入属性集) 。首先进行基于电网特征量的相关性分组, 电网特征子集之间相关度采用最小相关度, 根据计算节点的计算资源, 选取适合的分组数, 以充分利用计算能力, 通常认为分组数应该取成计算节点数量的整数倍。为了说明分布式特征选择方法的原理, 认为存在6 个分布计算节点。此处, 取 ξmin= 0. 15 时, 属性分组情况如附录A图A4 所示。
接着进行分布式特征选择, 主要特征量所在位置用蓝色标出; 通过交叉检验得出分布式算法具有很好的稳定性; 最后, 得到在线电网运行状态的小邻域内形成增量线性化的精细规则, 并用测试集数据检验其精度。
将基于电网特征量相关性分组的分布式特征选择方法、集中式特征选择方法和随机均分式特征选择方法作对比, 得到各个方法特征选择结果与精细规则形式、精度和计算时间如表4 所示。可以看出, 分布式特征选择算法与集中式特征选择算法筛选出的特征属性大致相同, 分布式算法得到的精细规则的精度略低于集中式算法但在工程可接受范围内, 并且分布式算法所用的时间仅为集中式算法的36% , 即加速比为2. 8。虽然随机均分式特征选择算法所用时间最少, 但与集中式特征选择算法相比, 筛选出的特征属性几乎都不同; 由此可见, 随机均分式特征选择算法由于没有考虑分组时电网特征量的相关性, 该算法所得到的特征选择结果不可信。
实际运行中, 需要更细致地考虑在线关键断面的极限传输容量的影响因素, 应该扩大初始电网特征集 ( 输入属性集) 。除了上述初始电网特征量, 将220 k V母线电压作为初始电网特征集的一部分, 此时初始电网特征量个数为752 个, 为了使得样本范围足够广, 形成10 万个仿真样本, 此时一个关键断面对应的数据量约为0. 6 GB, 一年约有400 ~500 TB的原始数据。一方面, 考虑到计算过程中数据膨胀的问题, 无法在单个计算节点上完成集中式特征选择; 另一方面, 在单个计算节点上计算时间过长, 也无法满足在线计算的要求, 所以必须采用分布式特征选择的方法, 形成的精细规则形式如式 ( 11) 所示, 精度为99. 57% , 计算时间为448. 7 s。
综上所述, 基于电网特征量相关性分组的分布式特征选择算法在精度上略低于集中式特征选择算法, 但在工程可接受范围内, 并且能有效地节约计算时间、合理利用存储空间。在实际运行中, 并不能保证计算节点和协调节点每一时刻都正常运行, 所以计算节点和协调节点常常配备1 至2 个热备用节点, 保证系统的正常运行。
4 结语
随着智能电网的发展, 电力系统大数据挖掘与处理是一个亟须研究的方向。本文依据电力系统解耦特点, 提出了基于电网特征量相关性分组、适应于电网运行大数据的在线分布式安全特征选择方法。对比集中式算法和随机均分式算法, 本文方法准确性高、耗时少、稳定性好。本文分布式特征选择方法能在一定程度上缓解电力系统运行大数据中“维数灾难”问题, 迅速、精确地挖掘出电网运行的薄弱点, 帮助电网运行人员快速、准确、定量地把握电网安全运行特征, 避免电网运行事故的发生。
摘要:简述大数据环境下, 电网安全特征选择的现状与问题。提出了一种基于电网特征量相关性分组、适应于电网运行大数据的在线分布式安全特征选择方法, 该方法能在线挖掘出关键的电网安全运行特征。首先阐述了单个计算节点上电网安全特征选择方法, 接着提出了基于电网特征量分组的分布式安全特征选择方法;由于电网特征量分组情况会对特征选择结果产生较大影响, 故提出了基于电网特征量相关性分组的策略, 尽量使得同一组内的电网特征量相关性较大, 不同分组间的电网特征量相关性较小。IEEE 9节点系统和广东实际省网系统算例验证了该方法的实用性和有效性, 表明了该方法能够快速挖掘出电网运行的薄弱点, 帮助电网运行人员准确地把握电网安全运行特征, 同时也对比了该方法相比传统方法在计算准确性和计算速度方面的优势。
关键词:热稳定安全域,多维空间,多约束,分段线性近似
在线特征选择 篇2
美图秀秀网页版地址:xiuxiu.web.meitu.com
一、方便:不必安装软件,打开网页就P图
用传统的图像处理软件P图,首先得下载安装软件,比较麻烦,而美图秀秀网页版打破了这一传统模式,不必下载安装任何软件和插件,只要运行浏览器,打开美图秀秀网页版页面(xiuxiu.web.meitu.com)就可以在线P图,不但可以上传本地硬盘中的图片,还可以打开网络中的图片进行处理,非常方便(如图1)。
图1 美图秀秀网页版可以打开网络图片
二、强大:操作简单方便,功能齐全新颖
网络应用再方便,如果功能不够强大,就没有实用价值,一切都将化作浮云随风飘散。美图秀秀网页版绝不是浮云,不但使用方便,而且功能十分强大,足以和一些图像处理软件相媲美。
1、基础调整很便捷
打开美图秀秀网页版“编辑”页面,不仅可以调整图片的亮度、对比度、饱和度、清晰度和色调,还可以对图片进行旋转、裁剪、修改尺寸、一键美化等操作,调整图片方便快捷(如图2)。
图2 基础调整方便快捷
2、图片美化很给力
切换到“美化”页面,美图秀秀网页版为大家提供了丰富的P图工具,特效、美容、饰品、文字、边框、场景应有尽有,海量精选素材每天更新,图片美化能力一点儿也不比传统图片处理软件逊色,而且操作非常简单,没有图像处理经验的新手也可以很快上手,点点鼠标就可以制作出专业级的精美图片,图片美化相当给力(如图3),
图3 图片美化很给力
3、保存方式你做主,一键分享到微博
用美图秀秀处理好图片,可以将图片保存到本地硬盘,也可以一键分享到 。单击“保存和分享”按钮,切换到“保存和分享”页面,单击“保存到本地”,可以将处理好的图片保存到本地硬盘,单击“分享到新浪”按钮,则可以将处理好的图片一键分享到 ,保存和分享方式你做主(如图4)。
图4 分享到
高效:打开图片和处理图片的速度快
看到这里,也许有些朋友会提出疑问,美图秀秀网页版处理图片的速度如何呢?如果等到花儿都谢了才能完成图片处理,那它还是浮云一片,不值得留恋。
为了解开大家心中的疑惑,笔者在2MB带宽的网络环境中,采用为同一张图片添加同一种特效的方式,对美图秀秀网页版和美图秀秀软件版打开图片的速度和生成特效的速度进行了对比测试。美图秀秀网页版打开图片的速度让笔者非常震惊,打开本地图片的速度几乎和美图秀秀软件版一样快,几乎感觉不到停顿,用时在0.5秒以内,打开网络图片的速度也很快。处理图片的速度软件版比网页版稍快,网页版用时约为4秒,软件版用时大约2.5秒,这种差距大家应该可以接受。
图5 网页版和软件版速度对比
小提示:打开图片和处理图片的速度受电脑配置和网络环境的影响,特别是打开网络图片的速度,与网络环境关系密切,以上测试数据只能做为参考。
在线特征选择 篇3
关键词:COD,在线监测,故障检测,特征选择,鲁棒性
随着我国工业化程度的提高和产业结构的转型,对环保的监控越来越严格,许多在线监测仪器得到推广和应用。然而,此类仪器受到环境变量和自身耦合变量的双重干扰,再加上在线类监测仪器工程上涉及到技术集成、操作性、安全冗余及成本控制等限制,该类仪器( 如化学需氧量、氨氮、烟气、乳酸及微生物等在线监测设备) 在控制精度和故障排查上不甚理想。对仪器的故障诊断,多凭借工程经验。因此,对仪器设备开发的工程经验、质量控制、开发效率以及工程优化问题的研究将更有迫切性和现实需要,其中,数据特征挖掘对质量控制和设备开发效率的提高意义重大。
1影响COD在线监测仪性能的因素
采用特征选择和过滤匹配的方法快速分析仪器的故障原因[1],先要建立变量的初始特征集,这样就必须明确可能引起故障的输入变量对应的节点或分类节点,再用COD在线监测仪进行的故障诊断研究来引出,其分析思路也可用于其他仪器系统。
1. 1仪器的工作原理和过程
COD在线监测仪是众多环保监控仪器中的一种,其核心测试方法有重铬酸盐法、高锰酸钾法、库仑法、臭氧法、电极法及羟基法等[2],其中重铬酸盐和高锰酸钾法是国标方法[3],用得较为普遍。
根据Lamber-Beer定律(E为溶质对波长固定的光的吸收系数) ,即在光程L和入射光波长固定的条件下,均匀透明溶质浓度与吸光度正相关。根据此原理,用分光光度计测出通过溶液的吸收情况,就能准确换算出所求物质( 氧化剂) 的浓度,进而测出还原性物质的含量。
图1是某公司的COD在线监测仪后侧图。 整个测试过程按采样、定容、消解、比色的过程串联进行,工作前有试管清洗、系统复位及光度计调零等操作,采用重铬酸盐法消解,光度计法比色。 监测仪的主要构件包括试剂瓶、导管、继电器、蠕动泵、消解池、加热棒、比色池、光度计、PLC、嵌入式显示和控制组件。
1. 2故障因素( 初始特征集) 分析
任何影响仪器工况的因素都可以作为输入变量特征集的元素,但是,为了降低特征子集之间的相关性,理清故障因素是关键。该仪器的测试范围是5 ~ 1 000mg /L,而数据多分布在200mg /L以内,因此可以说,任何节点的故障振动或漂移都可能影响测试结果的稳定性,这给逐点排查仪器故障带来了麻烦。假设样本数据不存在大量干扰( 如Cl-) ,可从3个主要过程来分析故障因素。
定容阶段。主要是借助于蠕动泵的两次固定时间内的正反转抽取样本到消解池中。蠕动泵的不稳定,可能导致无法准确定容,影响实验结果, 此类故障可以通过肉眼观察发现; 放置在试管中的吸管由于端子不规则,或电磁阀的吸附,都会造成不确定的残留试剂。
消解阶段。从消解条件考虑,即催化剂和温度。难点在于温度的控制,主要是加热器和温控仪部分是可能的故障点,数据所反映出的明显特征就是测试结果普遍偏低。
采样阶段。涉及到光度计部分、比色皿部分和硬件电路部分,如光源的“单色性”太差、检测器漂移及比色皿中有大量气泡或不均匀等。从朗伯比尔定律的前提条件入手去分析采样阶段的可能故障点是完备的。
2故障诊断数据挖掘模型
2. 1双特征变量选择和匹配
根据评价准则,特征选择可以分为过滤器、封装器和嵌入式3类基本模型[4],在此按过滤器模型进行特征选择,需要首先对初始特征集进行定义。
按照仪器的动作过程逐级分类,可以使特征间的分类间距最大化,减少无效特征或冗余特征, 并且由于是按流程操作的,所以在发生故障的条件下,采样、定容、消解、比色之间引起故障的相关系数为零。图2所示为双特征变量的匹配流程, 首先要理清所有引起仪器故障的外部变量和内部变量,并注意变量之间是否存在关联性,随后把变量属性符号化得到特征子集,然后可以用矩阵的形式表示出特征。对于数据特征的挖掘,除了常见的统计特征,还应结合仪器的自身特点挖掘出与之对应的数据特性,如数据稳定的滞后效应、数据偏离均值的正负值及最值分散度等。
图2双特征变量的匹配流程
2. 2故障变量的特征选择
仪器故障的完备事件容易找到,如温度、湿度、光度计电源及加热棒等。若随意划分特征子集,将不利于故障的快速映射。如将温度看成是一个特征元素或集合,而温度对多个构件和环节都会产生影响,和数据特征进行匹配时,无法建立有说服力的联系。因此,特征集合的搜索和分类很关键。
系统的故障树如图3所示,该测试仪故障分为3个阶段,分别对应不同的组件,A、B、C分别为定容、消解和采样阶段的故障源。其中,A1为残留物过多故障,A2为定时和继电误差故障,A3为原样品允许的浓度范围越界故障。A11、A12、A13和A14代表的故障节点分别为电磁阀、吸管、导管和蠕动泵。由于继电故障就是软件或继电器的错误,所以A2没有分支故障节点。A31、A32和A33表示原样品的化学稳定性、杂质干扰( 其他还原性物质参与反应) 和化合物颜色的相干性。B1、B2分别表示消解过程的温度控制环节和催化剂环节。C1、C2、C3分别表示采样时涉及到的光度计、 比色皿中的液体和采样硬件电路3个节点。而光度计又会牵涉到光源和检测器环节,所以分别用C11、 C12表示。 故障分类矩阵为
图3系统的故障树
2. 3实验数据特征选择和特征选择算法
有效提高特征选择算法稳定性的方法主要有基于经典特征选择算法的集成特征选择、基于样本加权的算法[5]和特征组群的方法。数据特征这部分包括如何进行选择数据和对数据的特征挖掘。从图4所示的测试数据可以看出,50mg /L的标样测试数据表明该仪器工作不正常,但并不一定用此组数据更有利于反映仪器固有的问题,因为有可能是故障点的次生干扰和故障本身干扰的结果。因此,在仪器稳定运行的情况下,需要选择合适的测试数据作为评估的原始特征集。假设关注以下几类数据特征: 均值、方差、数据稳定的滞后效应、数据偏离均值的正负值、最值分散度。理论上5个特征有31种数据组合。接下来就要采用各种手段建立数据特征集合与变量特征集的联系。
图4故障仪器的测试数据(50mg/L标样)
3实验数据分析和验证
3. 1数据的选取
对同一仪器的数天数据进行采样分析,低( 50mg /L) 、高( 200mg /L) 浓度标样测试值的分布分别如图5、6所示。低浓度测试结果表明,均值偏离大,且测试稳定性较差。高浓度的测试结果均值接近标样,但少数采样值漂移比较大,这说明仪器不存在原理性故障,系统整体运行比较稳定, 受环境的干扰或稳定运行的条件不足。在做进一步的数据特征挖掘时,需要尽可能排除误差因素的干扰,突显故障因素对数据的作用,因此选择高浓度采样数据进一步分析。
3. 2标样测试
图7是温度基本恒定或变化趋势相同的条件下,同一仪器对不同标样的测试结果,可以断定: 几乎首次采样的结果都会比标样值低。可以通过此特征和相关经验,锁定几种可能故障,优先用其他数据特征验证这些故障。图8是温度基本恒定( 8℃) ,不同仪器对同一标样的测试结果,依然有首次测量低于标样值的特征。
3. 3数据特征分析和结论
表1是200mg /L( 高浓度) 的标样测试结果, 其均值和方差分别为199. 87和39. 07,均值接近200mg / L,方差较大,说明数据波动较明显。图9为测试数据的波动和均值特质,可以看出,测试数据几乎是负波动,即在中心线( CL) 以下波动,且数据存在偶发的不稳定现象。综上所述,可以得出如下结论:
a. 系统不存在原理性故障,一天内测量仪器稳定性较差;
b. 仪器鲁棒性能较差;
c. 仪器系统并没有完全得到响应;
d. 系统稳定运行前需要1 ~ 3个测试周期。
图9测试数据的波动和均值特征
按照构建模型的思路去分析和排查,很快就找到了该仪器的故障原因,即加热棒没能完全包裹整个液位面( 图10) ,由于热传递和热损耗的影响,使消解池的上液位面的液体不能持续10min保持175℃,从而导致消解不完全。
4结论
4. 1原始数据选取根据经验和特征选择的要求, 才能尽可能减少误差因素,突显故障因素,对于该仪器而言,选择高浓度的标样更有利于仪器分析。
4.2按仪器操作流程对故障特征变量进行划分,有利于增大类别距离,减少特征冗余;数据特征和故障变量的匹配可以根据经验来减少算法。
在线特征选择 篇4
关键词:在线学习,视频人脸识别,局部特征,分簇,姿态变化,面部遮挡
0 引言
由于在安全领域具有重要用途, 人脸是用于个体识别最具潜力的生物特征, 因为使用廉价的摄像机设备就可以连续地获取人脸信息。然而, 人脸的识别面临着巨大的挑战, 因为脸部生物特征的独特性相对较低[1], 而且在采集过程中存在许多不受控制的因素, 包括光照、姿态、脸部表情、脸部纹饰和遮挡等。
最初的人脸识别研究是基于匹配单个图像[2,3], 然而, 这类识别技术不能解决上述问题。最近, 许多研究小组探索了3D脸部扫描识别技术[4,5,6], 但其目前主要限制在于3D扫描环节, 相比于照相机, 3D扫描仪更昂贵, 且分辨率较低, 采样时间较慢等缺点。
过去几年中, 许多学者都对基于视频的人脸识别技术进行了研究, 因为摄像机能提供的信息比静态照相机更多, 而且, 个体运动规律有助于人脸识别[7]。早期视频人脸识别算法是基于帧原理, 这些算法训练匹配视频的各个帧, 使用平均准则作出决策, 但这些技术不能充分利用时空信息。因此, 利用匹配视频序列进行识别成为更有前景的技术, 因为其不仅包含单个帧中的空间信息, 还对视频和视频数据库之间的时间相干性作了分析。基于视频的人脸识别算法有三种学习模型:离线批处理学习、在线学习和混合学习。离线批处理学习中仅训练一次分类器[8], 是利用预先录制的视频进行学习, 其没有反馈机制, 而且系统数据库得不到更新。在线学习中, 系统是在线实时训练, 但仍然需要手工对身份标定[6]。混合学习方法是以批处理模式离线学习通用的 (或特定) 人脸模型, 同时于在线识别过程中连续更新人脸数据库[8]。
本文提出一种智能的基于视频的人脸识别算法, 进行无监督在线学习。学习阶段自动聚集输入视频序列的帧, 学习过程中提供注册状态的实时反馈。识别过程中, 将未知身份的查询帧的局部特征与簇中具有代表性的特征匹配, 使用复合帧相似度度量法给出最终决策。实验结果验证了本文算法的有效性。
1 相关研究
大部分基于视频的人脸识别算法是检测完整的人脸来提取全局特征, 而全局特征受注册误差、遮挡和姿态变化的影响很大[9]。局部特征已经被证明其在图像和3D人脸识别算法中的优越性, 但是, 局部特征并没有得到广泛应用, 因为局部特征会引入另一个维度而增加复杂度。然而局部特征对遮挡和姿态变化等因素有较好的鲁棒性。
文献[10]使用了一组基于LBP (局部二值模式) 特征的扩展体 (EVLBP) 进行基于视频的人脸识别和性别识别, 训练了一个Ada Boost分类器, 用来选择EVLBP特征进行识别。然而此算法缺点是它受人脸裁剪 (尺度和位置) 和帧速率的影响很大。
文献[11]提出一种融合人脸检测和人脸识别的算法, 定义了一个映射在鼻子上的径向网格来提取特征, 利用神经网络算法进行分类, 其中特征向量提取使用对数极网格法, 同时采样鼻子内侧区域相对于外部区域更多特征, 作者认为这个特征向量对脸部表情有较好的鲁棒性。
文献[12]运用SIFT局部特征匹配算法将提取的10帧正脸关键帧与人脸库图像进行特征匹配存储匹配结果, 然后利用RANSAC算法将匹配后的图像做去除误匹配处理, 一定程度上提高了视频人脸识别率。
文献[6]提出一种基于视频的人脸识别在线流形学习算法, 并提出一种分离特征空间的方法, 使大部分人脸样本不聚集到相同的特征空间, 还使用了转换矩阵来计算从一个特征空间到另一个空间的转换概率。
上述各局部特征方法的共同点是均使用小数据库, 最多有24个注册个体和10个冒充者。与此相比, 本文算法在一个有50个注册个体和22个额外冒充者的图库上得到验证。
2 局部特征在线学习算法提出
2.1 局部特征
本文使用尺度不变特征变换 (SIFT) [12]来提取局部特征, 其优点之一是它不对特征的位置有任何限制, 可以从人脸任意点提取局部特征, 而且不需要排序。
SIFTs[12]是从图像关键点提取128维单位向量, 关键点是在高斯差函数与图像卷积中尺度空间极值上检测的。关键点必须满足几个基本条件, 包括高对比度、沿边缘定位良好和高于阈值的主曲率比。
每个关键点, 在局部梯度方向, 通过它们的幅值和圆形高斯窗口加权形成直方图。主梯度方向用于提取SIFT使其具有旋转不变性, 4×4的样本区域用于创建带有8个的向直方图形成一个128维向量。同时将向量归一化, 阈值上限设为0.2, 再重新规范化到单位长度, 这样操作使算法对光照具有鲁棒性。
2.2 无监督学习
在学习阶段, 使用文献[13]提出的算法自动检测训练视频序列中的人脸图像, 然后使用CAMSHIFT[13]自动跟踪人脸, 从每一帧裁剪人脸区域。注意CAMSHIFT不能精确定位人脸, 在位置上存在一些误差, 尤其是人脸尺度。然而此算法对这些误差具有鲁棒性, 因为它是在自动监测的关键点上提取尺度不变特征, 关键点独立于裁剪窗口的位置。将裁剪的人脸调整到150×150像素, 直方图对光照均衡规范化。对于每个规范化后的人脸, 2.2.1节中将会讨论SIFTs的计算和匹配, 匹配过程产生一个相似度矩阵, 用于聚集训练视频序列中的人脸。
2.2.1 人脸匹配
对于一个给定身份的训练视频序列, 匹配每个人脸到另一个人脸, 以便构建一个N×N的相似度矩阵 (其中N是帧数) , 因为矩阵是对称的, 所有必须执行N (N-1) /2次匹配。使用式 (1) 匹配相应的SIFT特征来确定两个人脸之间的相似度:
式中, fa和fb分别对应于人脸a和b的SIFT特征向量, 考虑匹配中有最小误差e的SIFTs对, 所以仅允许有一个最佳匹配。例如, 如果证实人脸b中的一个特征是人脸a中不止一个特征的最佳匹配, 则仅考虑有最小误差e的那个特征作为它的最佳匹配。同时使用距离约束避免两幅人脸图像中距离较远的点进行匹配。通过规范化它们的SIFT匹配对之间的平均误差e和匹配总数目m来确定两个人脸的整体相似度, 将两个度量都规范化到0到1范围内, 并使用加权规则求最终相似度:
式中, i=1, 2, …, N, we和wm是规范化平均误差珋e'和规范化匹配数目m'对应的权重, 注意珋e'i为负, m'i为正, 所以1要减去m'i, 最终相似度度量si也是负的, si值越低表示相似度越高。
2.2.2 帧分簇
上述匹配过程产生一个N×N相似度度量对称矩阵, 用于自动聚集N个帧。本实验中使用平均相似度距离的层次分簇方法, 初始化离线批处理学习中每个视频序列的簇总数为20。为了获得实时性能, 在本文后续的在线学习算法 (2.2.4节) 中簇的数目减少到10。
2.2.3 簇代表的选择
基于全局特征的算法或从预定义位置提取局部特征的算法, 一般使用平均特征作为簇的代表。然而, 本文中的局部特征是从任意关键点提取的而不是预定义位置, 因此, 使用投票方法从每个簇中选择具有代表性的局部特征。在每个簇内, 对两个人脸的所有组合进行匹配, 如果发现特征的匹配符合2.2.1节描述的人脸匹配结果要求, 则组合中的两个人脸各获得一票。选择前n个得到最大投票的特征作为簇的代表, 我们注意到, 簇中具有代表性的特征来自簇内不同人脸的不同位置 (帧) , 由此确保了关键点能够充分覆盖人脸, 并代表整个簇。
图1展示了在代表性人脸上标记出簇的代表性特征, 注意特征来自不同位置, 且大部分来自像眼睛、鼻子、嘴唇和下巴之类的重要位置。
SIFT的关键点检测过程通常会在不同帧中找到不同数目的关键点, 因此偏向匹配过程使其有较多特征的帧, 这个偏向对匹配不同视频序列的识别有重要作用。为每个簇选择固定特征的数目可以去除由于特征数目和每簇帧数造成的偏向, 在本文中, 特征的数目n固定为200。
2.2.4 在线学习
本文提出一种在线无监督学习算法, 在学习过程中实现了近实时反馈, 并能从一个输入视频帧中自动检测、跟踪、裁剪人脸, 再将裁剪得到的每个人脸与所有先前获得的人脸进行匹配, 构建一个N×N相似度矩阵。第i帧与所有 (1, 2, …, i-1) 帧进行匹配, 将每个相似度记录在相似矩阵的两个对称位置上, 匹配过程中同时为特征匹配投票, 选择簇代表。为了达到在线实时学习功能, 算法是用C++语言多线程技术实现, 同时保持N固定在100。构建出100×100的相似度矩阵之后, 对小于预定人脸数目的簇数目计数, 如果这个计数值大于阈值或簇平均的最远人脸距离低于阈值, 则学习过程结束。否则, 丢弃与各自簇平均距离最大的后m个人脸和他们的特征, 用另外m个新获得的人脸来代替, 将这些人脸与剩余人脸匹配 (彼此之间也匹配) 来更新相似度矩阵, 重新分簇。这个过程持续到满足上述两个准则为止。
学习准则是为了避免簇中人脸分布不均, 即如果一个对象在整个学习过程中始终保留, 则大部分人脸会被判定为多余的, 将会进入到一个或几个簇中[14], 如图2 (a) 所示。然而, 本文在学习过程中需尽可能多地采集人脸的不同姿态或不同表情, 在无监督学习方法中, 实现这个目的最简单的方法就是确保人脸尽可能均匀分布在簇中 (图2 (b) ) 。学习准则的两个阈值的确定需对学习方便和学习成效之间做权衡, 否则会出现两个极端。第二个准则用于检测和去除人脸裁剪不准确、运动模糊、遮挡等造成的不稳定帧。
2.3 在线识别
识别过程中, 系统能自动检测和跟踪视频序列中的人脸, 裁剪并规范化人脸区域, 然后使用2.2.1节描述的匹配算法计算人脸的SIFT特征并与数据库中所有人脸的簇代表特征进行匹配, 再将所有人脸的簇平均SIFT误差e和匹配数目m规范化到0~1范围 (式 (2) 和式 (3) ) , 最后使用式 (4) 合并。每个帧与图库匹配时, 产生一个G×C相似度矩阵, 其中G是数据库 (也称为图库) 中人脸的数目, C是每个人脸簇数目。值得注意的是, 由于每个簇代表一个不同的脸部姿态, 所以人脸的平均簇相似度与查询人脸的整体相似度会不一致。然而比较平均簇相似度与最小簇相似度性能, 最小簇相似度执行效果明显较好, 因此, 本实验中采用最小簇相似度来代表人脸身份对查询帧的整体相似度。
使用最小簇相似度规则, 留下相似度分数向量si (i=1, 2, …, G) , 包含每个人脸身份与查询帧的相似度。令sj为最佳相似度 (即最小值) , sk为下一个最佳相似度, 则查询帧匹配结果上的置信度计算如下:
置信度值的范围是0~1, 1是理想的置信度值。在基于视频的人脸识别中, 决策通常是在多个查询帧基础上执行的, 并且在最终决策合并或选择最佳帧之前使用置信度值加权帧匹配。识别过程中, 由于冒充者 (即未知人脸) 可能会表现出与图库中某个人脸较高的相似度, 但是置信度一定是较低的。所以单独使用相似度阈值来绝冒充者是不够的, 因为其平均误差和匹配数目经过了规范化 (式 (2) 和式 (3) ) , 而利用置信度作为阈值来使用, 能很好地解决这个问题。
基于视频的人脸识别是一个连续过程, 每个新的帧t匹配到数据库时, 给出了一个矢量si, 与前一个向量si (t-1) 并行级联 (其中t代表时间维度, i=1, 2, …, G是数据库身份索引) 。由于系统存储容量是有限的, 所以仅考虑后f个帧, 其他数据在匹配之后都会删除。使用了两个不同方案来合并最后f个帧的结果, 第一个方案, 称为批处理时序识别, 以批处理模式合并最后f个帧的相似度, 即平均最后f个帧的原始相似度分数, 因此, 在任意时间t, 查询对象对数据库的相似度由下式给出:
式中, s'it是最后f个帧的平均相似度分数, sit是帧t的原始相似度分数, 正如前面讨论的, sit指的是数据库中每个身份的最小簇相似度。第二个方案, 称为复合时序识别, 以复合方式合并相似度分数, 即对最后f个帧的平均相似度分数再求平均, 因此, 在任意时间t, 查询对象对数据库的相似度由下式给出:
式 (7) 中, s″it表示以复合方式合并的平均相似度分数。
3 实验
实验在标准数据库Honda/UCSD的第一个数据集[15]和以人为对象的实时视频上进行。实验比较了批处理时序识别和复合时序识别之间的性能, 其中, 本文得出的识别率由正确识别的帧数目除以帧的总数确定。此外, 还使用Honda/UCSD数据库研究了视频序列中身份变化对识别的影响, 使用注册用户和未知冒充者的实时视频进行验证实验。
3.1 UCSD数据库的人脸识别
Honda/UCSD数据库[15]包括20个人的训练视频和另外29个测试视频集, 视频的分辨率为640×480, 所有视频中的人具有较大的姿态变化 (偏转、俯仰和侧偏) 和表情变化, 测试视频的所有人脸身份都出现在训练视频中。使用批处理时序识别模式和复合时序识别模式对这个数据库进行实验。图3显示了使用上述两个方法得到的相对于帧数的识别率。可以看出, 复合时序识别效果明显好于批处理识别效果, 最大识别率可达到99.5%。
3.2 人脸身份变化的影响
为了研究人脸身份变化的影响, 串联Honda/UCSD数据集的测试视频, 在产生的视频序列上执行复合时序识别, 图4所示为串联视频序列中每个帧的数据库人脸身份的相似度值的最大坡度减最小坡度图。图中的峰值对应于检测的人脸身份变化, 比较这些峰值与人脸身份变化的横坐标位置 (由顶部的垂直线标记) , 可以看到, 使用最大与最小相似度坡度度量相减可以正确识别人脸身份变化, 一旦检测到身份变化, 就可以复位系统移除识别中的延时。
3.3 实时视频中的在线人脸识别
对本文算法进行在线学习和识别实验, 将图库中人脸身份的数目增加到50, 在训练和识别期间, 人脸身份可改变他们的姿态和表情。此外, 额外增加22个个体作为冒充者, 即他们既不包括在图库中也不出现在训练过程中。在这些实验中, 为节省存储空间, 在参与对象的实时视频匹配之后会被丢弃, 训练阶段只保留簇的代表特征, 识别阶段只保留相似度分数。本文算法用C++语言实现, 运行在一个主频2.4 GHz的PC机上, 每秒能执行550次匹配。由于图库中有50个人脸身份, 每个身份含10个簇, 每900毫秒更新一次识别结果, 实验中仅显示每帧的前几个识别结果, 另外, 相似度分数保存在日志文件中用于分析。
图5 (a) 显示了批处理时序识别和复合时序识别的相对性能, 复合时序识别再一次表现出较好的效果。当13帧时达到97.8%的峰值识别率 (即式 (7) 中f=13) 。结果类似于在UCSD数据库上获得的结果, 在UCSD数据库上当f=15时达到99.5%的最大识别率。图5 (b) 显示了复合时序识别对各种帧数的级别识别率, 使用13帧在级别3和使用9帧在级别7达到100%识别率。
上述在实验中, 赋予了所有帧相同的权重, 不考虑它们的置信度。为了分析本算法对不可靠帧的鲁棒性, 在以下的两个实验中, 研究了置信度对框架的影响, 图6 (a) 显示了复合时序识别相对于帧置信度的性能。帧置信度用于拒绝低于某个置信度阈值的帧, 注意当仅有5帧且每个帧的置信度高于0.26时, 识别率就能够达到100%左右, 使用一个帧也能达到100%识别率, 但是置信度需超过0.36。
验证实验中, 将22个注册用户 (身份在数据库中注册过) 和另外22个冒充者 (未知人脸) 与数据库进行匹配, 当注册用户与数据库中自己的身份匹配时, 将相似度分数当作正品分数, 当冒充者与数据库中任意身份匹配时, 将相似度分数当作冒充分数 (或不匹配) 。总之, 共有最大正品分数2962个, 冒充分数161 500个。图6 (b) 显示了本文验证实验中单个帧在各种置信度阈值下的ROC曲线 (受试者工作特征曲线) 。在0.0014的错误接受率 (FAR) 下, 使用置信度为0.35以上的帧, 验证率是100%, 如果继续增加置信度阈值效果更为显著。图7显示了FAR (z轴) 相对于帧数 (x轴) 和置信度阈值 (y轴) 的三维图, 当使用5个帧且置信度阈值为0.35时, FAR为零。
3.4 比较及分析
为了更好地体现本文算法的优越性, 在实时对象识别实验中将其识别率与算法运行时间与其他几种视频人脸识别算法进行比较, 包括EVLBP[10]、FFME[11]、mesh SIFT[12]以及ARFOL[6], 实验环境与3.3节一致, 针对所有的算法, 自己进行实验, 各个比较算法的参数设置分别参照各自所在文献, 实验记录了各个算法的最佳识别率、学习及识别所耗平均时间, 结果如表1所示。
从表1可以看出, 各个算法的识别率相当, 本文算法比EV-LBP算法略低, 但高于FFME、mesh SIFT、ARFOL, 从学习和识别时间看, 本文算法均取得了最低值, 在识别时间上, ARFOL算法甚至为本文算法的2.7倍, 表明了本文算法的实时性, 在保持与其他算法相当甚至更优识别率的同时, 能够大大降低学习、识别时间, 表明了本文算法的优越性。
4 结语
在线特征选择 篇5
随着电子商务的发展,一种新型的商业模式——在线团购(online group-buying)日益普及。在线团购是一种典型的群体消费活动[1],最早是由Groupon公司提出并使用。该模式不同于传统的即时交易模式,消费者在提交预购订单后,需要等待一段时间才能获得所需要的产品或服务。由于团购模式能够使消费者以极低的折扣购买到商品或服务[2],因此参与团购活动的消费者日益增多,根据专业团购数据统计网站“团800”的数据,仅2014年,中国团购市场的总交易额就已接近750亿元(zixun.tuan800.com)。对团购商而言,影响其市场业绩的一个关键要素就是团购品的价格机制,而这正是本文所要研究的问题(在不引起歧义的前提下,本文使用“团购品”一词代表以团购方式出售的商品或服务,而使用“团购商”一词代表采用团购模式的企业)。
由于团购模式在业界的普及,学界也对这种商业模式进行的广泛的研究。现有关于在线团购的文献在总体上可以分为三类:第一类文献所关注的问题是在何种情景下,企业应采用团购这种新型的商业模式;第二类文献关注的是在何种情景下,消费者愿意接受并参与团购活动;第三类文献的研究焦点是影响团购商经营业绩的关键因素。通过对现有相关成果的整理可以发现,团购品的价格机制还需要进一步研究。在经典的营销组合(marketing mix)当中,价格是唯一的与企业收入直接相关的要素[3],对企业盈利至关重要,由此可见,在团购模式的研究当中,价格机制也应该予以充分的重视。
此外,在研究视角方面,基于消费者行为特征的研究尚待深入。当消费者参与在线团购时,需要依靠团购网站的相关信息判断团购品的价值,消费者的心理因素往往会影响到消费者对团购品价值的认知,进而影响到团购商的价格策略。而人的心理活动往往会在行为方面有所体现(心理学亦称行为科学),从这个意义上讲,消费者行为方面的特征应该成为研究团购品价格机制的重要维度。消费者在参与团购时,其行为有两个重要特征:首先,在通常情况下,由于消费者参与团购时并未接触商品,难以全面了解团购品的特性,加之规避风险的心理,消费者往往会低估团购品的价值;其次,由于团购订单从生成到履行需要一段时间,因此消费者会产生等待成本,从而影响到消费者对团购品价值的认知。
本文以消费者行为的上述两大特征为切入点,分析在线团购模式的价格机制。在研究当中,针对消费者行为的两个特征,分别定义了两个参数:消费者对团购品的熟识程度和获取团购品的迫切程度,并且构建了与两参数相关的消费者保留价格(reservation price)模型,进而将保留价格与经典的Bass扩散模型[4]相结合,将团购品价格机制问题转化为运筹学模型。本文采用数值方法求解运筹学模型,分析了消费者熟识度以及单位时间等待成本的变动对团购品价格和团购商收入的影响。
本文其他部分的安排是:第二部分构建了基于消费者行为两大特征的保留价格模型,并结合Bass扩散模型构建了团购商的收益函数,后将其转化为运筹学模型;第三部分采用数值仿真的方法求解运筹学模型,并分析参数变动对团购品最佳价格以及团购商最大收入的影响;第四部分讨论了本文的研究结果对团购商在经营管理方面的启示以及后续的研究方向。
二、模型构建
本节构建了消费者保留价格函数、团购品价值函数以及团购商的收入模型。本文的建模工作基于以下两个假设:第一,所有的预购订单都会被履行;第二,每个消费者只预购一个单位的团购品。
(一)消费者的保留价格
消费者的保留价格是消费者在心理上对团购品价值的认知。保留价格与消费者对团购品的熟识程度和消费者参与团购(即预购了一个单位的团购品)的时间有关。在未接触到团购品之前,消费者对团购品越熟悉,就越能了解团购品的性能与品质,也就更能认识到团购品的价值,其保留价格越高;此外,若消费者参与团购的时间较早,则说明该消费者更加认可团购品的价值,对团购品的保留价格会更高。基于此,消费者的保留价格r(ti)见式(1)。其中,ti是消费者参与团购的时点;U代表第一时间预购且对团购品最为熟悉的消费者的保留价格,而熟识度参数η代表消费者对团购品性能或品质的熟悉程度。由于团购模式的特征是消费者在预购之后不能立即获取团购品,因此消费者需要支付等待成本[5]。将消费者从团购交易中所得到的价值定义为保留价格与等待成本的差值,见式(2),参数δ代表消费者对团购品的迫切程度。
(二)团购品的预购量
本文采用经典的Bass扩散模型计算团购活动开始之后,在不同时间点上的预购量,Bass模型见式(3)。在模型当中,f(t)代表商品在t时刻的非累积购买量;参数m代表商品的潜在市场容量;参数a、b分别为创新系数(innovation coefficiency)和跟随系数(imitation coefficiency),a的值越高,说明更多的消费者愿意主动购买,这部分消费者称为创新者,而b的值较高,则说明更多消费者是在社交的影响下,跟随创新者购买商品。
(三)团购商的收入
当消费者在团购交易中获得的价值不低于团购品价格时就会预购,即消费者在ti刻选择预购的条件是满足v(ti)≥P。将这一条件代入式(4)所描述的赫维赛德阶跃函数(Heaviside step function)[6],就可以得到团购商在整个团购期内的收入函数为
根据团购商的收入函数,将团购品的价格机制问题定义为运筹学模型,见式(5)和(6)。本文所构建模型的主要参数及其经济含义见表1。
三、模型求解与分析
由于运筹学模型的复杂性,本文采用混沌粒子群优化算法[7]进行求解,并分析模型中的两个重要参数(η和δ)的变动对团购品最佳价格及团购商最大收入的影响。
(一)仿真规划
数值仿真的目的在于分析参数η和δ的变动所产生的影响,为此,在数值仿真工作中,将两个参数的取值加以离散化,取η=0.1,0.2,0.3,…,0.9,取δ=0.01,0.02,0.0)3,,…,0.09;此外,取ti=0,0.01,0.02,…,1,而参数m取值为1,参数a和b均取值为0.5。
(二)仿真结果分析
使用Matlab 2014a作为计算平台进行数值仿真,得到以下仿真结果。
仿真结果1。团购品价格应该随着消费者对团购品熟识度的提高而有所提升,但随着消费者迫切程度的提高而有所下降,见图1。
当参数η的值有所提高时,说明消费者对团购品的品质更加熟悉,更了解团购品的价值,此时消费者的保留价格相对较高,而团购商就可以对团购品设定较高的价格,从而获取更大的利益。另一方面,当参数δ的值有所提高时,说明消费者更加迫切希望获得团购品,因此,在团购订单不能立即履行时,消费者需要付出更高的等待成本,从而降低团购品对消费者的价值,此时,团购商若想获得较大的盈利,就需要降价促销。
仿真结果2。团购商的收入随着消费者对团购品熟识度的提高而有所提升,但随着消费者迫切程度的提高而有所下降,见图2。
由于当消费者对团购品的熟识度提高时,消费者保留价格会有所提升,允许团购商设定更高的价格,而高价格有利于团购商扩大盈利。因此,消费者对团购品的品质越熟悉,也就越有利于团购商提高收入。此外,当消费者迫切程度提高,进而使团购商降低价格时,不利于团购商盈利,因此团购商的收入会有所下降。根据图2(b)可知,对于团购商的盈利而言,最理想化的场景就是消费者对团购品的熟悉程度最高,但是获得团购品的迫切程度却最低。
四、结语
本文针对在线团购模式的价格机制问题,从行为科学的视阈出发,基于消费者在线团购时所表现出的行为特征,构建了消费者保留价格与团购品价值模型,并采用智能算法进行求解,分析了消费者行为特征对团购品价格和团购商收入的影响。
本文的研究对团购商的运营具有一定的启示意义。首先,团购商若想提高收入,就需要让消费者充分了解团购品的价值,例如,可以在团购的平台上放置大量的图片,使消费者对团购品拥有直观的认识,或者通过更多的数据让消费者更加全面地了解团购品的性能或品质。其次,团购商还应该努力使消费者更有耐心,从而降低消费者的等待成本;与此同时,对于那些同时采用团购和即时交易两种模式的商家而言,可以利用消费者对商品的迫切程度,将部分迫切希望获得商品的消费者分流至即时交易模式,由于同样的商品在即时交易模式中的价格往往高于团购模式,所以这样做有利于提高商家的收入。
在后续的研究工作当中,需要在以下两个方面加以深入。第一,在消费者保留价格方面,为了能够更好地描述消费者行为,需要构建非线性的保留价格模型,从而融入更多的消费者行为特征。第二,在团购模式引入中国后,逐渐发展出了即时交易型团购,即消费者可以即时履行订单而不需等待,此类型的团购模式与Groupon公司所开创的团购模式在盈利机制方面有所区别,也是在后续工作中的重点方向。
参考文献
[1]张迪,董大海,冯雪飞.群体消费模式研究[J].管理现代化,2016(1).
[2]Kauffman R J,Wang B."Bid Together,Buy Together:On the Efficacy of Group-Buying Business Models in Internet-Based Selling,"Handbook of Electronic Commerce in Business&Society[M].Boca Raton:CRC Press,2002:27-28.
[3]Kotler P,Keller K L.(14th eds.).Marketing Management[M].New Jersey:Pearson Education,Inc,2012.
[4]Bass,F.M.A New Product Growth for Model Consumer Durables[J].Management Science,1969,50(12):215-227.
[5]唐尧,马士华.网络团购下的定价与持续时间决策[J].管理科学学报,2015(9).
[6]Chen J,Chen X,Song X.Comparison of the group-buying auction and the fixed pricing mechanism[J].Decision Support Systems,2007,43(2):445-459.
在线特征选择 篇6
随着网络的迅速发展,企业的营销模式越来越多样化和个性化,企业间的竞争更加激烈,越来越多的企业选择开辟网络渠道增加其竞争力。广告模式也不仅仅局限于电视广告和平面广告,各种各样的网络在线广告模式迅速受到企业的追捧。这给传统制造商企业带来了新的思考。随着互联网的应用,制造商不仅可以通过零售商销售产品,而且可以开辟网络渠道直接面向顾客销售他们的产品。传统制造企业如海尔、联想、报喜鸟、喜梦宝等开始在传统的零售渠道之外通过在线直销渠道向消费者销售产品和服务。因此网络渠道供应链在现实中是普遍存在的,研究网络渠道情形下的供应链结构选择显得很重要。
根据企业在供应链纵向和横向集成程度的不同,对在线渠道供应链的研究,可以分为四种模式:完全独立的模式、“砖块+点击”的模式、前向集成的模式、完全集成的模式[1]。目前对于双渠道供应链的理论研究主要集中在定价模式上,相当数量的文献考虑混合渠道模式[2,3,4,5,6,7,8,9]。Cai[10]通过对传统分销渠道的价格与电子直销渠道的价格的调整,利用算例仿真探讨了如何协调双渠道供应链的问题。以上的双渠道定价模型很多都是基于消费者效用函数推导需求函数的[2,3,4]。国内对于电子商务环境下的供应链尤其是双渠道供应链的研究起步较晚,成果数量也比较少,大多数文献分析了单层双渠道的情形,没有考虑制造商的影响[11,12,13]。郭琼通过期权机制,研究了电子市场与传统契约市场共存下的供应链各决策主体的决策模型。随着企业的竞争越来越激烈,越来越多的企业希望通过广告等销售努力手段去刺激消费者的需求,达到提高销量和利润的目的。当制造商建立直销渠道之后,除了定价问题之外,销售努力是一项无法避免的重要决策,广告策略就是其中之一。关于广告和销售渠道的研究,大多关注于单渠道或合作广告的研究。研究双渠道情形下的促销努力的文献很少。Tsay和Agrawal[14]考虑了直销渠道和实体渠道具有不同的促销效率,每个渠道的促销努力都会提升总需求,总需求按照一定比例在两个渠道之间分配,促销努力具有外部性。分析了单一直销渠道、单一零售渠道、双渠道三种形态下的促销努力均衡。他们的模型没有考虑直销渠道的促销造成的市场争夺作用。Kumar和Ruan[7]的模型中只考虑了零售商提供的服务支持水平或促销努力,没有考虑制造商在直销渠道的促销努力。Yan[15]考虑了直销渠道采用竞争性广告与零售渠道竞争。
本文同时考虑价格因素和广告投入为决策变量,从制造商的角度研究了网络渠道供应链的最优策略选择:在线广告、在线销售、在线销售及广告。通过建立博弈模型得出了各种方案的均衡解(最优定价、最优广告投入水平、最优需求),分析了制造商增加网络渠道对供应链各成员的影响,进行了策略选择的研究。与Cai[16]研究相似,基于消费者效用理论,得到两个市场中的需求。但不同于以往研究之处:之一,本文把销售努力也作为影响消费者需求的因素,并融合到需求函数中;之二,本文考虑了制造商在线广告对供应链的影响,网络渠道不只是网络销售渠道,还可以是网络销售努力渠道;之三,本文同时研究了在线渠道的前向集成的模式和完全集成的模式,即分别研究了供应链分散控制和供应链集中控制下的四种模型,并比较分析了它们的均衡条件。
2 基本模型
本文的供应链系统由一个制造商和一个零售商组成。制造商有以下四种渠道策略选择模型:“零售商渠道”“零售商渠道+在线广告”“零售商渠道+在线销售”“零售商渠道+在线销售及在线广告”,分别用R、RS、RD、RDS表示,如图1所示。
模型R是由一个制造商和一个零售商组成的传统供应链,制造商只通过零售商销售产品。模型RD是制造商在保留传统零售渠道的前提下,增加网络渠道销售产品,在网络上开设自己的直销渠道。模型R和RD可以看作是两个基本模型。模型RS是在模型R的基础上,制造商通过网络渠道做广告宣传,增加其利润,比如福特汽车公司采取投入网络广告的策略成功地增加了其利润。模型RDS是在模型RD的基础上,制造商通过网络渠道做广告宣传,在此模型中,制造商增加网络渠道不仅用于在线销售而且做在线广告,许多的制造商如:2006年,大众汽车在网上发布最新两款甲壳虫系列———亮黄和水蓝,2000辆新车均在网上销售,这种网络营销方式给大众企业带来了收益。本文假设四个模型中的零售商是相同的零售商,记作R;用M来表示制造商。
本文用到的参数说明:
αi(i=d,r):在线直销渠道和传统销售渠道的基本需求;
ci(i=d,r):在线直销渠道和传统零售商渠道的渠道操作成本;
b:边际效用改变率;
θ:渠道替代率,0≤θ<1;
Di(i=d,r):在线直销渠道和传统渠道的实际需求;
Pi(i=d,r):在线直销商渠道和传统零售渠道的销售价格;
e:制造商投入的在线广告水平;
χ:因投入广告而增加的总需求量分配到在线销售渠道的比例;
w:在供应链分散控制下,制造商给予零售商的批发价;
ΠM:制造商的利润;
ΠR:零售商的利润。
本文运用消费者效用函数
可以得到不同渠道结构的需求函数。在很多文献中也有用到类似的消费者效用函数[16]。其中,为了简便,假定b=1;θ表示渠道替代率,0≤θ<1。尽管αd和αr可以代表不同渠道的市场份额,但是如果θ≠0,那么渠道间的需求相互影响。并且总需求随着θ减小。
在模型R中,制造商只通过传统零售商销售产品,替代率θ=0,则在只有零售商渠道的供应链中,使消费者效用函数最大化,得零售商渠道的需求函数为:
在模型RS中,制造商通过网络渠道投入e水平的在线广告,由广告促销努力增加的产品需求量为e.制造商只通过零售商销售产品。使消费者效用最大化,得零售商渠道的需求函数为:
在模型RD中,制造商增加网络在线销售渠道与零售商竞争,使消费者效用函数最大化,得在线销售渠道和零售商渠道的需求函数分别为:
在模型RSD中,制造商通过网络渠道投入e水平的在线广告,由广告促销努力增加的产品需求量为e.制造商增加在线直销渠道和零售商竞争,那么e以χ的比例分配给在线直销渠道,则在线直销渠道的基本需求增加χe,零售商渠道的基本需求增加(1-χ)e.假设χ为0.5,表示在线广告对在线销售渠道和传统渠道有相同的广告效应,假设χ与投入广告的多少没有关系。使消费者效用最大化,得在线销售渠道和零售商渠道的需求函数分别为:
3 最优策略分析
本文将分别对供应链为制造商分散控制下的四种模型和供应链集中控制下的四种模型进行研究分析。直接用上标R、RS、RD、RDS表示分散控制下的四种模型;分别用上标CR、CRS、CRD、CRDS表示供应链为制造商集中控制下的四种模型。
3.1 供应链分散控制
在零售商渠道中,制造商以批发价w把产品销售给零售商。假设产品的生产成本为0。
在模型R中,制造商和零售商的利润函数为:
在模型RD中,制造商和零售商的利润函数为:
为了反映广告规模效益递减的规律,制造商投入e水平在线广告的成本为ηe2,在本文中令η=1。那么,在模型RS中,制造商和零售商的利润函数为:
在模型RSD中,制造商和零售商的利润函数为:
为了使本文的讨论更简单,将
定义为零售商渠道相对于在线销售渠道的相对市场份额(或者相对地位)。如果Ω>1,那么在零售商渠道比在线销售渠道占优势,反之亦然。
为了使本文研究有意义,假设Pr≥w≥cr≥0,Pd≥cd≥0,即产品的渠道价格必须超过其边际成本;假设所有渠道的需求必须是非负的,可知θ≤Ω≤1/θ;在模型R中,假设αr≥Pr≥cr.
在供应链分散控制下,决策过程是制造商作为领导者而零售商作为跟随者的两阶段Stackelberg博弈过程。在决策过程中,制造商首先根据自己的利润最大化确定最优的单位产品批发价w和广告投入水平e,然后制造商和零售商根据制造商的决策结果确定最优的产品价格Pd和Pr,但是在不同的优势策略模型中,博弈过程会有区别。
在模型R中,制造商首先确定批发价使其利润最大化,然后零售商确定零售价。
在模型RS中,制造商首先确定投入的广告水平和批发价使其利润最大化,然后零售商确定零售价。
在模型RD中,制造商首先确定批发价,然后应用纳什博弈同时的零售商确定零售渠道的售价和制造商确定在线直销渠道的价格。
在模型RDS中,制造商首先确定投入的广告水平和批发价使其利润最大化,然后应用纳什博弈同时的零售商确定零售渠道的售价和制造商确定在线直销渠道的价格。
3.2 集中控制供应链系统
为了给制造商提供更全面的管理决策,本文也将对供应链集中控制下的四种模型进行分析,这四种模型分别用CR、CRS、CRD、CRDS来表示。在供应链集中控制时,供应链整体的利润和制造商的利润相等。四种模型的制造商利润函数分别为:
供应链集中控制下,为了使供应链的整体利润最大化,即制造商的利润最大化,制造商首先确定最优的广告投入水平e,然后再确定最优的产品价格Pd和Pr.
4 优势策略比较
本节分别分析供应链分散控制下和供应链集中控制下的各策略模型间的优势策略,通过优势比较得出制造商在一定条件下的优势策略,为制造商决策提供参考。然后对供应链集中控制下的各策略模型与分散控制下的策略模型进行纵向的比较。
由所有模型的需求非负可知,使研究有意义的有效区域为:θ≤Ω≤θ1,其中0<θ<1。
4.1 供应链分散控制下模型间的优势策略比较
通过模型R和RS比较,分析制造商是否增加在线广告的决策;通过模型RD和R比较,分析制造商是否增加在线销售渠道的决策;通过模型RD和RS比较,分析制造商增加在线销售渠道还是增加在线广告的决策;通过模型RDS和RD比较,分析制造商在增加在线销售渠道的基础上是否还要增加在线广告的决策;通过模型RDS和RS比较,分析制造商在增加在线广告的基础上是否还要增加在线销售渠道的决策。从表1各模型的最优利润,可得两模型比较的差值。
在使研究有意义的区域内比较模型间的优势策略,经过数学逻辑运算可得以下引理。
引理1对于制造商,总有模型RS优于模型R;模型RDS优于模型RD;模型RD优于模型R.只有满足条件A时,才有模型RD优于RS;只有满足条件B时,模型RDS优于模型RS.
条件A和B分别如下:
对于零售商,总有模型RS优于模型R,模型R优于模型RD,模型RS优于模型RD,模型RDS优于模型RD;谆有满足条件E时,才有模型RDS优于模型RS;只有满足条件F时,才有模型RDS优于R.条件E和F分别如下:
在此定理中有,
以上式子Ωi(i=1,…,4)都是根据解二次函数的根得到Ωi都是关于θ的减函数。
引理1表明,制造商增加在线广告策略,对于制造商和零售商来讲都是有益的,即模型对于制造商,在传统零售渠道的基础上增加在线销售渠道可以带来更多的利润,即模型只有满足一定条件时,同时增加在线销售和在线广告比只增加在线广告要获得更多的利润,即如果制造商只能选择在线销售或者在线广告,那么在大部分时候都有模型
对于零售商,制造商增加在线销售渠道的策略不能增加零售商的利润,即总有模型虽然在大部分情况下,对于零售商来讲,制造商只增加在线广告的策略比同时增加在线销售和在线广告的策略要获得更多的利润,但还是存在一定条件可以使零售商在制造商同时增加在线销售和在线广告策略下获得更多利润,即存在一定条件使模型
如果把有效区域分别看作全概率事件Q;对制造商来讲,把模型RD优于模型RS和模型RDS优于模型RS需满足的条件A和B看作事件A和B;把对零售商来讲,模型RDS优于模型RS和模型RDS优于R需满足的条件E和F看作事件E和F.那么,可得如下定理:
(3)当满足事件BE时,对于制造商和零售商,模型RDS都是最优势策略;当满足事件珚B珚E时,对于制造商和零售商,模型RS都是最优势策略。
综上所述,在供应链分散控制情况下,对于制造商,在使研究有意义的条件下,都有:策略模型RS优于R,策略模型RDS优于RD,策略模型RD优于R,即RSR,RDSRDR.当满足事件B时,对于制造商,RDS模型是最优策略,即制造商选择同时在网络上销售产品和做广告是最优策略。当满足事件珚B时,模型RS模型是最优策略,即制造商只增加在线广告策略是最优策略。制造商增加网络在线广告,起到了一定的宣传效应,提高了品牌的知名度,需求增加,因此可以给制造商带来更多的利润。当制造商通过传统渠道和网上直销渠道销售产品时,如果Ω较小(如Ω≤Ω3),增加在线广告可以提高制造商的利润;如果Ω较大(如Ω≥Ω3),传统零售渠道占优势,增加在线广告不能提高制造商的利润,因为增加的利润不足以弥补广告成本。
对于零售商,制造商只增加在线销售策略对零售商是没利的,即策略RD是四种策略选择中最差的选择;制造商只增加在线广告策略可以增加零售商的利润,总有策略RSRRD.当满足事件E时,对于零售商,RDS模型是最优策略;当满足事件珚E时,对于零售商,模型RS是最优策略。在传统零售渠道的基础上,制造商只开辟网络在线销售渠道与零售商竞争,由于需求减少,价格降低,所以零售商的利润减少。如果制造商增加在线广告,总需求增加,零售商的需求增加,利润也随之增加。当制造商通过传统渠道和网上直销渠道销售产品时,如果Ω较小(如Ω≤Ω6),增加在线广告可以提高零售商的利润;如果Ω较大(如Ω≥Ω6),传统零售渠道占优势,批发价变大,增加在线广告不能提高制造商的利润。
4.2 集中式控制下模型间的优势策略比较
通过模型CR和CRS比较,分析制造商是否增加在线广告的决策;通过模型CRD和CR比较,分析制造商是否增加在线销售渠道的决策;通过模型CRDS和CRD比较,分析制造商在增加在线销售渠道的基础上是否还要增加在线广告的决策;通过模型CRDS和CRS比较,分析制造商在增加在线广告的基础上是否还要增加在线销售渠道的决策。从表2各模型的最优利润,可得两模型比较的差值。
在使研究有意义的区域内比较模型间的优势策略,经过数学逻辑运算可得以下引理。
引理2对于供应链整体利润,也就是对于制造商,总有模型CRS优于模型CR;模型CRDS优于模型CRD;模型CRD优于模型CR.只有满足条件G时,模型CRD优于CRS;只有满足条件H时,模型CRDS优于CRS.
条件G和H分别如下:
在此定理中,
以上式子Ωi(i=5,6)都是根据解二次函数的根得到,Ωi都是关于θ的减函数。
引理2表明,在供应链集中控制下,对于供应链整体,也就是对于制造商,增加在线广告策略总可以给制造商带来更多的利润,只增加在线销售渠道可以增加其利润,即总有模型在一定条件下,在制造商已经开辟在线广告的基础上再增加在线销售渠道可以增加其利润,即模型
如果把有效区域分别看作全概率事件Qi,对供应链整体来讲,把模型CRD优于模型CRS和模型CRDS优于模型CRS需满足的条件G和H看作事件G和H,那么,可得如下定理:
综上所述,在供应链集中控制情况下,对于制造商,在使研究有意义的条件下,都有:策略模型CRS优于CR;策略模型CRDS优于CRD;策略模型CRD优于CR.当满足事件G和珚GH(即G∪H)时,对于供应链整体来讲,CRDS模型是最优策略,即制造商同时在网络上在线销售和在线广告策略是最优策略。当满足事件珚G珨H时,模型CRS模型是最优策略,即制造商只增加在线广告策略是最优策略。此策略选择结果与分散式控制下制造商的策略选择一致。制造商增加在线广告宣传,需求增加,可以给供应链整体带来更多利润。制造商在传统零售渠道的基础上增加在线渠道,给销售者带来了更多的选择,可以增加需求,从而增加供应链整体的利润,即增加制造商的利润。当θ和Ω较大时(如θ>θ1),在策略CRS的基础上,制造商增加在线销售渠道,零售商渠道的价格降低,整体供应链利润变小。
4.3 集中式控制和分散式控制下相同模型间的优势策略比较
定理3对于整体供应链,供应链集中控制下的策略模型总是优于供应链分散控制下的策略模型。
定理3表明,供应链集中控制策略可以给供应链整体及制造商带来更多的利润。由于在供应链分散控制策略模型中,制造商和零售商都是追求各自利润最大化,存在双边际化效用。而集中控制策略模型中,追求整体利润最大化,自然有供应链集中控制策略优于分散控制。
5 结论
本文研究了网络渠道对制造商、零售商、整体供应链的影响。不同于以往有关双渠道供应链研究的是:本文以制造商为主导,加入广告的影响,构建了零售商渠道(模型R)、零售商渠道加在线广告(模型RS)、零售商渠道加在线销售(模型RD)、零售商渠道加在线销售及广告(模型RDS)四个策略模型,分别分析了供应链分散控制、供应链集中控制下这四种模型的最优决策。
本文比较了四种策略模型的最优决策,分析了供应链的优势策略。并且对供应链集中控制下的策略模型和供应链分散控制下的策略模型做了纵向的比较。通过比较分析得出:(1)在供应链分散控制下,对于制造商,制造商增加网络在线广告,可以给制造商带来更多的利润;制造商增加网络在线销售渠道与零售商竞争,可以给制造商带来更多的利润。(2)在供应链分散控制下,对于零售商,在传统零售渠道的基础上,制造商增加网络在线广告,对零售商也是有益的;而在制造商已经增加在线销售渠道的基础上增加在线广告,可以使零售商的利润增加;在一定条件下,制造商增加在线销售渠道,也可以给零售商带来更多的利益。(3)在供应链分散控制下,无论对于制造商还是零售商,存在一定条件,使零售商渠道加在线销售及在线广告策略(RDS)是最优势策略。(4)在供应链集中控制下,对于供应链整体,即对于制造商,只增加在线广告策略或者只增加在线销售,都可以给制造商带来更多利润;在在线广告策略的基础上增加在线销售渠道,在一定条件下,可以给制造商带来更多利润,并且零售渠道加在线销售及在线广告渠道(CRDS)是最优势策略。(5)在供应链集中控制下供应链整体的网络渠道策略选择与在供应链分散控制下制造商的网络渠道策略选择一致。(6)对于整体供应链,供应链集中控制下的策略优于供应链分散控制下的策略。
从本文所得结果知,在不考虑制造商和零售商冲突的情况下,制造商选择在拥有自己零售商的基础上增加网络销售渠道及在线广告策略是最优策略。这给管理者决策提供了参考。同时,本文研究具有一定的局限性,没有充分考虑现实中所有的结构,并且是在假设在线广告对零售渠道和在线渠道有相同影响的前提下进行研究的,但现实中是比较复杂的,同时也忽略了其他一些有意义的现实因素,如:服务、顾客的忠诚度等,所以本文还有改进的空间。在以后的研究中可以考虑渠道结构对消费者的影响,研究传统零售商和在线零售商做广告的问题,还可以从零售商的角度出发,研究零售商网络渠道结构的选择问题。
摘要:研究了制造商网络渠道选择的最优策略问题。通过建立供应链分散控制和供应链集中控制下的零售商渠道、零售商渠道加制造商在线广告、零售商渠道加制造商在线销售、零售商渠道加制造商在线销售及广告这四种策略模型,运用博弈论理论分析了每种策略下的最优决策,并进一步分析了供应链的优势策略,为网络时代下制造商做决策提供了参考。
在线特征选择 篇7
一、在线教育行业的五力模型分析
(一)行业现有的竞争状况
在线教育行业现有的竞争是常态化竞争。根据互联网教育研究院编著的《2015年中国在线教育产业蓝皮书》数据显示,2014年中国在线教育市场规模约为283.7亿元,平均比2013年增长17.8%左右。2015年市场规模进一步提高,达到399亿元。庞大的市场规模催生出大批新兴企业。报告统计,截至2015年,国内互联网教育领域企业数量约为9500家,其中K12互联网教育领域约有2200-2400家,相关从业人员近30万。
(二)供应商的议价能力
在线教育行业的供应商几乎没有议价能力。用户大多倾向于免费的在线教育产品,付费的寥寥无几。这主要是因为大多数在线教育产品差异化程度不高,不能给用户带来预期的价值。对大部分在线教育企业而言,盈利难题如鲠在喉。有不少初创企业纷纷表示先期不考虑盈利,也有如聚智未来这样的挂牌企业在拓展在线教育业务时明确表示不依靠其盈利。互联网教育研究院在调查了400家在线教育公司后,显示有70.58%的公司处于亏损状态,13.24%的公司处于持平状态,仅有16.18%的公司保持盈利状态。同时报告也进一步指出,由于新进入的项目非常多,而且已经有一部分项目死亡,整体上盈利的在线教育企业预计不超过5%,而收支平衡的约在10%,死亡率约在15%,亏损率约在70%。
(三)购买者的议价能力
购买者在议价能力上占有绝对优势。线上用户的黏性非常低,容易在同质化产品中不停游走,瞬间就会变更产品。中国居民虽然对在线教育的热情较高,但对价格较为敏感,一旦部分在线教育产品开始收费,很多人就会失去对该产品的兴趣,将注意力转移到另一种产品上去。
(四)替代产品或服务的威胁
替代产品或服务的威胁具有挑战性。在线教育行业的同质化产品数量可谓空前绝后,内容师资平台有新东方在线、华图网校、环球雅思网校等;在线电商平台有网易公开课、沪江网、中国考研网、淘宝同学;在线工具平台有YY直播、有道翻译、海词等,似乎随便一个细分行业,就能举出一系列类似的产品和服务,这就是在线教育圈的现状。
资料来源:智研数据中心整理。
(五)新进入者的威胁
新进入者的威胁层出不穷。在线教育行业壁垒低,目前还不存在大的垄断者,所有想到的想不到的都有进入的可能性。一是互联网公司开始利用他们原有的巨额流量布局在线教育。2013年7月,百度推出了百度教育,8月,淘宝推出了淘宝同学。二是新东方等传统教育机构近十年来也先后涉足互联网,从不同的细分市场切入线上教育B2C领域。三是由于教育行业现金流稳定,利润高,所以自从2013年在线教育概念开始火起来后,很多中小型创业团队开始积极涉足在线教育,并获得大量融资。
二、在线教育行业盈利模式的选择
教育行业的项目投资回收周期较长,纵有互联网的加速,一个项目从开端投入资金到逐步发展,进入盈亏平衡状态,这期间一般至少需要3-5年时间(少数项目除外)。互联网只是一个辅助工具,所以绝大多数在线教育企业在短期内盈利还是较困难的。据互联网教育研究院调查,目前实现盈利的在线教育机构主要有四类,即在线教学平台企业,网络、硬件类企业,教育信息化类企业以及一些如学而思网校、沪江网、新东方在线等大牌B2C类企业。因此,在线教育平台明朗的盈利模式并未真正浮出水面,尽管当前业内有各种尝试,但目前还是处于探索阶段,还不能够成为盈利模式的标杆。在线教育行业要想盈利必须做到以下几点:
(一)明确竞争定位,提高产品差异
根据好未来发布的《中国在线教育行业分布图谱》数据显示,在线教育按照客户需求主要划分为11大领域:母婴、学前、少儿外语、中小学、大学/研究生、留学、职业考试、职业技能、成人外语、兴趣和综合;按照主营业态分为工具、内容和服务三大类型;按照电子商务的商务模式主要划分为B2B、B2C、B2B2C、C2B和C2C五种。
英孚教育副总裁白皎宇表示:“对于K12线下培训机构而言,在线教育只能是辅助,无法取代线下。”2013年11月,龚海燕推出了涵盖中小学K12阶段的全学科教学资源共享平台———梯子网,她曾提出要用“3年烧4.5个亿”去推动梯子网。2014年7月,龚海燕又推出其新创的第三家在线教育网站———那好网,主打K12领域“互动直播”。但是,2014年9月梯子网和那好网纷纷宣布倒闭。龚海燕在二次创业之前并没有做好充分的市场调研,事实上,K12教育并不是很难,家长、教师以及社会上的辅导机构都能很好地解决小孩子的问题,看似美好的在线教育并不能满足家长的最大效用,即产品对用户的价值不大。
在线教育产品在设计之初就应该找准自己的定位,合理利用帕累托法则(80/20法则),使其处于明确、独特而又恰当的位置上。基于这个定位,企业才能清楚自己将做出什么样的诉求,要满足哪些客户的哪些需求,从而形成与竞争对手产品之间的差异。根据微观经济学市场理论,在线教育市场接近垄断竞争市场,在该市场上,产品差异化成为一种很重要的竞争手段。所以企业如果能将这些对消费者重要而又较少或没有满足的差异有效传达给消费者,那么企业就有可能提高自己的议价能力和减弱替代产品或服务的威胁。
(二)提高教育效率,增强用户粘性
互联网并不能解决中国教育的深层次问题,它只是在技术上可能对教育的效率和效果产生一定影响。怎么解决学习能够快乐的事情,以及提高学习质量或学习效率,是所有从事在线教育的公司在这个垄断竞争市场上获得核心竞争力的关键所在。
1. 团队交互学习,增强互动性
团队交互学习模式通常具有号召力,可以让学习者主动学习、参与进来,并能够提高学习者的自律能力。比如MOOC推出的“计划学习要趁早”的活动,即在社区发帖,列出自己的学习计划、学习目标、希望在100天内学习的内容,如果希望组队参加,在帖子标签里加上“组队学习”标签。
2. 突出内容主题,细化学习资源
碎片化的在线视频可以增加用户黏性。在信息轰炸的移动互联网时代,用户遇到的最大难题是快速而且准确地定位资源。在线教育产品在设计之初就应注重资源开发、管理和使用的颗粒化、精细化,使用户易于查找和定位,以及便于存储和传播。例如,微课、个性化题库等之所以备受关注,正是由于其针对性强,可以帮助学生最快定位自己所需关注的学习内容;而且视频的长度也限制在学生注意力可以相对集中的时间范围内,比较符合学生的身心发展特征。
3. 设计游戏化机制,改善学习体验
寓教于练而不是寓教于听,将教育游戏化,把学习设计为过关,发奖品等作为奖励。只有用户对这些体验较好的在线教育系统感觉良好,在线教育才能创造价值、产生经济效益。比如Toca Boca/Fingerprint:优秀的游戏制作颠覆了传统的儿童产品,使孩子对学习产生了极大的乐趣;再如,魔方格传承“魔方”神秘而多彩的特点,深度听取魔粉们的真实建议和喜好,践行“海量题库、提分神器、快乐学习、不缺朋友”四大主张,让孩子学而不厌。
(三)创新营销方式,培养付费习惯
传统的营销和传播是分离的,好的营销策略还需要好的传播策略去支撑,这样才能更大程度地占有市场份额。在移动互联网时代,在线教育行业应将营销和传播合二为一,形成品牌闭环,帮助用户养成付费习惯。消费者使用在线教育产品(先使用后付费购买)之后,可以立即为朋友分享红包,客户抢到的红包能够在下次购买产品时当作现金使用,而分享者也会获得分享红包(针对中国特有的文化环境,红包的金额可以由大到小循序渐进,直到消费者习以为常)。这样的闭环策略将会实现在线教育付费产品的病毒化传播和几何级的客户增长。在线教育企业通过采用消费者向消费者传播的模式,新用户不仅可以获得现金券,推荐成功使用的推荐人也可以获得金额不等的现金券。这样的方式可以激励忠诚的客户去培育新的客户,实现了客户向外部员工的转化,不仅帮助在线教育企业有力地实现了客户规模的拓展,也让客户习惯了付费购买在线教育产品的形式。
三、结语
“互联网+教育”已成为大势所趋,作为下一个蓝海市场,在线教育未来十年将是一个有巨大商机的市场。由于在线教育特有的优势,网上学习已被大众所接受并成为一种学习趋势。但是这个潜力市场明朗的盈利模式还未真正浮出水面,因此,目前在线教育平台的当务之急是完善产品差异化、用户流量和付费习惯这三个门槛,使之成为在线教育平台真正的门槛,在线教育真正的盈利方向也将会随之而诞生。
参考文献
[1]迈克尔·波特.竞争优势[M].陈小悦译.华夏出版社,2007.
[2]互联网教育研究院:2015年在线教育企业盈利项目仅5%[EB/OL].http://www.199it.com/archives/434282.html.2016-01-26.
[3]产业信息网:2015-2020年中国在线教育市场运行态势及投资方向研究报[EB/OL].http://www.chyxx.com/industry/201507/328716.html.2015-07-14.
[4]蓝进.试论市场定位、产品定位和竞争定位之间的关系[J].商业研究,2007(10):366.
在线特征选择 篇8
现从电涡流传感器变压器型等效电路和材料疲劳特性出发,选取4种阀芯备选合金材料,而后建立传感器线圈检测阀芯的磁场仿真模型和阀芯应力和疲劳分析的力学仿真模型,利用数值模拟的方法,得到不同阀芯材料下,传感器的检测性能和阀芯的应力特性和疲劳特性,综合分析各种阀芯材料的传感器检测性能和力学性能,选取阀芯的设计材料为紫铜,这为溢流阀在线检测系统的设计奠定了理论基础。
1 模型原理分析
1.1 溢流阀在线检测原理
以DB型溢流阀(先导阀)在线检测装置为研究背景,如图1所示。此装置主要由溢流阀先导阀、电涡流传感器等部分组成。当阀芯出现震颤、卡紧等故障时,可通过电涡流传感器实时检测阀芯状态,从而实现快速排故和实时状态检测的功能。阀芯与阀座之间通过弹簧力保持密封状态,当进油口压力大于弹簧预紧力时,阀芯开启,溢流阀处于工作状态,其工作压力大小可通过调节弹簧预紧力进行调整。
如图2所示,当阀芯处于通有高频正弦激励信号(如电压u)的传感器探头线圈所产生的交变磁场φ1中时,由于电磁感应的作用,阀芯底座中将产生闭合的涡流环i2。涡流产生与交变磁场φ1方向相反的磁场φ2阻碍φ1的变化,探头线圈的阻抗也相应地发生变化,其变化程度取决于阀芯材料和检测距离h等参数。在本例中,传感器线圈主要参数如表1所示。
为方便研究,将探头线圈看作是变压器初级线圈,阀芯涡流看作是次级线圈,其变压器型等效电路模型如图3所示。图中将阀芯抽象为短路线圈,其与检测线圈发生磁场耦合,两者之间互感系数为M,其中R1和L1分别表示检测线圈电阻和电感,R2和L2分别表示阀芯等效电阻和电感。设输入激励条件为电压U,由克希霍夫定律可知,
因此,线圈等效电阻和等效电感分别为
电涡流传感器是依靠检测电路感知线圈阻抗值的变化,实现检测振动、位移等信号的功能,可通过分析线圈阻抗值随检测距离变化的规律研究传感器的工作性能。由式(2)可知,变压器型等效电路有如下特性:当检测距离增加,涡流对线圈阻抗影响减弱时,线圈电阻减小,电感增加。
1.2 阀芯载荷分析
如图4所示,进油口试验压力条件下,最大弹簧预紧力F0=150 N,弹簧刚度K=30 N/mm,预压缩量x0=5 mm,阀芯锥角α=35°,阀芯与阀座接触倒角轴向深度d=1.5 mm,进油口工作压力为50 MPa,试验压力为70 MPa,进油口油液对阀芯作用力大小为FD。模型约束条件:阀座后部外表面固定,阀芯径向位移约束、轴向位移放松。另外,对阀芯的力学分析包括两个方面:应力分析和疲劳分析。
应力分析,不考虑偶然载荷工况和温度载荷,当进油口压力为0时,阀芯与阀座之间有最大压力,为满足阀芯应力强度设计要求,设定应力强度安全系数为1.5,即σ<0.67σS,其中σ为管道的应力值,MPa;σS为阀芯的最小屈服强度,MPa。
疲劳分析:考虑到溢流阀在武器系统中操作使用较为频繁,故设计溢流阀的使用寿命为百万次,可靠性安全系数不小于1.5。模拟施加载荷的方式为交变应力,载荷特征为脉动循环,载荷因子变化范围选为0~1.0。运用名义应力法对阀芯进行疲劳分析,线性累计损伤理论选择Miner法则,该法则认为试件所吸收的能量达到极限值时会产生疲劳损伤,阀芯在第i级应力水平下,经过Ni循环时的阀芯疲劳损伤为
式中,ni为阀芯第i级应力水平下经过的应力循环次数;Ni为阀芯第i级应力水平下达到破坏时的应力循环次数。最后,采用Goodman理论对应力进行修正。
2 模型有限元分析
根据阀芯相关设计资料,选取紫铜、不锈钢、铝合金和灰铸铁4种合金作为阀芯备选材料,4种材料的磁性参数[8]和力学参数[9]如表2所示。
2.1 材料类型对传感器检测性能的影响
2.1.1 有限元分析
利用ANSYS中APDL分析模块建立磁场有限元分析的1/4模型[10]。以检测距离h=1.0 mm为例,通过有限元求解,得到不同阀芯材料下,线圈磁感应强度分布云图和阀芯涡流分布云图,如图5所示。
由图5可知,阀芯材料不同时,线圈磁感应强度值不尽相同,这说明阀芯涡流对线圈磁感应强度影响效果存在差异,这主要是因为不同材料集肤效应下的集肤深度不同[11]。对比各材料属性下的线圈磁感应强度和阀芯涡流强度可得,线圈磁感应强度大小顺序为铝合金、不锈钢、紫铜、铸铁,阀芯涡流强度大小顺序为铸铁、紫铜、不锈钢、铝合金。
研究阀芯材料对传感器性能的影响,即是研究阀芯材料对线圈阻抗的影响,线圈阻抗值由线圈入射场阻抗和涡流对线圈的散射场组成,其中入射场阻抗值为定值,散射场阻抗取决于阀芯涡流强度。按照材料的磁性特点,将四种材料分为非磁性材料(μr≈1)和磁性材料(μr1),非磁性材料包括紫铜和铝合金,磁性材料包括不锈钢和灰铸铁。图6给出阀芯为非磁性材料和磁性材料时,传感器线圈电阻值、电感值和检测距离h之间的关系。
由图6可得,对于非磁性材料,当检测距离逐渐增加时,线圈电阻值均减小,电感值均增大,这与变压器型等效电路性质结论相符合,这也说明变压器等效电路适用于非磁性材料。另外,相同条件下,材料为紫铜时电阻和电感的变化率均大于材料为铝合金时的变化率,但后者曲线线性度更好。这也就是说,阀芯材料为紫铜时,传感器灵敏度和精度更好,但线性度略差。但是,对于磁性材料,随着检测距离的增加,线圈电阻值和电感值均减小,这与变压器型等效电路性质结论相悖,这也说明变压器等效电路不适用于磁性材料。
2.1.2 理论分析
对于非磁性材料,其磁性来源于分子磁矩在外磁场中的取向排列,磁性的强弱与外磁场强度和分子磁矩大小相关。由于各分子磁矩的方向不尽相同,因此各磁矩的叠加使分子磁矩基本抵消,磁化后的材料磁性较弱。此时线圈与非磁性材料间的电磁感应对线圈电感变化起主要作用,当检测距离h增加时,阀芯涡流强度逐渐减弱,穿过线圈磁通量相应增加,因此线圈电感随检测距离的增加而增加。
对于磁性材料,其磁性主要来源于原子最外层电子的自旋耦合作用,使电子磁矩同向整齐排列起来,形成很强的磁畴区,如图7所示。在外磁场的作用下,磁畴区磁矩方向均趋于外磁场方向,显示出很强的磁性,这时材料的磁感应强度要比非磁性材料大得多。此时材料本身磁导性对线圈电感变化起主要作用,由于磁性金属磁化方向与磁场方向一致,当检测距离h增加时,磁性材料中磁场与线圈磁场耦合作用减弱,因此线圈电感随检测距离的增加而减小。
当检测距离增加时,阀芯涡流损耗会减少,也就是说,无论阀芯是磁性材料还是非磁性材料,线圈电阻都会减小。
综上,理论分析与有限元分析结果一致,这也证明变压器型等效电路不适用于磁性材料,但适用于非磁性材料,所以,在线检测系统中,先导阀芯适合选用非磁性材料。
2.2 材料类型对阀芯力学性能的影响
2.2.1 应力分析
将阀体Pro E模型导入Workbench进行力学有限元分析[12]。当材料分别为紫铜、不锈钢、铝合金和灰铸铁时,阀芯应力(MPa)和位移(μm)云图分别如图8、图9所示。
由图8可得,试验压力下,阀芯最大应力产生在阀芯与阀座接触面的最外侧,阀芯材料属性对阀芯应力分布影响不大,4种材料最大应力均小于材料许用应力。
由图9可得,阀芯最大位移产生在弹簧与阀芯的接触面处,且最大位移值大小排列顺序为铝合金、紫铜、灰铸铁、不锈钢。
图10给出不同材料时,阀芯轴向位移量变化规律。由图10可知,在试验压力下,灰铸铁和不锈钢抗压性能最优,紫铜次之,铝合金抗压性能最差。
2.2.2 疲劳分析
使用疲劳分析工具对4种材料的阀芯寿命和安全系数进行模拟,调节弹簧压缩量,逐渐增大弹簧预紧力,得到4种阀芯材料下,阀芯的寿命和安全系数随弹簧预紧力的变化规律,如图11所示。其中,阀芯寿命大于1011时,认为负载未对材料造成损伤。
根据图11可得,在最大试验压力下,铝合金材料的寿命和安全系数分别为7.41×105、0.96,均未达到要求的106、1.5的设计水平。紫铜、不锈钢和灰铸铁均满足阀芯的寿命和可靠性设计要求,另外,不锈钢在四种材料中抗疲劳性能最佳。
综上可知,试验压力下,4种材料应力分析和疲劳分析的主要性能参数如表3所示。表中紫铜、灰铸铁和不锈钢均满足阀芯力学性能的设计要求。且三者最大应力分别为铝合金的96%、96%、95%,最大位移分别为铝合金的72%、56%、52%,安全系数分别为铝合金的167%、192%、388%。由此可知,仅考虑阀芯力学特性,材料性能的优劣顺序依次为不锈钢、灰铸铁、紫铜和铝合金,其中,铝合金不符合阀芯设计要求。
3 结论
(1)通过研究阀芯分别为磁性材料和非磁性材料时,传感器线圈的电阻值和电感值随检测距离变化的规律,得到了阀芯为磁性材料时,传感器变压器型等效电路不适用,阀芯为非磁性材料时,变压器型等效电路适用。因此,在4种备选材料中,仅非磁性材料紫铜、铝合金适合阀芯设计中的传感器检测条件。
(2)从4种阀芯材料的力学性能分析可得,对于阀芯的应力分析:试验压力下,4种阀芯材料的应力分布情况无较大差异,不锈钢和灰铸铁的抗压性能明显优于紫铜和铝合金。对于阀芯的疲劳分析:铝合金的寿命和可靠性均不满足阀芯的设计要求,紫铜和灰铸铁寿命和可靠性水平相当,且均满足设计要求,不锈钢抗疲劳性能最佳。
(3)综合考虑在线检测系统中阀芯的设计要求可得,不锈钢、灰铸铁和铝合金均不满足阀芯的设计要求。当阀芯材料为紫铜时,传感器既满足变压器型等效电路的适用条件,又符合阀芯力学的设计要求。综上,本研究选用紫铜作为溢流阀在线检测系统中先导阀芯的设计材料。
摘要:针对溢流阀在线检测系统中,先导阀芯材料的选择问题,首先从阀芯材料必须满足电涡流传感器检测条件和符合力学设计要求两个方面出发,分析了传感器的变压器型等效电路和阀芯的力学载荷特性。借助有限元法,得到了四种不同阀芯材料时,传感器线圈阻抗随检测距离变化的规律,以及阀芯上应力和位移的分布规律,研究了阀芯疲劳特性与弹簧预紧力之间的关系。最后对比选取了合适的阀芯材料。结果表明,磁性材料不锈钢和灰铸铁不满足传感器检测的条件,铝合金材料不满足阀芯的力学性能的设计要求,而紫铜材料两方面性能均满足要求,溢流阀在线检测系统中先导阀芯更适合选用紫铜材料。
关键词:溢流阀,在线检测,先导阀芯材料,电涡流传感器,有限元法,材料磁性,力学性能
参考文献
[1]杨秀荣.溢流阀常见故障现象及排除方法.液压与气动,2013;(3):107—108Yang X R.The common faults of overflow valve and troubleshooting.Hydraulic and Pneumatic,2013;(3):107—108
[2] 郭崇志,张清懿.安全阀阀芯传感器的标定理论与验证技术.流体机械,2011;39(2):40—43Guo C Z,Zhang Q Y.Research on theoretical and verifiable technology of calibration of valve disc sensor of safety valve.Fluid Machinery,2011;39(2):40—43
[3] 顾海东,聂勇.基于霍尔元件的液压阀阀芯位移传感器.传感器与微系统,2011;30(10):87—90Gu H D,Nie Y.Hydraulic valve spool displacement sensor based on hall element.Transducer and Microsystem Technologies,2011;30(10):87—90
[4] Yu Y P,Du P A.Study on applicability of transformer equivalent circuit in eddy current non-destructive evaluation.Chinese Journal of Scientific Instrument,2007;28(3):466—472
[5] 于润桥,廖城,夏桂锁,等.基于涡流传感器的连续油管椭圆度在线检测技术研究.科学技术与工程,2014;14(10):38—41Yu R Q,Liao C,Xia G S,et al.Research of coiled tubing ovality on-line detection technology based on eddy-current sensor.Science Technology and Engineering,2014;14(10):38—41
[6] 王晓明.大型球阀结构优化设计及可靠性分析.天津:天津大学,2013:69—82Wang X M.Optimal design and reliability analysis of large spherical valve.Tianjin:Tianjin University,2013:69—82
[7] 赵冰燃,吕桂萍.球阀动水关闭应力分析.阀门,2011;(3):8 —9Zhao B R,Lu G P.The stress analysis about spherical valve in dynamic water closing.Valve,2011;(3):8—9
[8] You F H,Chen D,Niu L J.Measurement on 3D magnetic field of eddy current and modeling of the true depth of penetration.Chinese Journal of Scientific Instrument,2002;23(4):431—434
[9] 闻邦椿.机械设计手册.北京:机械工业出版社,2010Wen B C.Mechanical design handbooks.Beijing:Machinery Industry Press,2010
[10] 谢龙汉,李杰鸿.ANSYS电磁场分析.北京:电子工业出版社,2015:106—145Xie L H,Li J H.ANSYS electromagnetic field analysis.Beijing:Publishing House of Electronics Industry,2015:106—145
[11] 黄松岭.电磁无损检测新技术.北京:清华大学出版社,2014:28 —30Huang S L.Novel electromagnetic nondestructive testing technology.Beijing:Tsinghua University Press,2014:93—100