免疫模糊

2024-05-14

免疫模糊（精选5篇）

免疫模糊篇1

1 引言

镁合金是迄今在工程中应用最轻的金属结构材料,在国防、航空航天、高速列车、汽车和电子通信等领域已大量应用,被誉为21世纪最富于开发应用潜力的“绿色工程金属结构材料”。随着各行各业对镁合金薄板需求量的不断增长,对镁合金薄板轧制技术提出了更高要求,提高轧机装备整体操作精度成为必需。

板厚精度作为板带材最主要的质量指标之一,其控制水平在很大程度上决定了板带材的质量。液压自动位置控制(APC)系统是板厚自动控制系统的基础和核心,其作用就是精确地控制压下位移以得到所需的辊缝,是整个厚度控制系统的执行终端。因此,APC系统能否正常稳定地工作,决定着板厚控制系统能否顺利投入[1]。

由于液压APC控制系统具有非线性、参数时变性等特性,常规PID控制手段较难获得满意的控制效果。对此,一些学者也提出了一些改进的控制方法,如模糊自整定方法调整PID控制器参数,采用神经网络方法对系统进行控制等[2,3]。

模糊控制具有可以较好地处理各种不确定性、时变性和非线性系统等优势。但模糊控制对专家经验具有过分依赖性,模糊控制器的控制效果往往取决于设计者的经验程度。人工免疫系统在大量干扰和不确定的环境中具有很强的鲁棒性和自适应性等特点,已发展成为计算智能领域研究的一个重要的分支[4,5]。本文针对镁板轧机液压APC系统,设计一种模糊免疫PID控制器。

2 液压 APC 控制系统模型

构成液压APC系统的主要元件,包括电液伺服阀、液压缸、轧机辊系、位移传感器,其控制原理如图1所示。

2.1 伺服放大器

伺服放大器的频宽比电液伺服阀的频宽高得多,响应速度很快,可不计时间常数,近似为比例放大环节,表示为

式中:I为伺服放大器输出电流,A;Ka为伺服放大器的增益;Ur为给定电压信号,V;Uf为位移传感器输出的位移反馈信号,V。

2.2 电液伺服阀

电液伺服阀的响应特性由系统的频宽来决定。当液压执行机构的固有频率ωh低于50Hz时,伺服阀的动态特性一般可用一阶环节表示:

当液压执行机构的固有频率高于50 Hz时,可用二阶环节表示,即

式中:Gsv为Ksv=1时的伺服阀传递函数;Qv为伺服阀流量,m3/s;Ksv为伺服阀增益系数,m3/(s·A);ωsv为伺服阀的固有频率,rad/s;ξsv为伺服阀的阻尼系数。

2.3 液压缸

利用液压控制阀的流量方程、液压缸流量连续性方程、液压缸和负载的力平衡方程,采用质量、弹簧和阻尼结构的系统,可导出液压缸的传递函数为

式中:ωr为惯性环节的转折频率;ξh为液压阻尼比;Kce为总流量压力系数,m3/(s·Pa);K为弹性负载的综合刚度,N/m;Ah为液压缸的有效面积,m2;ωh为液压固有频率。

2.4 位移传感器

位移传感器在系统中可视为惯性环节,即

式中:Xp为液压缸输出位移;Kf为位移传感器的位移电压转换系数;Tf为位移传感器的时间常数,s。

考虑到位移传感器的固有频率远高于液压系统的固有频率,可得到位移传感器的简化模型

2.5 液压APC系统

考虑到伺服阀的频率远高于液压系统频率,因此可以把伺服阀当成一个比例环节,即

液压APC的闭环控制系统简化方框图如图2所示。将活塞负载压力设为零,且忽略弹性负载,即K=0,可得液压APC系统的开环传递函数:

将参数数据带入式(7)可得:

3 模糊免疫 PID 控制器设计

考虑到液压APC系统的非线性与时变性,常规控制算法一般难以确保压下位移的精确性。因此,本文采用模糊免疫PID控制算法实现对压下位移的精确控制。模糊免疫PID控制器实际是模糊控制器与免疫PID的结合,而免疫PID是将常规PID控制与生物免疫原理相结合。图3为其结构框图。

3.1 生物免疫机理

免疫是生物体的一种特性的生理反应。生物的免疫系统对于来自外界的有害抗原可产生相应的抗体来抵御,抗体与抗原经过一系列的反应,通过吞噬作用或产生特殊酶的作用来毁坏抗原。生物的免疫系统由淋巴细胞和抗体分子组成,淋巴细胞又由胸腺产生的T细胞和骨髓产生的B细胞组成,T细胞可分为辅助细胞Th和抑制细胞Ts。当抗原侵入机体并经周围细胞消化后,将信息传递给T细胞,然后刺激B细胞。B细胞产生抗体以消除抗原。当抗原较多时,机体内的细胞Th也较多,而Ts细胞却较少,从而产生较多的B细胞。随着抗原的减少,体内Ts细胞又会增多,从而抑制Th细胞的产生,则B细胞随着减少。经过一段时间间隔后,免疫反馈系统趋于平衡。免疫系统的抑制机理和主反馈机理之间的相互协作是通过免疫反馈机理对抗原的快速反应和稳定免疫系统完成的[6,7,8]。

3.2 免疫PID控制

常规PID控制器的增量输出为

式中:Kp,Ki,Kd分别为比例、积分和微分系数。

免疫系统虽然十分复杂,但是抵御抗原的自适应能力却十分明显。对于非线性的APC系统,采用PID控制时,为了达到好的控制效果,可以采用免疫原理来实现PID参数的调整。免疫PID控制是借鉴生物系统的免疫机理设计出的一种非线性控制器,根据生物的免疫反馈原理,假设第k代抗原数量是ε(k),抗原刺激的Th细胞的输出是Th(k),Ts细胞对B细胞的影响为Ts(k),则B细胞接受的总刺激为

若以液压APC系统的位移偏差e(k)对应免疫系统的ε(k),控制器的输出u(k)对应免疫系统B细胞接受的总刺激S(k),则反馈控制规律可设计如下:

式中:k1为控制响应速度;η为控制稳定效果,η=k2/k1;f(·)为选定的非线性函数,表示抑制细胞的抑制量。

由于常规比例控制器的算法可表示为

式中:Kp为比例增益。

比较式(13)和式(14)可知,基于反馈机理的控制器是一个非线性的比例控制器,其比例增益为

控制器的性能在很大程度上依赖于参数k1,η和非线性函数f(·)的选取。

3.3 模糊免疫PID控制

模糊控制由于具有不依赖于被控对象的精确模型和较强的鲁棒性等优点,可以很好地解决非线性对象控制问题,被广泛地应用于各种控制系统。

本文依据模糊控制逻辑可以逼近任意非线性函数的特点,采用了两个二维模糊控制器来实现对被控对象的控制,一个模糊控制器用来实现免疫反馈规律中的非线性函数f(·),另一个模糊控制器来实现Ki和Kd的自调整。

免疫模糊控制器采用两输入单输出,在图3中,两输入变量为PID控制器的输出u(k)和输出变化量Δu(k),输出变量是f(·),输入变量u(k)与输出变量f(·)被3个模糊集模糊化,分别是“正大”(PN)、“零”(Z)和“负大”(NB);输入变量Δu(k)被2个模糊集模糊化,分别是“正大”(PB)、“负大”(NB)。u(k),Δu(k)和f(·)的隶属函数分别如图4所示。

细胞接受的刺激越大,则抑制能力越小;细胞接受的刺激越小,则抑制能力越大。根据此原则,制定出如表1所示模糊规则。

用于调节PID参数Ki和Kd的模糊控制器采用两输入两输出。以液压APC系统位移误差e(k)及其变化率△e(k)作为两输入,以Ki和Kd作为两个输出,每个量的模糊集被7个模糊集模糊化,定为:{NB,NM,NS,ZO,PS,PM,PB},隶属函数采用三角形,由液压压力调节实际经验以及PID参数整定规则,得到Ki和Kd的模糊控制规则如表2、表3所示。

在以上各控制规则中,均使用Mamdani模糊推理机制,采用Centroid去模糊化方法得到模糊控制器输出。

4 仿真实验研究

根据前面所建立的液压APC系统的数学模型,在Matlab/Simulink仿真环境下,分别对传统PID、模糊自适应PID和模糊免疫自适应PID进行仿真对比研究。

传统PID控制器的参数根据Ziegler-Nichols方法[9,10,11,12]整定得到,分别为:Kp=50,Ki=43 290,Kd=0.014 43。模糊自适应PID控制器与模糊免疫PID控制器的参数采用离线试探的方法确定,分别为:Kp=50,Ki=0,Kd=0.01,η=0.13,k1=5.5。位移信号的阶跃响应曲线如图5所示。

由图5可以看出,传统PID虽然响应时间较快,但是超调量比较大,而且稳定时间较长。模糊自适应PID与模糊免疫PID的响应速度都较好,且没有超调量,但是模糊免疫PID上升时间更短,稳定性更好。

为检验所设计控制方案的跟随性,对给定位移信号在某个时刻发生变化的情况下系统的响应进行了仿真。图6为将液压APC系统的输入给定值由1突然改变为1.15时系统的响应曲线。从图6中可以看出,传统PID与模糊自适应PID虽然都可以使系统响应最终达到新的稳态,但在发生给定变化时都有较大幅度的振荡产生,且需要经过较长时间才趋于稳定。模糊免疫自适应PID能够以更快的速度跟随新的给定值,且不需要经过振荡调整,具有更好的控制效果。

5 结在轧论机液压 APC 系统数学模型基础上,结

合传统PID控制优势及模糊控制和生物免疫调节规律,设计基于模糊免疫PID的轧机液压位置控制系统,能够解决液压APC系统的非线性、时变性等特性对轧辊位移精确控制的影响。该控制方法具有响应速度快、超调量小、抗干扰能力强等优点,且精度高、简单、易于实现,对解决液压APC系统控制问题具有一定的参考价值。

免疫模糊篇2

1 材料与方法

1.1 资料来源

我院2006级临床医学、护理医学、口腔医学等7个专业学生《医学免疫学》期末闭卷笔试试卷2 978份,按学号进行编号后采用随机数字表,抽取试卷146份。

1.2 试卷组成及阅卷方法

该试卷试题内容及知识考查点覆盖卫生部规划教材《医学免疫学》第5版(金伯泉主编)各章节,层次包括掌握、熟悉和了解内容,共54道试题,分5种题型,其中单项选择、多项选择为客观题,名词解释、简答题、论述题为主观题;考试时间为120 min。客观题采用标准答题卡答,用光电扫描器阅卷;主观题评分采用流水作业方式人工阅卷。试卷评判严格按照试卷评阅要求的评分标准和标准答案进行。

1.3 数据处理

1.3.1 成绩分析指标

成绩分析主要侧重在考试的整体水平,一般评价指标有平均分、最高分、最低分、全距、标准差、及格率、分数段分布等。

1.3.2 频数分布处理

将考试成绩输入计算机,用PEMS3.1软件进行统计分析。

1.3.3 课时权重系数处理

将试题内容按章节分类,分为13部分;统计各部分总分(Xi)和每个学生的测试得分(xi),根据授课学时总数(Y=36)和各部分内容的授课学时数(yi)计算出每部分权重系数(yi/Y)和权重后得分(Si),Si=100xiyi/XiY,然后将各部分的权重得分求和即得权重后总得分(S),S=∑Si,最后进行频数统计。

1.3.4 S-P(S,Student;P,Problem)表及模糊S-P表分析

经权重处理后的成绩,从146份试卷中随机抽取15份,客观题制作出S-P表,主观题制作出模糊S-P表,其中单选题目数量较多,从中随机抽取15题。先计算出每道题(P)的得分的隶属度,即得分除以该题总分,然后将每个学生所做每道题的隶属度求和(Xi),按大小排列;再将每道题不同学生得分的隶属度求和(Yi),按大小排列。最后按要求画出S线和P线[2]。

2 结果

2.1 题型及分值分布

试卷共5种题型,包括客观题和主观题两部分,客观题和主观题数量比为5∶1,分数比为5∶5,题型分值及分布详见表1。客观题是考查学生对基本概念及基本知识的掌握和理解的程度,侧重于小的知识点,但涉及到的知识面比较广;而主观题是考察学生归纳、总结、分析、理解和应用知识的能力。医学免疫学考试一般试卷中客观题和主观题数量比应为6～7∶3～4,分数比应为6∶4[3],结合本学科新进展多、概念名词多、知识点散而杂的特点,本次试卷增加了客观题的数量,但没有影响到分值的比例。

2.2 原始成绩分布

试卷满分100分,最高93.5分,最低31分,全距62.5分,平均成绩为75.7分,标准差11.6分,及格率93.2%。原始成绩频数分布见图1,显示呈负偏态分布,人数主要集中在70～90分数段之间。

2.3 加权成绩频数分布

最高90分,最低32分,全距58分,平均成绩为68.3分,标准差9.8分,及格率88.4%。加权成绩频数分布见图2,显示呈正态分布,人数主要集中在60～80分数段之间。

2.4 S-P及模糊S-P表

2.4.1 客观题S-P表分析

单项选择题(表2),差异量d=20/(15×15)<0.2,说明总体发挥稳定。S线中无较长的水平线,说明学生成绩无断层,优劣差异不大;P线中无较长的垂直线,说明题目难度差异适中;S线偏于表的右下方,说明学生总体对这部分内容掌握较好;P线偏于表的右下方,说明题目难度较低。每个学生的鉴别指数Ds(该生S线右边的数字之和与该生的Xi值的比值)<0.3,说明了每个学生的成绩都比较稳定,成绩是可靠的。传统试卷分析通过计算难度系数进行难度评估(表3),一般认为难度系数值为0.00～0.39的试题为难题,0.40～0.69为中等题,0.70～1.00为容易题,表3显示单选题多为容易题,中等难度题数目较少;与S-P表显示的题目难度评价结论基本一致。

多项选择题(表4),差异量d=10/(15×5)<0.2,说明学生总体发挥稳定,由于09、24、10和66号学生的鉴别指数Ds>0.5,显示这些学生的成绩并不稳定,可靠性欠佳,因此应对他们进行详细分析,查明原因,及时改进教与学中存在的问题。同样,S线偏于表的稍左上方,也证实总体上学生对这部分内容掌握不是很好,或许与题目难度较大有关;P线偏于表的左上方且有较长的垂直线,证实了这些题目难度较大且难度有差异。

2.4.2 主观题模糊S-P表分析

表5显示,在主观题中,差异量d=26/(15×9)<0.2说明总体发挥稳定。S线稍偏于表的右下方,有较长的水平线,说明总体对这部分内容掌握较好,但成绩有断层,优劣差异较大,有两极分化的趋势。20和21号学生的Ds>0.3,应该注意分析他们此次考试的发挥是否稳定、可靠,是否是偶然因素导致的发挥失常;63和10号学生的Ds>0.5,严重偏离整体水平,如果他们不是属于完全放弃、厌烦学习类型的学生,老师就应该通过和他们真心交流,找出适合他们的教学及学习方法,注意因材施教。P线稍偏于表的右下方,有较长的垂直线,说明尽管主观题难度不大,但不同学生作答起来会感觉到各题难度有一定差异。

3 讨论

3.1 成绩分析中的模糊性

考试分析包括试卷分析和成绩分析,其目的是对教与学这两个关键教学环节的实施质量进行评价,同时对教学改革提供可靠的依据。尽管分析过程受多方面因素的影响,但是命题过程中的试题结构和成绩分析过程中的分析方法,是两个非常重要的因素;只有在试题结构合理并且同时选用合适的分析方法的前提下才能做出客观、准确的分析结果。实际上试题结构中的难易题结构、主客观题结构较直观、容易调整,但内容结构容易被忽略;同一学科的不同内容其重要性、大纲要求程度等方面各不相同,所以导致各部分的授课时数也不相同,另外授课学时的不同也会影响到学生学习不同部分内容花费的时间,所以试题的内容结构一定要体现学时数的分配差异,成绩分析也必须考虑这一因素;否则,成绩分析就不一定能反映真实情况。从理论上讲,学时数会影响成绩分析的准确性,但影响程度到底有多大,这是一个模糊概念,如果用反映学时结构的权重系数将学时数的影响这一模糊概念进行量化处理,通过运用模糊评价技术对学生成绩进行分析,或许能改进并增加试卷分析的科学性、合理性和准确性。

3.2 加权处理对考试成绩的分布的影响

146份试卷中,90分以上8人,占5.48%;70～90分之间108人,占73.97%;70分以下30人,占20.55%;呈负偏态分布(图1)。全距62.5分,标准差11.6分,表现出学生学习水平存在参差不齐[3,4]。应用了权重系数对学生成绩进行了权重处理,处理后的结果显示成绩高峰人数是在60～80分之间,共109人,占74.66%;60分以下17人,占11.64%;80分以上20人,占13.70%;呈正态分布(图2)。有研究认为[5],频率分布的最高峰应在60～69分数段,呈正态或正态略偏右,分布较为正常,本结果显示权重处理后的成绩分布更理想,说明原始成绩正态略偏右分布有一定的合理性,与研究结论基本一致。全距和标准差可以说明学生差距,一般来说,在学校课程考试中考生水平接近,标准差一般在0.00～10.00之间,不会过大;百分制考试时,平均分一般在60～70分之间较为适宜,经过权重处理的成绩全距58分,较原始成绩的全距有所下降,加权后的平均成绩为68.3分,标准差9.8分,都在正常范围内,说明从整体看不存在学生水平参差不齐的情况。通过对权重处理后的成绩的分析说明此次考试比较理想,成绩具有稳定性和可靠性,体现了这种测评方法的可行性和合理性;同时也间接反映将原始分数直接用于分析以评价学习质量的做法有一定的局限性。因此根据授课学时数确定各章节知识点相应的权重,应用模糊理论的加权法对学生成绩进行分析,可以很好的改善分析效果。

3.3(模糊)S-P表分析在试卷质量分析中的优势

与传统的试卷分析方法以及单纯的难度系数分析相比,S-P表和模糊S-P表分析能更直观地衡量试题的难易水平和学生的发挥水平;对学生的总体发挥水平、个体发挥差异、有无学生优劣的断层、试题难度差异的大小以及总体中每个个体成绩的稳定性和可靠性等的分析结果准确清晰。另外,在表中也可以进行难度、区分度等经典统计指标的计算[5,6];但是难度系数值与传统方法计算值相符但不完全一致(表2、3),加大样本含量应该可以减小差距,其他指标也存在相同的问题,解决办法亦如此。分析认为,S-P表适合客观题的评价;而模糊S-P表可以考虑到答对程度即模糊隶属度对评价试题难易程度的影响,适合于主观题的评价。由表2、4和5可知在客观题和主观题中总体发挥都比较稳定,其中单项选择题和主观题题目难度较低,说明学生对内容掌握较好,而多项选择题难度相对较大。多选题和主观题中都有题目难度差异大的情况存在,学生在这两部分的发挥水平存在断层现象,说明学生成绩有两极分化的趋势,优劣差异明显。针对部分学生在多选题中的成绩不稳定情况应详细分析,根据学生状况的不同区别对待;如果是教师的原因应该及时改进教学方法。

3.4 对今后教学及命题工作的启示

医学免疫学的内容非常抽象,同时具有横跨性、网络性、实践性和进展更新快的特点[7],不可避免地会给学生概念多、头绪不清、压力较大的感觉。如果以免疫应答作为主线,进行整体免疫学教学设计,用现代化的教学设计理念建立学生为本的教学观,以促学为本实现教学目标的优化,选择并确定恰当的教学起点,创设促进学生学习的方法、条件、经验、情景、资源,注重学生的心理反应,建立促进学生全面发展的评价机制,适时打开师生交流通道,可有效激发学生对免疫学的学习兴趣,提高和发展学生的发散思维、综合分析能力,增强学生的创新、记忆能力[8]。其次,命题是教学评价、考查教学效果的重要环节,本研究结果提示,命题过程中要充分考虑学时数、掌握程度等能影响到题目内容结构的因素,尽量使题目内容结构合理化,既要覆盖面广又要做到重点突出;由于掌握程度的结构也会直接影响成绩分析的结果,所以命题时应充分考虑大纲的要求,掌握内容占75%,熟悉内容占15%,了解内容和本学科进展内容占10%。如果应用模糊理论也将这一影响因素由定性描述进行模糊化处理为定量分析,将其评价结果作为上一级评价因子,与学时结构相结合形成层次式模糊评价,同时定性评价与定量评价相结合,进行全面的、辩证的、综合的分析,将可能会作出更为科学的评价。

摘要：目的将模糊理论应用于医学免疫学试卷分析,为教学评价提供更准确的反馈信息。方法运用模糊理论的权重方法、S-P表及模糊S-P表处理和分析成绩。结果经权重处理后的成绩分布更合理,(模糊)S-P表分析成绩能更直观、全面地说明学生发挥水平和题目难度的差异。结论模糊理论屏蔽了试题结构对成绩分布的影响,有助于实现试卷分析的优化策略,使医学免疫学试卷分析结果更科学、更准确、更直观。

关键词：模糊理论,医学免疫学,试卷分析

参考文献

[1]LIU MY,LI P,YANG LJ,et al.The research and realization of score distribution normal testing[J].New West,2007,8:242-243.Chinese

[2]ZHANG X,XU J,ZHANG J.Application of table S-P in testing result assessment of students[J].Journal of Beijing Union University,2007,2(21):5.Chinese

[3]ZHAOX,WANGL,ZHENGHY,etal.Analysis on quality of Histology and Embryology test paper[J].Chinese Journal of Anatomy,2007,30(5):666-668.Chinese

[4]NIE Z,LIU XG.Investigation and evaluation of regional anatomy paper[J].Sichuan Journal of Anatomy,2008,16(4):55-56.Chinese

[5]CHENG Z,ZHANG Z,LI G,et al.Application of F-S-P stable on the analysis of test papers[J].China High Medical Education,1994,6:33-35.Chinese

[6]WANG D,CHEN LM,YE ZM,et al.The experience of paper quality analysis with principles of education measurement[J].China Journal of Modern Medicine,2003,13(19):154-156.Chinese

[7]SHANGHS.On strengthening characteristics inbachelor,sImmunology teaching[J].Chinese Journal of Immunology,2000,(3):169.Chinese

免疫模糊篇3

关键词：永磁同步电动机,递归模糊神经网络控制器,免疫遗传算法,矢量控制

1 引言

永磁同步电动机(PMSM)具有体积小、损耗低、响应快、效率高、可靠性好以及对外界环境适应性强等优点,目前在高性能电气传动系统中得到广泛的应用。但由于它的多变量、严重非线性、参数时变及耦合性强,往往还受到负载干扰、自身的非线性等诸多不确定因素影响,导致其抗干扰能力差,影响PMSM控制性能。PMSM矢量控制是一种高性能的控制策略,但控制性能的好坏主要取决于控制器的设计。传统的PI控制器是以被控对象的数学模型为设计依据,尽管其控制算法简单、鲁棒性好,并有一定的控制精度,但它毕竟是一种线性控制,不能很好地满足存在严重非线性的PMSM系统高精度、快响应的要求。为此,本文结合模糊逻辑控制和神经网络的优缺点,以递归模糊神经网络取代原来的BP网络,形成一种新的模糊神经网络——递归模糊神经网络(RFNN),将RFNN控制器作为速度调节器应用于PMSM矢量控制调速系统中,并利用免疫遗传算法(IGA)在线优化RFNN控制器中的参数。仿真结果表明,本文设计的模糊神经网络速度控制器应用于永磁同步电动机矢量控制系统,能实现精确的速度控制,具有良好的抗干扰性能和较强的鲁棒性。

2 PMSM数学模型

图1是1台2极永磁同步电动机的空间矢量图。矢量控制的基本原则是把电动机的定子电流分解为直轴电流分量id和交轴电流分量iq 。对永磁同步电动机来说,一种有效的矢量控制策略就是通过保持定子电流的直轴分量id为零,电磁转矩与定子电流的交轴分量iq成正比,以实现良好的线性解耦控制效果。

永磁同步电动机的d-q轴模型的电压方程为

$[\begin{array}{l} u_{d} \\ u_{q} \end{array}] = [\begin{matrix} R_{s} & 0 \\ 0 & R_{s} \end{matrix}] [\begin{array}{l} i_{d} \\ i_{q} \end{array}] + [\begin{matrix} \frac{d}{d t} & ω_{r} \\ - ω_{r} & \frac{d}{d t} \end{matrix}] [\begin{array}{l} Ψ_{d} \\ Ψ_{q} \end{array}] (1)$

永磁同步电动机的磁链方程为

$[\begin{array}{l} Ψ_{d} \\ Ψ_{q} \end{array}] = [\begin{matrix} L_{d} & 0 \\ 0 & L_{q} \end{matrix}] [\begin{array}{l} i_{d} \\ i_{q} \end{array}] + [\begin{array}{l} Ψ_{f} \\ 0 \end{array}] (2)$

永磁同步电动机的电磁转矩为

Te=1.5p[Ψfiq+(Ld-Lq)idiq] (3)

式中:ud,uq为d,q轴定子电压;Rs为d,q轴定子三相绕组电压;Ld,Lq为d,q轴定子绕组电感;p为电机极对数;Ψf 为永磁体磁链;ωr为转子电角速度。

3 基于IGA优化的递归模糊神经网络控制PMSM矢量调速系统

3.1 系统原理与结构

在分析永磁同步电动机数学模型基础上,本文设计的基于递归模糊神经网络速度控制器的PMSM矢量控制系统结构模型如图2所示。

该控制系统包含一个速度外环和两个电流内环,电流环通过对id和iq 的解耦控制实现转矩控制。速度环的作用是增强系统抗负载扰动的能力,并决定系统的运行性能。利用递归模糊神经网络控制器取代速度环上传统的PI控制器,作为永磁同步电动机闭环矢量控制系统的转速调节器,并采用免疫遗传算法在线优化递归模糊神经网络的参数,从而极大地提高了系统的响应速度、控制精度及鲁棒性能。

调速系统采用交-直-交电压源型变压变频技术方案,PWM技术使用空间矢量脉宽调制法,目的是减少逆变器输出电流的谐波成分及电机的谐波损耗,降低转矩脉动,从而使永磁同步电动机获得幅值恒定的圆形磁场,即正弦磁通。

3.2 递归模糊神经网络控制器

本系统采用具有研究动态特性的递归模糊神经网络(RFNN)控制器结构如图3所示。

它是由4层BP网络组成,即输入层、模糊化及递归层、规则层、去模糊化及输出层,其中在第2层引入递归神经元,递归神经元有内部反馈连接,它以反馈连接的形式存储内部信息,使网络输出不仅取决于当前输入,而且还取决于过去的输入和输出,从而形成局部或全局递归的网络结构,能够有效地处理动态系统的非线性映射问题,具有较快的收敛速度和较少的神经元数目,并进一步简化了网络模型。

第1层:输入层。将输入矢量x=[e,ec]T引入网络,每个神经元的输入量均换算在模糊域[-1,1]内。此层输出节点为

O $_{i}^{(1)}$ =I $_{i}^{(1)}$ =xii=1,2 x1=e x2=ec (4)

第2层:模糊化及递归层。模糊化输入变量,每个输入采用5个模糊语言变量{PB,PS,0,NS,NB}表示,分别为模糊集的负大、负小、零、正小、正大,计算各输入分量属于各语言变量值模糊集合的隶属度函数。这里隶属度函数采用高斯基函数来表示。该层共有10个节点,其输出节点为

O $_{i j}^{(2)}$ =μij(xi)=exp[-(I $_{i j}^{(2)}$ -a $_{i j}^{2}$ )2/b $_{i j}^{2}$ ] (5)

其中 I $_{i j}^{(2)}$ =O $_{i}^{(1)}$ i=1,2 j=1,2,…,5

式中,aij,bij分别为高斯基函数的中心和宽度,此层每个节点都具有相同结构的递归节点,此层输入节点为

式中:rij为递归单元的连接权;O $_{i j}^{(2)}$ (t-1)为该层前一时刻的输出。

第3层:模糊控制规则层。“∏”表示模糊AND操作,这里用“×”乘积实现模糊集的“AND”运算。此层共有25个节点,其输入节点为

$\begin{array}{l} Ι_{k}^{(3)} = Ο_{1 k_{1}}^{(2)} \times Ο_{2 k_{2}}^{(2)} \\ k_{1} = k_{2} = 1, 2, \dots, 5 \\ k = k_{1} k_{2} = 1, 2, \dots ‚ 25 \end{array} (7)$

输出节点为

O $_{k}^{(3)}$ =I $_{k}^{(3)}$ (8)

第4层:去模糊化及输出层。实现解模糊操作,计算所有规则的输出之和,并作归一化处理。此层输入节点为

$Ι^{(4)} = \sum_{k_{1}, k_{2} = 1}^{5} Ο_{1 k_{1}}^{(2)} Ο_{2 k_{2}}^{(2)} \times ω_{k_{1} k_{2}} = \sum_{k = 1}^{25} Ο_{k}^{(3)} \times ω_{k} (9)$

$u = Ο^{(4)} = \frac{Ι^{(4)}}{\sum_{k_{1}, k_{2} = 1}^{5} Ο_{1 k_{1}}^{(2)} Ο_{2 k_{2}}^{(2)}} = \frac{Ι^{(4)}}{\sum_{k = 1}^{25} Ο_{k}^{(3)}} (10)$

式中:ωk 为第3层(规则层)与第4层(输出层)之间的连接权值。

3.3基于IGA优化的递归模糊神经网络控制器的实现

由于递归模糊神经网络的梯度信息不容易获取,所以基于非梯度的遗传算法成为递归模糊神经网络学习的重要手段之一。免疫遗传算法(IGA)是近年来基于生物免疫机制的一种改进遗传算法,是一种新型的计算智能方法,它是在遗传算法的基础上融合了生物免疫系统的抗原识别、抗体多样性、免疫记忆、浓度控制等机制。解决实际问题时,在保持抗体多样性的情况下,找出针对该抗原的抗体,即问题的解。与标准遗传算法相比,IGA具有以下显著优势:1)免疫记忆功能。该功能可以加快搜索速度,提高遗传算法的总体搜索能力;2)抗体多样性保持功能。该功能可以提高遗传算法的局部搜索能力;3)自我调节功能。该功能可提高遗传算法的局部搜索能力,避免陷入局部最优解。

本系统中,免疫遗传算法的输入为参考模型的输出ωr 与转子实际输出电角速度ω之间的偏差e及其偏差变化率ec。先将递归模糊神经网络控制器作为系统转速调节器,再利用免疫遗传算法在线优化递归模糊神经网络参数,其中包括第3～4层间的连接权值ωk、第2层的高斯函数的中心值aij 和宽度bij以及第2层的递归单元的连接权rij、第2～3层之间的连接权值ωjk等。因此应用免疫遗传算法对网络进行训练,在线优化和调整上述参数,能使递归模糊神经网络控制器具有良好的控制性能,并且对系统参数变化和外界负载扰动具有较强的鲁棒性。

4 IGA算法的设计与实现

IGA算法的设计与实现有如下几种。

1)读入初始化条件,将给定的特定问题视为抗原,并对其进行具体分析,找出最基本的特征信息,确定待优化变量aij , bij,ωk,rij等。

2)确定IGA的运行参数:群体规模Mpop=30,交叉概率Pc=0.8,变异概率Pm=0.02。

3)产生初始群体(抗体)并编码。如果是记忆中的抗原,则从记忆细胞中取出相应的抗体组成IGA的初始群体,否则随机生成初始群体。选择一定的编码方案(本文采用十进制)对其编码,组成基因码串,每一码串代表一个个体,表示优化问题的一个解。本系统可选择(aij,bij,ωk,rij)为每一抗体对应的网络结构参数,共有m组(s=1,2,…,m)作为初始抗体群体。

4)适应度计算。按编码规则,计算每个抗体的适应度。由于进化只能向着使适应度函数值增大的方向进行,因而适应度函数是以构造目标函数倒数的形式。设抗体Ps对应的网络的能量函数为Es,则适应度函数Fs为

$F_{s} = \frac{1}{E_{s} + ξ} (11)$

$E_{s} = \frac{1}{2 Μ} \sum_{n = 1}^{Μ} \sum_{j = 1}^{Ο} (Τ_{j}^{n} - Y_{j}^{n})^{2} (12)$

式中:ξ为大于0的常数;M为训练样本(抗体)总数;O为输出节点数;T $_{j}^{n}$ ,Y $_{j}^{n}$ 分别为第n个训练样本在第j个输出节点的期望输出和实际输出。

5)演变记忆细胞。若是新抗原,则利用当前种群中适应度高的抗体替换记忆细胞中适应度低的抗体;否则,将当前种群中适应度高的抗体加入记忆细胞中。

6)抗体的促进和抑制。计算当前种群中适应度值相近的抗体浓度,即相近抗体数与群体总数的比值。若抗体的浓度较高,则减小抗体的选择概率(即抑制);反之,则加大抗体的选择概率(即促进),以此来保持种群中个体的多样性。

7)抗体进化操作(交叉和变异)。按交叉概率Pc和变异概率Pm进行与标准遗传算法(SGA)相同的交叉和变异操作,对产生的新一代群体重新进行评价、选择、交叉和变异等操作,如此循环重复,不断提高群体最优抗体的适应值和平均适应值,直至最优抗体的适应值达到规定的范围,或最优抗体适应值和群体抗体的平均适应值不再提高,同时满足各项约束条件,则其迭代过程收敛,便输出结果,IGA算法结束。

5 仿真结果分析

分别用传统PI控制器和递归模糊神经网络(RFNN)控制器作为永磁同步电动机(PMSM)矢量控制系统的转速调节器,应用Matlab/Simulink建立PMSM矢量控制系统的仿真模型,并进行仿真实验。仿真中永磁同步电动机参数为:额定功率500 W,额定相电压220 V,额定转速1500 r/min;定子d轴电感Ld=0.027 H,q轴电感Lq=0.067 H,定子相绕组电阻Rs=4.495 Ω,转动惯量J=0.001 79 kg·m2,极对数为2。电流调节器选用PI调节器,其参数Kp=2 ,Ki=35。系统在给定转速nr=1 500 r/min,负载转矩TL=2 N·m时启动,并在t=0.7 s时给电机加一个10 N·m负载,其响应曲线如图4所示。

图4中,曲线①、②分别表示PI控制器和RFNN控制器作用下的转速响应曲线。从图4中可以看出,无论是响应速度还是超调量,曲线②均优于曲线①,说明递归模糊神经网络控制器能对被控对象实现较好的控制效果。

为了测试在应用免疫遗传算法优化方法后递归模糊神经网络控制器的控制性能,仿真时给定速度指令和负载转矩设置仍同上。图5a、图5b分别为该情况下的转速响应曲线和转矩响应曲线,可以明显观察到转速在达到稳态时仅比给定转速的指令值略有下降,大约在1 448 r/min,误差很小。图5b中转矩曲线变化比较平滑,即使在负载发生突变时转矩变化也较平缓,超调量较小。仿真结果表明,基于IGA的递归模糊神经网络控制器与常规PI控制器和RFNN控制器相比,能更好地适应被控参数变化,具有更快的响应速度、更高的稳态精度和更强的抗扰动能力,显示其很强的鲁棒性。

6 结论

以基于免疫遗传算法的递归模糊神经网络控制器取代传统的PI控制器应用于永磁同步电动机的矢量控制系统,使用该控制器作为速度调节器对永磁同步电动机进行精确的速度控制。仿真实验结果表明,该方法得到的各项性能指标均优于PI控制和递归模糊神经网络控制方式,具有很好的适应性和很强的鲁棒性,取得了比较理想的控制效果,从而为实现永磁同步电动机的智能化调速控制提供了切实可行的技术方案。

参考文献

[1]王丽梅,田明秀,王力.永磁同步电动机的神经网络模糊控制器设计[J].电气传动,2006,36(8):34-37.

[2]龚晓峰,薛琪伟.神经网络和模糊算法相结合的永磁同步电动机的鲁棒控制[J].中小型电机,2005,32(3):14-17.

[3]曹先庆,朱建光,唐任远.基于模糊神经网络的永磁同步电动机矢量控制系统[J].中国电机工程学报,2006,26(1):137-141.

免疫模糊篇4

常规数字PID在数字直流电机调速系统中应用最广,但是PID参数的整定主要采用试凑法,导致控制性能非优化,控制精度难以提高[1,2]。基于神经网络PID控制器利用较强的非线性拟合能力实现PID参数的在线整定和优化[3,4,5],但需要大量训练样本数据,控制算法较复杂,嵌入式系统实现较困难[6,7,8]。模糊PID控制器利用专家的经验建立PID整定模糊查询表,具有不依赖于对象模型、控制结构简单、可靠性高、易于工程实现等优点,但控制精度受专家经验影响较大,当电机负载运行或电机受到干扰时,电机的响应速度较慢,很容易出现振荡[9,10,11]。

生物免疫系统反馈机制实际上就是一个自适应非线性P控制器,能逼近非线性函数[12,13]。模糊免疫PID控制器把非线性P控制器与模糊PID相结合,克服了模糊PID控制器在强干扰或具有高度非线性和不确定性时调节随动性差的缺点,大大改善了控制器的性能。在基于DSP的直流电机控制试验平台上构建模糊免疫PID控制模块进行样机试验,试验表明系统的控制品质具有良好的动态指标,基本实现无超调输出。

2 模糊免疫PID控制器设计原理

免疫控制器原理实际上就是一个非线性P(比例)控制器,P的控制器输出相当于抗原刺激的T细胞输出TH(k),外来干扰TS(k)相当于细菌,根据免疫系统的免疫原理,免疫系统要产生抗原来吞噬入侵外来干扰源即细菌,因此免疫系统产生的输出为

其中TH(k)=k1ε(k)

式中:ε(k)为第k代抗原数量;k1,k2为比例常数;f(·)为一个非线性函数。

以抗原的数量ε(k)作为非线性P控制器控制误差e(k),免疫系统总刺激S(k)作为控制器输入u(k),则有如下的反馈控制规律:

式中:k1为控制反应速度;η为控制稳定效果,η=k2/k1。

f(u,△u)采用模糊控制器非线性逼近,即每个输入变量模糊化为一个模糊集合,取两种值:分别是“正”(P)和“负”(N);每个输出变量模糊化为一个集合,取3个值,分别是“正”(P),“零”(Z)和“负”(N)。以上隶属函数都定义在整个(+∞,-∞)区间。模糊控制器可采用以下4条逼近非线性函数f(u,△u)规则:

1)If u is P and△u is P then f(u,△u)is N

2)If u is P and△u is N then f(u,△u)is Z

3)If u is N and△u is P then f(u,△u)is Z

4)If u is N and△u is N then f(u,△u)is P

采用查德[14](Zadeh)的模糊逻辑与(AND)操作,并采用常用的求最大隶属度平均法来得到模糊控制器的输出f(u,△u)。

由于非线性P控制器不能消除积分累计误差,因此,需要结合PID控制器组成模糊免疫PID控制器,定义控制误差为

式中:error(k)为第k次采样误差;rin(k)为第k次采样输入;yout(k)为第k次采样输出。采用增量式PID控制器,其3项输入为

PID输出控制算法为

式中:kp,ki,kd分别为比例系数、积分系数和微分系数。

将PID控制器输出U作为免疫反馈模型中的外界物质即抗原量ε(k),则得到模糊免疫PID控制器,其比例系数为

kp1=k1[1-ηf(u(k),△u(k))]

其控制算法表示为

当k1增大时,响应的速度会加大,系统快速性会变好,η增大时,系统超调量会减小,相对稳定性会变好,合理的整定k1和η能使控制系统具有较短的响应时间和超调量。模糊免疫PID控制框图如图1所示。

模糊免疫PID控制器以反馈信号与给定信号之差e和误差变化率△e作为模糊控制器的输入量,经过模糊推理和决策后更新ki,kp值,即得到PID控制器输出量Uc,Uc和其变化率作为免疫调节器的输入,经过免疫环节调节后产生新的P变化量(△KP),再送给PID控制器更新KP,PID控制器再产生新的Uc,用这种闭环不断优化的Uc去控制直流电机。

3 模糊免疫PID试验系统模型

直流电机传递函数为

式中:Ue为电枢额定电压;Ie为电枢额定电流;R为电枢电阻;J为电机转子转动惯量;ne为额定转速;B为电机和负载的粘性阻尼系数;La为电枢电感,Φ为励磁磁通量;CT为转矩系数;Ce为电机电势系数。

对直流电机传递函数进行Z变换,其差分方程为

其中

式中:T为采样周期。

试验所用稀土调速直流伺服电机,铭牌参数如下:额定功率Pe=0.2 k W,额定电压Ue=48 V,额定电流Ie=5.2 A,额定转速ne=1 500 r/min。转动惯量J=3.527×10-3kg·m2,电枢电感La=2 m H,电机电枢内阻R=1.2Ω,额定转矩1.2 N·m。

试验系统采用双闭环,外环为位置环,内环为电流环,位置环采用模糊免疫PID控制,电流环采用PI控制,位置环和电流双闭环结构框图如图2所示。

模糊免疫PID算法主程序调用模糊免疫PID控制算法子程序运算得出控制量Uc(k),把Uc(k)作为直流电机差分方程式(11)的输入,最后调用稀土直流伺服电机差分方程产生系统输出响应。主程序流程图如图3a所示。模糊免疫PID算法子程序流程图如图3b所示。

4 试验结果

以TI公司的数字信号处理器TMS320LF2407为控制器对稀土直流伺服电机进行试验,试验采用H桥驱动。位置反馈采用码盘,DSP捕获码盘计数脉冲,并计算出位置误差和误差变化率作为控制器输入,在事件单元(EVA)转化为占空比不同的方波来实现对电机的控制。

模糊免疫PID算法优化出位置环PID参数为:kp=368.1,ki=10.4,kd=2 040。电流环优化出PI参数为:kp=3.375,ki=0.607 5。PWM输出频率为2k Hz,电流环采样周期为10μs,位置环采样周期为1 ms。编码器为1 000线。

试验方法为:加速度1 000 rad/s2,加加速度40 000 rad/s3,目标速度1 000 r/min,负载1 N·m。采用S型位置参考曲线控制电机,电机运动轨迹为先正向运行60 rad,等待100 ms后再反向运行60 rad,依次循环。上位机采用Labview编写,通过串口与DSP进行通信,将DSP测试数据传送到Labview界面上连续显示。随机截取Labview控制界面上伺服系统在免疫PID算法和模糊免疫PID算法下的参考位置与实际位置、参考速度与实际速度响应曲线,分别如图4和图5所示。从图4和图5可看出,左边一栏记录数据是实际测试值,右边一栏记录数据是参考设置值,由此可得出系统跟随误差分析结果如表1所示。

由表1可知,在S型位置参考曲线模式下运行,模糊PID控制器位置跟随误差最大约为4.3%。在电机到达最大正负位置或者换向时有很大振荡和噪声。而模糊免疫PID控制器的位置跟随误差大大减小,最大约为0.023%,基本上准确到位,而且定位过程平稳不过冲。因此,模糊免疫PID控制器具有较好的动态跟随性,电机加速或者减速时间短,而且在任意位置运行平稳无噪声,可大大减缓柔性冲击,保持较高的控制精度。

5 结论

免疫模糊篇5

入侵检测系统是一种主动的安全防护系统, 它通过对网络流量或主机运行状态的检测来发现对系统资源的非法授权访问与破坏行为, 并对各种恶意攻击做出响应。入侵检测方法主要分为异常检测和误用检测两种。当前的研究热点是异常检测技术。聚类分析是一种重要的异常检测方法。它利用某种相似性度量, 把一个未知类别的样本集组织成若干个有意义的子集, 要求相似度较高的样本尽量归为一类, 而不相似或相似度较小的样本则在不同的类中[1]。

由于在一般的网络环境内, 正常行为是主流, 而入侵则表现为个别现象, 因此获得的正常实例的规模远大于入侵行为的数目。入侵检测中的异常检测模型假定所有的入侵活动都是异常活动, 由于在合理的尺度条件下属于同样类别的数据实例在特征空间中互相接近, 而不同类别的数据实例则相互远离, 因此可以将聚类算法应用于入侵检测。通过这样的划分, 可将网络流量样本集中的正常流量和异常流量区分开来。

目前普遍采用的聚类算法是模糊C-均值聚类 (FCM) 算法。但是其主要缺点是对初始值过于敏感, 要求输入聚类的数目, 并且只能处理数值属性, 而网络中的数据不仅有数值属性, 还有分类属性。本文利用人工免疫网络aiNet算法能够自动生成聚类的优点, 提出基于人工免疫网络和模糊C-均值的AiNet_Fcm入侵检测方法。

1 FCM算法

假设给定数据集X={x1, x2, …, xn}, 模糊C均值算法把n个数据集对象划分为c个子类, 并给每个子类定义一个聚类中心, 然后根据数据集中的每个数据对象与聚类中心的距离, 形成一些具有相同性质的模糊子集, 每一个数据对象与聚类中心有一个隶属度, 并使得非相似性指标的目标函数达到最小。FCM采用模糊划分的方法, 使得每个给定数据对象用[0, 1]间的隶属度来确定其属于各个子类的程度。用uij表示数据集中的第i个样本隶属于第j个类的隶属度。设第j个类的聚类中心向量为vj, 则定义目标函数为:

$J (U, V) = \sum_{i = 1}^{n} \sum_{j = 1}^{c} u_{i j}^{m} ∥ x_{i} - v_{j} ∥^{2} (1)$

其中m (m>1) 是模糊指数。该目标函数实际表征了各条样本到聚类中心的加权距离平方和, 其值越小, 表明各类中样本依附于它们的聚类中心就越紧密。聚类问题就是求使J (U, V) 最小的隶属度矩阵U = [ui j]n×c及类别中心v= (v1, v2, …vc) 。

计算隶属度uij:

$u_{i j} = \frac{[\frac{1}{∥ x_{i} - v_{j} ∥^{2}}]^{\frac{1}{m - 1}}}{\sum_{j = 1}^{c} [\frac{1}{∥ x_{i} - v_{j} ∥^{2}}]^{\frac{1}{m - 1}}} (2)$

更新聚类中心:

$v_{j} = \frac{\sum_{i = 1}^{n} u_{i j}^{m} x_{i}}{\sum_{i = 1}^{n} u_{i j}^{m}} j = 1, 2, \dots, c (3)$

2 一种改进的AiNet算法[2]

AiNet 是由De Castro提出的一种人工免疫网络模型。该模型模拟生物免疫系统中抗体克隆和选择过程。aiNet实际上是一个加权图, 该图由一组不完全连接的称为抗体的节点组成, 每对节点产生一条边, 每条边上都赋有权值。aiNet模型的最终目的是建立一个记忆集合, 用来识别和表示数据结构组织, 它主要用于减少数据冗余等。

为了使抗体集合尽可能反映所有的抗原分布情况, 添加一步, 即在每个抗原作用于抗体集合时, 与该抗原有相同特征的抗体都有机会进入临时抗体集合中;并且为了获得稳定的抗体集合, 在变异过程中, 改用退火变异, 即随着循环次数的增加, 变异的概率逐渐降低。

3 基于AiNet和FCM的入侵检测算法

基于聚类的入侵检测方法建立在以下两个假设之上: (1) 正常行为的数目远远大于入侵行为的数目; (2) 入侵行为和正常行为差异非常大。该方法的基本思想就是由于入侵行为和正常行为不同并且数目相对较少, 它们在检测的数据中呈现出比较特殊的特性。

AiNet_Fcm入侵检测方法主要包括三部分。

3.1 aiNet_FCM聚类算法

FCM算法是通过对基于欧氏距离度量的目标函数的极小值而得到最终的分类结果, 但是这类基于目标函数的聚类算法存在的最大问题就是对聚类先验知识要求的增加, 因为在聚类分析之前, 必须给定聚类原型的类型以及聚类的类别数c, 否则将会对算法产生误导, 得到的聚类效果不好, 从而得不到数据集的正确划分。而AiNet模型模拟生物免疫系统中抗体克隆和选择过程, 引入了亲和度成熟、克隆和记忆机制, 并利用相应的算子保证了该算法能快速的收敛到全局最优解。在模型中, 把输入的数据集作为抗原, 最终输出的抗体作为聚类中心, 就能够得到数据集的一个较好的聚类中心和聚类数目。这样就弥补了FCM算法的缺点。

结合AiNet和FCM, 可得到基于人工免疫网络的模糊C均值 (AiNet_FCM) 聚类算法流程:

(1) 使用AiNet算法的到数据集的一个初始聚类中心和聚类数目。

aiNet算法将数据集X作为抗原集合, 生成的抗体集合则作为聚类结果。抗原与抗体之间, 以及抗体与抗体之间的亲和度由它们之间的欧氏距离决定, 距离越大, 亲和度越低。算法结束时, 以生成的抗体集合作为FCM算法的初始聚类中心, 抗体的数目作为聚类数目。

(2) 利用式 (1) 中的聚类中心和数目运行FCM算法, 得到最终的聚类中心和聚类。

3.2 标类算法[6]

在聚类生成之后需要对其进行标类。由算法的2个假设可以推测在最后生成的聚类中, 如果某个聚类为正常数据所聚集成的, 那么它包含的数据数目应该远远大于那些由入侵数据聚集成的聚类所包含的数据数目。因此, 可以将所有的类按其中包含的数据量大小排序, 并设定一个比例常数N (异常类比, 异常类在总聚类数目中的比例) , 那些位于N以下包含较少数据量的类被判定为异常, 其余的类为正常。假设Ci, i=1, 2, …, K为已生成的聚类, N∈ (0, 1) 为异常类比。标类算法的描述如下:

(1) Sort (Ci) , 按Ci中包含数据的多少降序排列;

(2) 对于每一个聚类Ci:

如果i<K× (1-N) , 则将Ci标为正常类;

否则将Ci标为异常类。

3.3 异常检测算法

异常检测算法的描述如下:

假设x是一个要检测的网络数据包:

(1) 将x进行预处理;

(2) 找出x与所有聚类中心Ci距离的最小值min_dist及所对应的Ci;

(3) 如果有min_dist大于某个检测阈值, 则认为此数据包为入侵数据包, 报警;

(4) 若Ci为正常数据类, 则x为正常数据包, 否则为入侵数据包, 报警。

4 实验及结果分析

为评价基于AiNet_FCM的入侵检测方法的性能, 本文采用KDD CUP99[3]数据集进行了测试实验。该数据集包含四大类入侵类型, 即Probing、R2L、U2R和DoS。为了满足检测算法的两个假设的需要, 需要对KDD CUP99数据集作一些过滤。所以, 从整个数据集中提取10100条记录作为训练样本集, 其中含有入侵数据100条, 符合检测算法的第1个假设的要求。在整个训练集中入侵类型及数目如表1所示。

在测试样本集的选取中, 共选取了3组数据:第一组测试样本集选自训练样本集。第二组和第三组则选自KDDCUP99数据集中除去训练样本集以外的数据, 并且在选择时特意选择了不在训练样本集中的入侵数据, 即这两组测试样本集包含有未知的入侵。

因为KDD CUP99数据集中每条记录有41个属性, 既包括数值属性, 又包括分类属性。并且数值属性的度量标准不同, 直接进行聚类处理将产生不真实的结果, 所以要对它们进行数据的预处理。

4.1 属性的选取

数据集中每条记录有41个属性, 其中数值属性34个, 分类属性7个。但是并不是每个属性都对检测结果有贡献, 文献[4]中用支持向量机方法通过实验指出KDD CUP99数据集中有13个属性最为重要, 其中11个数值属性, 2个分类属性。实验采用了该属性选取方案。

4.2 分类属性处理

在选取的13个属性中, 有2个分类属性, 由于FCM算法不能直接处理分类属性, 因此, 可以把分类属性转换成数值属性, 处理方法是对其进行编码, 对于有m种不同取值的分类属性, 用m bit对其进行编码, 当且仅当属性取值为第i种值时, 其码字中的第i bit为1, 其余bit 为0[5]。如属性protocol_type有3种取值, 则可编码为:tcp 001, udp 010, icmp 100。但是另一个分类属性有66种取值, 若直接编码, 则带来输入矢量过大的问题, 因此, 本文选取取值最多的3个编码:ecr_i 0001, private 0010, http 0100, 其他的所有都编码为1000。

4.3 数值属性的处理

对于数值属性来说, 不同的数值属性有不同的度量标准, 如果直接对原始数据不进行预处理就有可能产生大数吃小数的问题。为了解决这一问题, 要对数值属性进行一些规范化处理。

4.3.1 标准化

$x^{'}_{i j} = \frac{x_{i j} - \bar{x_{i j}}}{s_{j}}$

其中 $\bar{x_{j}} = \frac{1}{n} \sum_{i = 1}^{n} x_{i j}$ , $s_{j} = \sqrt{\frac{1}{n} \sum_{i = 1}^{n} (x_{i j} - \bar{x_{i j}})^{2}}$ , xij为第i个数据的第j个属性。经过标准化变换后, 各个属性的均值为0, 但是其取值很可能大于1, 若取值大于1, 则通过正规化变换把各个属性的取值范围为[0, 1]。

4.3.2 正规化

正规化变换的公式为:

$x^{″}_{i j} = \frac{x^{'}_{i j} - m i \underset{1 \leq i \leq n}{n} (x^{'}_{i j})}{m a \underset{1 \leq i \leq n}{x} (x^{'}_{i j}) - m i \underset{1 \leq i \leq n}{n} (x^{'}_{i j})}$

其中x′ij标准化后的第i个数据的第j个属性, $\max_{1 \leq i \leq n} (x^{'}_{i j})$ 数据的第j个属性的最大值, $\min_{1 \leq i \leq n} (x^{'}_{i j})$ 数据的第j个属性的最小值。

对于网络中的每个数据包, 都按照上述方法对它的属性进行计算, 并得到新的数据计算欧氏距离, 可避免数值属性度量标准不同带来的影响。

4.4 实验结果及分析

在实验中, 为了评价算法的性能, 对相关统计量做如下定义:

异常类比N 异常类在总聚类数目中的比例;

检测率D 检测出入侵的数目与测试集中总的入侵数目的比值;

误警率E 检测为异常的正常数目与测试集中所有正常数目的比值。

检测率和误警率是入侵检测系统最重要的性能指标, 检测率与误警率总是紧密相关的, 增加检测率常常要以误警率的增加为代价, 而误警率偏高使系统对原本不是攻击的事件产生了错误的警报, 将导致入侵检测系统的性能降低, 因此只能在两者之间取折衷的选择。表2是对不同的异常类比N的实验结果。

由表2可以看出, 当异常类比为25%时, 算法的整体性能较好, 因此, 本文固定此阈值测试算法对未知攻击的检测性能。当异常类比为25%时, AiNet_Fcm算法对于测试集的平均检测率和误警率为82.9%和1.62%。此外可以使用普通的FCM聚类算法进行异常检测实验, 数据的预处理采用本文的方法处理, 得到的平均检测率和误警率为67.8%和3.17%。通过比较可知, 在入侵检测上, AiNet_Fcm算法比普通的FCM算法结果更为理想。

表3显示了当N=25%时算法在测试集2和测试集3上对已知和未知攻击的检测情况。所谓已知攻击是指在测试集和训练集中都包含的攻击类型 (表1中列出的入侵类型) , 未知攻击是指在测试集中包含但训练集中没有的攻击类型。

从表3可以看出, 算法对DoS和Probing入侵的检测效果较好, 但是对于U2R和R2L的检测效果不是很理想, 主要原因有两个:

(1) R2L、U2R攻击, 不像DoS、Probing那样在短时间内对一些主机发出很多连接, 它们嵌入到包中, 正常情况下只存在于一个连接中, 无法对其进行足够的特征描述。

(2) Probing、DoS攻击相对来说比较固定, 而R2L、U2R类攻击种类较多, 且有很多的R2L入侵伪装合法用户身份进行攻击, 这就使得其特征与正常数据报比较类似, 造成算法的检测率偏低。但总体来说, 算法对未知攻击的检测率在40%以上, 说明其能够比较有效的检测未知攻击。

5 结论

本文分析了基于人工免疫网络和模糊C-均值的异常检测的可行性, 给出了该检测方法的流程和混合型属性的数据与处理方案, 并利用KDD CUP99实验数据集进行了仿真实验, 证明该方法能取得较高的检测率与较低的误警率, 尤其是在对DoS、Probing攻击的检测中取得了满意的检测结果。但是算法对其他两种攻击类型的检测效果不理想, 异常类比N需要人工干预, 因此下一步的研究重点是如何提高U2R和R2L两种类型的检测率和如何自动找到合适的参数N。

参考文献

[1]Jiawei Han.Micheline Kamber Data Mining:Concepts and Techniques[M].Morgan Kaufman, 2005.

[2]钟将, 吴开福, 吴开贵, 等.基于人工免疫网络的动态聚类算法[J].电子学报, 2004, 32 (8) :1268-1272.

[3]http://kdd.ics.uci.edu/database/kddcup99/kddcup99.html.

[4]Mukkamala S, Janoski G, Sung AH.Intrusion Detection Using SupportVector Machines and Neural Networks[C].Washington DC Proc.of theIEEE Int’l Joint Conf.on Neural Networks, 2002:1702-1707.

[5]黄斌, 史亮, 姜青山, 等.基于孤立点挖掘的入侵检测技术[J].计算机工程, 2008, 34 (3) :88-90.

【免疫模糊】推荐阅读：

模糊免疫PID08-06

模糊免疫PID控制器06-05

免疫与计划免疫练习09-07

灰色模糊07-16

模糊理论10-18

模糊逻辑10-20

模糊测试05-17

模糊加权06-10

模糊空间06-15

模糊增强07-07