遗传类测试题

2024-07-11

遗传类测试题(通用9篇)

遗传类测试题 篇1

如果将遗传类试题求解分为三个步骤 (前提、过程和结果) 的话, 遗传方式的判断是前提, 概率计算求解是结果, 而基因型的判定便是链接前提与结果的过程。基因型的确认既是简单问题的分析基础, 更是综合类试题解决的切入点, 能够较好地考查学生的分析、推理和判断能力, 因此遗传类试题常常涉及亲、子代基因型的推导。由此可见, 遗传类试题突破的关键在于基因型的推导。本文主要以高考遗传类真题及最新模拟考试题等为依托, 就如何在给定的题目条件下顺利推断特定的基因型作一探讨, 希望能为考生备考提供借鉴。

一、“基因型推导”的思维建模

与遗传相关的情景类试题, 但凡涉及基因型推导的, 都要结合题干叙述建立“图解”, 然后依据推导步骤进行推断。其一般的思考过程大致如下:

1.分析图解。试题给出图解 (遗传图解、遗传系谱图、代谢图解、模式图解或酶切图谱等) 的, 依据图解进行分析。未给出图解的, 先绘制相关图解, 再进行基因定位。

2.定位基因。在明确遗传方式的基础上, 找准基因所在位置 (位于常染色体上、X或Z染色体上、Y或W染色体上) , 再进行基 因型的书写。

3.写基因型。如果遗传方式为一对等位基因控制的常染色体显性遗传, 其基因组成可以是AA或Aa, 但有时不能一步确认, 此时可以写成简式A_, 然后再依据题设中亲子代关系确认具体的基因组成, 即基因型。

4.推导说明。

(1) 若涉及多对等位基因或多种遗传方式的基因型推导, 其思路是先运用分解法将其拆分成一对等位基因的遗传, 然后结合相关信息予以分析。

(2) 对于特殊题型中个体基因型的推断, 只要抓住以上分析思路, 并结合下面“不同情景题型中基因型的推导方法”, 灵活分析, 综合应用, 便可迎刃而解。

二、针对不同情景题型的基因型推导方法

1.“遗传图解类”试题中基因型的推断

●正交-反交法:依据亲代正反交产生的子代结果的表现情况的对比, 推断基因型的方法。如果正反交结果一致, 说明该性状为常染色体遗传;若结果不一致, 则为伴性遗传。具体为哪种伴性遗传, 再依据伴性遗传的特征进行判断, 即可确定对应个体的基因型。

【例1】 (2013·山西太原五中模拟) (节选) 研究人员发现水稻的两种矮化突变纯合体甲和乙, 其突变基因分别位于第1号、第11号染色体上 (有关基因用A、a、B、b表示) 。用甲、乙分别与野生型纯合 体丙进行 正反交实 验得F1。F1均不表现突变性状, 也不表现中间性状。田间种植F1得F2, 调查F2群体中突变型与野生型的植株数目, 结果如下表。请回答:

由上述实验结果可以得到的结论是:矮化突变是由_________性基因控制的。甲、乙、丙的基因型分别为________、_________、_________。

【简析】首先, 根据表中交配信息可知, 有两组典型的正反交实验, 即1和2为一组正反交组合, 3和4为一组正反交组合。由于“正反交实验得F1, 且F1均不表现突变性状, 也不表现中间性状”, 说明F1表现为野生型性状。所以, 符合“具有相对性状的个体杂交, 后代仅有一种性状则为显性性状”的判断, 故突变型为典型的隐性突变。因此, 该性状的遗传方式为常染色体隐性遗传。又据题意:丙为“野生型纯合体”, 故其基因型为AABB。再根据表中数据信息可推知:F1自交后代皆表现为:野生型植株∶突变型植株=3∶1的比例关系, 说明子一代的基因型中一对基因表现为显性纯合, 另一对表现为显性杂合。又根据题意“甲和乙, 其突变基因分别用A、a、B、b表示”, 因此甲、乙、丙的基因型分别为aaBB、AAbb和AABB。

【答案】隐aaBBAAbbAABB

●特殊比例法:依据亲本杂交后代的特殊性状分离比, 逆推判定求解个体基因型的方法。试题往往给出接近基因分离定律子二代的分离比3∶1, 或子一代测交的1∶1, 自由组合定律子二代的分离比9∶3∶3∶1, 或子一代 测交的1∶1∶1∶1等特定分离比例或其变式, 为推算待测基因型作好铺垫。

【例2】 (2014·山东卷·28) (节选) 果蝇的灰体 (E) 对黑檀体 (e) 为显性;短刚毛和长刚毛是一对相对性状, 由一对等位基因 (B, b) 控制。这两对基因位于常染色体上且独 立遗传。用甲、乙、丙三只果 蝇进行杂 交实验, 杂交组合、F1 表现型及比例如下:

(1) 根据实验一和实验二的杂交结果, 推断乙果蝇的基因型可能为_________或__________。

(2) 若实验一的杂交结果能验证两对基因E、e和B、b的遗传遵循自由组合定律, 则丙果蝇的基因型应为___________。

【简析】依据题意及图示可知:控制对应性状的两对基因位于常染色体上且独立遗传, 故遵循基因的自由组合定律。针对每对 相对性状, 根据实验后代的特殊比例不难分析对应亲本的基因型。实验一:灰体∶黑檀体=1∶1, 符合测交类型, 说明亲本的基因型为Ee和ee;

同理, 短刚毛∶长刚毛=1∶1, 说明亲本的基因型为Bb和bb。综上所述, 说明亲本的基因型为EeBb和eebb或Eebb和eeBb。同理, 由实验二的杂交结果, 推断乙和丙的基因型应为eeBb×EeBb。综合实验一和实验二的推断, 乙果蝇的基因型可能为EeBb或eeBb。若实验一的杂交结果能验证两对基因E、e和B、b的遗传遵循自由组合定律, 则应属于典型的测交类型, 因此甲乙的基因型可能为EeBb×eebb。当乙的基因型为EeBb时, 依据特殊比例法可推知丙果蝇的基因型应为eeBb。

同理, 2014年四川卷 (生物) 第11题、安徽卷第31题、海南卷第29题都可运 用此法来求解。

【答案】 (1) EeBbeeBb (注:两空可颠倒) (2) eeBb

2.“遗传系谱图类”试题中基因型的推断

●代入排除法:该法常用于选择题的快速解答。依据各选项提供的备选答案 (基因组成或比例) , 直接代入题干要求之中, 以迅速排除错误选项, 并可作为验证正确选项的直接依据, 从而减少思维容量, 节省答题时间。

●概率拆分法:当试题给出概率计算结果, 要求逆推基因型时可运用此法。通常是对概率结果依据常见的比例类型, 如1/2, 1/3, 1/4等常见比例进行拆分, 从而找到比例与基因型的对应关系, 顺利推断出待求基因型。

【例3】 (2014·新课标Ⅰ卷·5) 下图为某种单基因常染色体隐性遗传病的系谱图 (深色代表的个体是该遗传病患者, 其余为表现型正常个体) 。近亲结婚时该遗传病发病率较高, 假定图中第Ⅳ代的两个个体婚配生出一个患该遗传病子代的概率是1/48, 那么, 得出此概率值需要的限定条件是 ()

A.Ⅰ-2和Ⅰ-4必须是纯合子

B.Ⅱ-1、Ⅲ-1和Ⅲ-4必须是纯合子

C.Ⅱ-2、Ⅱ-3、Ⅲ-2和Ⅲ-3必须是杂合子

D.Ⅱ-4、Ⅱ-5、Ⅳ-1和Ⅳ-2必须是杂合子

【简析】由题意可知, 该病为常染色体隐性遗传病, 无论Ⅰ-2和Ⅰ-4是否纯合, 对Ⅱ2、Ⅱ-3、Ⅱ-4、Ⅱ-5的基因型没有影响, 均为Aa, 排除A选项;Ⅳ的两个个体婚配, 子代患病概率与Ⅱ-5的基因型无关, 假若Ⅳ-1与Ⅳ-2必须是杂合子Aa, 则子代患病个体的概率是1/4, 而非1/48, 排除D选项;若Ⅲ-2和Ⅲ-3一定是杂合子, 则无论Ⅲ-1和Ⅲ-4是同时AA或同时Aa, 或一个是AA另一个是Aa, 后代患病概率都不可能是1/48, 排除C选项;仔细分析不难发现, 只有当Ⅱ-1、Ⅲ-1、Ⅲ-4这三个外来家系个体确定才能计算出相应的概率。若Ⅱ -1、Ⅲ -1纯合, 则Ⅲ -2为1/2Aa、Ⅳ -1为1/4Aa、Ⅲ -3为2/3Aa;若Ⅲ-4纯合, 则Ⅳ -2为2/3×1/2=1/3Aa, 故Ⅳ的两个个体婚配, 子代患病的概率是1/4×1/3×1/4=1/48, 与题意相符, B选项正确。

同理, 2014年山东卷第6题也可运用此法求解。

本题“代入排除法”的运用是基于各选项已提供对应个体纯合杂合为前提条件下的推理。如果试题要求考生直接推理所需条件, 而不提供供选条件时, 则需要运用“概率拆分法”求解, 具体思路为:Ⅳ-1和Ⅳ-2均为正常个体, 子代患病概率为1/48, 可拆分成常见比例1/3×1/4×1/4, 那么这两个个体的基因型均需满足为Aa, 并且一方是Aa的概率为1/3, 另一方是Aa的概率是1/4。由于Ⅱ -3和Ⅱ -4均为Aa, 故Ⅲ-3为Aa的概率为2/3, 则Ⅳ -2为Aa的概率不可能为1/4, 只能是1/3, 而Ⅳ-1是Aa的概率只能是1/4。由Ⅲ-3是Aa的概率为2/3, Ⅳ-2是Aa的概率为1/3, 则Ⅲ-4必为AA。Ⅱ-2基因型一定为Aa, 若要Ⅳ-1为Aa的概率为1/4, 则Ⅱ-1和Ⅲ-1都必须为AA, 即Ⅱ-1, Ⅲ-1和Ⅲ-4为纯合子。

【答案】B

●亲子互推法:当试题给出遗传系谱图确定亲子代关系后, 针对待求个体的基因型, 以该个体为参照, 对其亲代 (或子代) 基因型进行分析, 可初步确定待测个体的基因简式, 然后, 仍以该个体为参照, 对其子代 (或亲代) 基因型进行分析, 从而确认该个体的具体基因组成。该法的核心思想是利用待测个体的上下代关系, “亲代”与“子代”双方夹击, 从而找到问题的突破口。

【例4】 (2014·广东卷·28) (节选) 下图是某家系甲、乙、丙三种单基因遗传病的系谱图, 其基因分别用A、a, B、b和D、d表示。甲病是伴性遗传病, Ⅱ -7不携带乙 病的致病 基因。在不考虑家系内发生新的基因突变的情况下, 请回答下列问题:

甲病的遗传方式是, 乙病的遗传方式是_____, 丙病的遗传方式是_______, Ⅱ-6的基因型是__________。

【简析】据题意, 已知甲病是伴性遗传病, 其中Ⅲ-14患病女性的父亲Ⅱ-7正常, 说明不是伴X染色体隐性遗传病, 证明甲病是伴X染色体显性遗传;Ⅱ-6和Ⅱ-7不患乙病, 但生出患乙病的儿子, 说明乙病是隐性遗传病, 又因题干中说明Ⅱ-7不携带乙病的致病基因, 所以乙病是伴X染色体隐性遗传;Ⅱ-10和Ⅱ11都正常, 但生了患丙病的女儿, 丙只可能是常染色体隐性遗传。

以求解的Ⅱ-6为参照, 其亲本Ⅰ-1只患甲病, 所以基因型为D_XABY, 根据性染色体的传递规律, 其中XAB会传递给Ⅱ-6;其亲本Ⅰ-2不患病, 所以基因型为D_XaBXa_, 根据性染色体的传递规律, 其中Xa_会传递给Ⅱ-6。又因Ⅱ -6只患甲病, 初步确定 基因型为D_XABXa_。仍以求解的Ⅱ-6为参照, 其子代Ⅲ-12只患乙病男孩, 基因为D_XabY, 根据性染色体的传递规律, 该男孩的Xab来自于母本, 可推知Ⅱ-6的基因型为D_XABXab。因题干中并未说明, 该家族是否携带丙病致病基因, 所以Ⅱ-6基因型为DDXABXab或DdXABXab。

同理, 2014年新课标Ⅱ卷第32题亦可用此法求解。

【答案】伴X染色体显性遗传伴X染色体隐性遗传常染色体隐性遗传DDXABXab或DdXABXab

3.“模式图解类”试题中基因型的推断

●假说演绎法:就是先依据题干设问建立问题, 然后提出假设, 并结合模式图解信息的设问, 进行实验方案设计, 演绎预期结果。由于该类试题的命题模式较为固定, 因此试题分析可按照此类题目的命题思路展开:问题→假设→方案设计→预期结果。

【例5】 (2012·山东卷·27) (节选) 几种性染色体异常果蝇的性别、育性等如图所示。

用红眼雌果 蝇 (XRXR) 与白眼雄 果蝇 (XrY) 为亲本杂交, 在F1群体中发现一只白眼雄果蝇 (记为“M”) , M果蝇出现的原因有三种可能:第一种是环境改变引起表现型变化, 但基因型未变;第二种是亲本果蝇发生基因突变;第三种是亲本雌果蝇在减数分裂时X染色体不分离。请设计简便的杂交试验, 确定M果蝇的出现是由哪一种原因引起的。

实验步骤:

________________________。

结果预测:Ⅰ.若_____________ , 则是环境改变;

Ⅱ.若_______________ , 则是基因突变;

Ⅲ.若_____________, 则是减数分裂 时X染色体不分离。

【简析】本题应从分析M果蝇出现的三种可能原因入手, 推出每种可能下M果蝇的基因型。具体来说, 三种情况下白眼雄果蝇的基因型不同, 第一种情况下基因型为XRY, 第二种情况下基因型为XrY, 第三种情况下, 母本产生的卵细胞有O和XRXR两种, O型卵细胞与含Xr的精子受精 得到的个 体为雄性, 基因型为XrO, 根据题图可知, 该个体不育。所以, 要判定M果蝇的基因型可让该个体与正常的多只白眼雌果蝇 (XrXr) 交配, 统计子代的眼色可判定其基因型, 进而可以判定属于哪种情况。情况1:XRY与XrXr杂交, 若子代雌果蝇全为红眼, 雄果蝇全为白眼, 则为环境引起 的表型改变;情况2:XRY与XrXr杂交, 若子代全 为白眼, 则为基因突 变引起的 表型改变;情况3:XRY与XrXr杂交, 若没有子 代产生 (XrO不育) , 则为减数分裂时X染色体没有分离。

【答案】M果蝇与正常白眼雌果蝇杂交, 分析子代的表现型

Ⅰ.子代出现红眼 (雌) 果蝇

Ⅱ.子代表现型全部为白眼

Ⅲ.无子代产生。

4.“代谢图解类”试题中基因型的推断

●性状表达法:试题常常提供基因对性状控制的过程图解 (代谢途径) , 要求依据题设条件建立基因同性状间的对应关系, 进而推导出对应个体的基因型。试题时而给出不完整的代谢途径, 要求配合其他基因型去推导结果, 从而考查思维的灵活性 (如2014年四川生 物卷第11题) 。

【例6】矮牵牛的花瓣中存在着三种色素:红色、黄色和蓝色, 红色与蓝色混合呈现紫色, 蓝色与黄色混合呈现绿色, 缺乏上述色素的花瓣呈白色, 各种色素的合成途径如图, 控制相关酶合成的基因均为显性。当B基因存在时, 黄色素会全部转化为红色素。当E基因存在时, 白色物3只转化为白色物4, 但E不存在时, 白色物3也会在D基因控制下转化为黄色素。

请据图回答下列问题:

(1) 如果只考 虑途径一 (G、g) 和途径二 (A、a, B、b) , 纯种紫色矮牵牛 (甲) 与另一纯种蓝色矮牵牛 (乙) 杂交, F1表现为紫色, F2的表现型及比例为9紫色∶3绿色∶4蓝色。亲本基因型分别是_______, F2紫色矮牵牛中能稳定遗传的比例占_______。

(2) 如果只考虑途径一 (G、g) 和途径三 (B、b, D、d, E、e) , 两株纯合亲本杂交 (BBDDeeGG×BBddeegg) , F2的表现型及比例为_______。

(3) 如果三条途径均考虑, 两株纯合亲本杂交, F2的表现型及比例为13紫色∶3蓝色。推知F1的基因型为_______ (按字母顺序书写) , 两亲本组合的表现型为_______。

【简析】 (1) 在只考虑途径一和途径二的情况下, 根据题意及代谢图解可知:纯种紫色矮牵牛 (甲) 基因型为 纯合红色 (AABB) 和纯合 (GG) 蓝色的合并, 即AABBGG;纯种蓝色矮牵牛 (乙) 基因型为aabbGG, 两者杂交得到F1的基因型为AaBbGG, F1自交得到 的F2中表现型及比例为9紫色∶3绿色∶4蓝色, 即“9∶3∶4”是9∶3∶3∶1的变式, 依据“特殊比例法”可知有两对等位基因位于两对同源染色体上, 遵循自由组合定律, 则F2中紫色矮 牵牛的基 因型为A_B_GG, 占F2的9/16, 能稳定遗传的紫色矮牵牛的基因型为AABBGG, 占F2的1/16, 因此F2紫色矮牵牛中能稳定遗传的比例占1/9。

(2) 在只考虑途径一和途径三的情况下, 基因型为BBDDeeGG和BBddeegg的个体杂交, 其F1基因型为BBDdeeGg。因为子一代BB和ee自交后代性状不分离, 故仅考虑F1中DdGg自交即可。F2表现型及 比例为9/16紫色 (D_G_) ∶3/16红色 (D_gg) ∶3/16蓝色 (ddG_) ∶1/16白色 (ddgg) =9∶3∶3∶1。

(3) 如果三条途径均考虑, F2的表现型及比例为13紫色∶3蓝色, 依据“特殊比例法”可知, 13∶3是9∶3∶3∶1的变式, 这也说明有两对等位基因存在, 另外三对基因为纯合, 且一定存在G、B基因。若A、D有一个存在时, 途径二、三的整体表现的一定是红色;若A、D都不存在时, 途径二、三表现的为白色;若一个E存在, 则D或d任一个在途径三中都不起作用。综上所述, F1的基因型为AaBBDDEeGG, 则可推得F1的两纯合 亲本的基 因型及表 现型为AABBDDEEGG紫色或AABBDDeeGG紫色或aaBBDDeeGG紫色或aaBBDDEEGG蓝色, 则符合题意的亲本表现型为紫色AABBDDeeGG和蓝色aaBBDDEEGG或紫色AABBDDEEGG和紫色aaBBDDeeGG。

【答案】 (1) AABBGG和aabbGG1/9 (2) 紫色∶红色∶蓝色∶白 色 =9∶3∶3∶1 (3) AaBBDDEeGG紫色×紫色或紫色×蓝色

5.“酶切图谱类”试题中基因型的推断

●条带比对法:利用限制性核酸内切酶的特异性识别功能, 对正常基因或异常基因进行切割, 因突变因素导致酶切位点数目差异, 被切割对象产生不同长度的DNA片段, 利用电泳时分子扩散速度的不同, 通过比对从而区分并确认受切割个体的基因型。

【例7】 (2013·杭州学军中学高三期中考试) 已知正常的β-珠蛋白基因 (以βA表示) 经MstⅡ限制性核酸内切酶切割后可得到长度为1.15kb和0.2kb的两个片段 (其中0.2kb的片段通常无法检测到) , 异常的β珠蛋白 基因 (以βS表示) 由于突变恰好在MstⅡ限制性核酸内切酶切割点上, 因而失去了该酶切 位点, 经MstⅡ限制性核酸内切酶处理后只能形成一个1.35kb的DNA片段, 如图1;现用MstⅡ限制性核酸内切酶对编号为1、2、3的三份样品进行处理, 并进行DNA电泳 (电泳时分子量越小扩散越快) , 结果如图2, 则1、2、3号样品所对应个体的基因型分别是 (以βA、βS表示相关的基因) ()

【简析】据题意“电泳时分子量越小扩散越快”, 正常基因可被酶切断, 而异常基因不能被酶切断。因此从相对分子量考虑, 正常基因电泳扩散速度较快, 而异常基因电泳扩散速度较慢。结合图2可知, 有4个DNA片段, 由于βS较βA长, 在电泳过程中, 迁移速率较慢, 由此可得1号样品是由两段1.35kb的DNA片段组成, 其基因型为βSβS;2号样品由一段1.35kb的DNA片段和一段1.15kb的DNA片段, 其基因型为βAβS;3号样品由两段1.15kb的DNA片段组成, 其基因型为βAβA。

【答案】A

【例8】 (2014·广东越秀区高三摸底考试) (节选) 单基因遗传病可以通过核酸杂交技术进行早期诊断。镰刀型细胞贫血症是一种在地中海地区发病率较高的单基因遗传病。已知红细胞正常个体的基因型为BB、Bb, 镰刀型细胞贫血症患者的基因型为bb。有一对夫妇均被检测出为该致病基因的携带者, 为了能生下健康的孩子, 每次妊娠早期都进行产前诊断。下图为其产前核酸分子杂交诊断和结果示意图。

根据凝胶电泳带谱分析可以确定胎儿是否会患有镰刀型细胞贫血症。这对夫妇4次妊娠的胎儿Ⅱ -1~ Ⅱ -4中基因型BB的个体是_______, Bb的个体是_______, bb的个体是_______。

【简析】据图观察, 正常基因B经限制酶切割后, 凝胶电泳分裂酶切片段, 与探针杂交后可显示出不同的带谱都是二条;而突变后的基因b经限制酶切割后, 与探针杂交后可显示出不同的带谱都是 一条。所以, 在分析推 断胎儿Ⅱ-1~Ⅱ-4的基因型时, 可以这样认为:基因型Bb的个体同时带有B基因和b基因, 所以其应同时含有与B基因对应的二条带谱, 以及与b基因对应的一条带谱 (这也可以从Ⅰ-1和Ⅰ -2得到验证) 。符合这 个条件的 仅有Ⅱ-3。同理, 基因型为BB的个体应仅有与B基因相对应的二条带谱, 符合条件的是Ⅱ -1和Ⅱ-4。基因型为bb的个体是只能是含 有与b基因相对应的一条带谱, 为Ⅱ-2。

【答案】Ⅱ-1和Ⅱ-4Ⅱ-3Ⅱ-2

遗传类测试题 篇2

引言

遗传学是生命科学领域中一门十分重要的基础性学科之一,也是高等农业院校农学类专业重要的专业基础必修课之一。遗传学是一门以实验为基础的学科,实验教学在遗传学课程教学中占有十分重要的地位。遗传学实验既是对遗传学课堂知识的验证和巩固,又是培养学生实践能力、提高学生分析问题和解决问题能力的重要手段,也是培养学生自主创新能力的一个重要途径。21世纪高校人才培养模式改革的重点是加强对学生的素质教育,特别是创新能力和实践能力的培养[2,3]。如何适应新形势下素质教育的需要,结合学科发展趋势和专业特点,加强遗传学实验教学改革,是农学类学科建设的重要内容,也是培养高级农业科技人才和农业科研工作者的重要保证。以往遗传学的实验教学依附于理论教学,实验只是为了验证理论,存在重理论轻实践的误区,难以培养学生的实践能力和创新能力。为适应教学改革的要求,培养“厚基础,宽口径”复合型人才,笔者在分析甘肃农业大学设施农业科学与工程专业和园艺专业本科生传统遗传学实验教学中主要问题的基础上,对遗传学实验教学改革进行了初步探索,总结了从教学内容、教学方法和考核标准方面提高遗传实验学教学质量、增强学生动手能力和创新能力培养的措施。旨在为高校人才培养模式中实验课教学的改革提供参考。

1.传统遗传学实验教学中存在的问题

受学时、实验经费等因素所限,传统遗传学实验教学的主要问题如下。

1)对实验教学的环节重视度不足。实验教学的前期准备工作(包括实验过程的部分步骤,实验材料的培养与处理,药品试剂的配置及实验仪器的调试)都是由教师完成,学生只是按照实验指导进行其中的部分步骤,整个实验教学过程中学生处于被动地位,甚至对一些基本的实验技能都没有掌握,不利于培养学生分析问题和解决问题的能力。

2)实验内容陈旧,缺少创新(见表1),未能反映遗传学的发展及遗传规律的本质。实验内容基本上是对课堂教学中遗传规律和染色体理论的验证,缺少分子遗传学实验以及综合性和设计性实验。尽管验证性实验能加深学生对理论的理解和记忆,由于结果已知,不能调动学生的积极性和思维的创造性。

3)考核方法欠科学。实验成绩的评定完全依据上交的实验报告,而不考虑学生的实验操作能力以及实验态度等。使部分学生养成实验不认真,抄袭应付的不良现象,不能客观地反映学生的真实水平和实验操作能力。这种传统遗传学实验教学模式既不利于激发学生的学习兴趣,也不利于学生的创造性思维培养和发挥。

2.优化教学内容,建立实验教学新体系

为适应新世纪人才培养的要求,笔者结合遗传学科的发展趋势和农学类本科人才培养要求,遵循“厚基础”的原则,以基本技能培养为主,通过实验教学内容的整合并优化满足“宽口径”的要求,充分调动学生的主观能动性,提高学生发现问题和解决问题的科学思维方法及创造性的思维能力。即在保留部分验证性实验项目的基础上,增开综合性实验和设计性实验项目,形成验证性实验一综合性实验一设计性实验的多层次教学体系。

2.1拓展基础性实验内容,增设分子遗传学基础实验

通过拓宽验证性实验内容,组织学生参与实验准备工作,包括实验材料的准备、预处理、药品试剂配置、仪器调试等,既能保证实验的完整性和系统性,也能提高学生的动手操作能力和实验兴趣。例如,植物细胞有丝分裂实验,大蒜的发根、剪根、预处理、固定和试剂的配置完全由学生参与完成,使学生掌握试剂的配置方法和实验处理的关键技术。减数分裂的材料大葱花序由学生自己采集,固定处理。让学生参与到整个实验中,不仅加深了学生对实验的印象,也激发了学生对实验课的兴趣。由于染色体制片技术是遗传学实验的重要部分,也是基础性内容,“以学生为关注焦点,增加探索性”,调动了学生的积极性和主动性。“人类细胞中巴氏小体的制片与观察”,从学生自己身上取样进行,实验结果因人而异,具有探索性,激发了学生的兴趣。另外,实验项目的选择上要满足农学类专业需求[4],除了经典遗传学、细胞遗传学的内容外,还应融入和专业直接相关的分子遗传学内容,如植物DNA提取、检测和PCR扩增技术等简单的分子遗传学基础实验,使学生通过实验理解遗传本质,培养适应就业发展要求的专业性人才。

2.2减少验证性实验项目,适当增开综合性实验项目

将一些相关联的验证性实验进行综合,有机结合在一起,使实验教学成为一个完整的体系,使学生能够系统地学习,并把所学知识条理化。如有丝分裂与减数分裂两个实验虽然实验材料不同,但实验方法基本相同,将两个合并在一起,作为植物细胞分裂综合实验。将实验材料提前处理准备好,在学生掌握染色体制片技术的基础上,同时观察染色体并绘图,可对两种分裂方式中不同时期染色体的动态变化进行对比。原单独做这两个实验需要6学时,合并后只需4学时,不仅提高了实验的效率,又增强了实验的综合性,有助于学生综合分析能力的提高。果蝇遗传学系列实验包括:果蝇生活史观察和果蝇唾腺染色体制片等实验。整合后将果蝇的饲养、生活史、遗传性状观察和唾腺染色体制片等内容一次性进行,把验证性实验与探索性实验相结合,极大地提高了实验效率,也提高了学生综合运用知识的能力。

2.3实验教学与科研相结合,增开设计性实验

在遗传学实验教学过程中,可以依托教师的科研项目,让学生参与到与遗传学相关的项目中,使学生接触到本学科前沿,深化所学知识。指导老师提供实验题目,学生自主查阅文献资料,设计实验方案,教师审查后进行实验实施,自主完成实验过程,提交实验结果和分析报告。如植物多倍体的诱导及鉴定实验,要求学生自己查阅资料和设计方案,培养材料(如葡萄、马铃薯试管苗的继代繁殖等),通过设置不同浓度的秋水仙素进行诱导处理。在观察鉴定过程中要用到染色体制片方法,植物形态的观察分析以及电镜观察等遗传学、植物学方面的重点技术。这种以科研项目推动遗传学实验教学的方式,提高学生“学有所用”的认识,使学生不断提高实验技能,提高学生综合应用知识分析和解决问题能力,为将来进行科学研究奠定良好基础。通过对实验教学内容的整合优化,将验证性实验减为2个,增开综合性实验2个,设计性实验1个(见表1),基本涵盖理论教学内容。

3.改进实验教学方法,重视学生素质教育和创新能力培养

通过启发式教学、鼓励学生进行实验方案设计以及结合多媒体辅助教学方法改进教学方法,将学生创新能力和科学素质的培养贯穿于所有的实验教学环节中。

3.1以启发式教学为主,变“被动”实验为“主动”实验

教师根据教学目的和教学内容的不同,引导和启发学生进行独立思考和操作。坚持以“学生为主体、教师为主导”的教学模式,推进学生自主学习,充分发挥学生的积极性和创造性气实验前注重预习,实验过程教师指导并示范关键性操作,要求每个学生必须亲自动手独立完成实验,针对具体操作过程中出现的问题,引导学生分析原因,改进实验方法。启发式教学方法使学生掌握基本实验技能,形成独立分析解决问题的能力。

3.2鼓励学生自主进行实验方案设计

在实验教学中后期,结合遗传学课堂教学,选择一些实践性较强的课题。在教师指导下,让学生以小组为单位查阅相关资料、设计实验方案,自主完成实验过程,记录实验数据并分析实验结果,撰写实验报告。实验期间,教师做好督导工作,及时纠正出现的问题,在实验结束前完成实验论文。老师根据学生表现打分,最后作为一项考核指标列入实验总成绩中(表2)。设计性实验在研究结果上的不可预见性和适当难度,不仅能激发学生的兴趣和积极性,同时培养了学生综合运用知识能力及创新意识。

3.3多媒体辅助实验教学,提高教学效果

运用多媒体直观动态地演示遗传学实验过程,帮助学生加深对实验过程和结果的感性认识,增强实验目的性,规范操作,从而提高实验课效率[6]。特别是对于一些较复杂无法完成的分子实验,如质粒的提取、酶切及连接系列试验、核酸探针的`分子标记与分子杂交等,通过借助多媒体演示操作过程,既保证了实验教学的系统性,又加深了学生对分子遗传理论知识的理解,为专业实验课的学习奠定了基础。

4.重新构建实验教学考核体系,充分调动学生的积极性

在考核方面,重新构建了以强化学生的动手能力,坚持实验操作与实验结果并重的考核体系,主要依据学生实验操作的规范性,实验结果的准确性、以及实验纪律态度和实验报告作为考评依据(见表2)。并将实验总成绩以所占比例20%纳入遗传学课程考核体系中。较全面、客观地考核学生的实验技能、创新能力、综合分析能力以及实验报告的质量,提高了学生对实验的重视程度和兴趣。

5.遗传学实验教学改革的效果

1)提高了大学生学习的积极性和主动性。改变了以往学生被动学习的局面,大大地激发了学生对遗传课的学习兴趣、责任心以及参与实验的积极性。由原来的“过程性学习”转变为“探索性”学习,学生掌握了基本的遗传学实验技能,并能积极主动和教师探讨实验以及课堂理论课学习过程中出现的问题,教学效果良好。

2)培养了大学生各方面的综合素质和能力。通过开设综合性实验和设计性实验,学生的动手能力明显提高,并能对实验过程中的问题进行独立分析和解决,培养了学生创新思维能力、论文写作能力及科研协作能力等科研素质。毕业实习期间从事遗传学相关实验的本科生,实习实验难度和工作量都明显增加,本科毕业论文质量有很大提高。

3)提高了教师的专业素质及课堂教学质量。在遗传学课堂教学、实验教学、科学研究实践等一系列教学环节改革的实施过程中,要求教师必须及时熟悉理论知识的发展前沿,提升自己的专业素质和综合能力。在实验教学改革中不但使学生掌握了扎实的遗传学基础知识及较强的实验操作技能,而且充实了教师的专业知识,使理论知识与实践技能相结合,提高了遗传学课程教学质量。

6.结束语

两类遗传信息的功能及其区别 篇3

1. 两类遗传信息及其功能

存在于真核生物基因组中大量的非编码序列到底有什么作用?现在还没有令人满意的解释,但是人类基因组DNA和多种模式生物基因组DNA测序的完成,以及蛋白质组和功能蛋白质组的研究结果说明,真核基因组的大部分DNA主要用来编码基因选择表达的指令,人们将这一类遗传信息称为第Ⅱ类遗传信息,而为蛋白质编码的DNA序列被称之为第Ⅰ类遗传信息。

1.1 第Ⅰ类遗传信息的功能

第Ⅰ类遗传信息是以线性三联体密码的编码方式进行编码的,即DNA分子中的碱基序列根据碱基互补配对的原理,通过转录与翻译,它们表达成为具有特定氨基酸序列、空间结构与功能的蛋白质。由于蛋白质结构与功能的多样性,因此生物体表现出不同的性状,因而就形成了形形色色的真核生物界。

1.2 第Ⅱ类遗传信息的功能

第Ⅱ类遗传信息的功能是调控不同的基因在不同时空条件下选择表达。这种选择性表现在:细胞周期的不同时相,个体发育的不同阶段,不同的器官或组织中,机体生长在不同环境或营养及生理条件下等,各种基因的表达或关闭,表达的量多少都是随时变化的。真核生物体的生长发育过程就是基因按特定时空顺序选择表达的结果。

曾经有人认为重复序列可以自由地积累突变而不会致死生物,当这些序列中一旦出现了有适应价值的新功能的多核苷酸,就会通过自然选择在相互交配的群体中传播开,因此重复序列可能是产生新基因的材料。但是更重要的是大量重复系列的存在会影响DNA分子的空间结构,进而影响与调控蛋白的结合特点,以发挥调控基因表达的功能。

有关内含子的生物学意义,早期人们倾向于认为断裂基因反映了生物进化的历程,外显子(Exion)可能相当于蛋白质的折叠单位或结构域,它们聚集在一起能产生具有新功能的蛋白质。而转录后加工除去内含子的过程,既能调控mRNA的核质转运,又能提高基因表达的灵活性与多样性。因为在RNA前体的加工过程中,未成熟的RNA不能通过核孔复合体进入细胞质。由同一基因转录形成RNA前体的加工可进行交替剪接,即在同一RNA前体上切除内含子的部位不同而得到编码不同蛋白质的多种成熟mRNA。交替剪接具有组织和发育阶段特异性,从而构成了转录后有效调节基因表达的机制。由于这种调节机制是通过切除内含子而发挥作用,故它也是真核生物断裂基因的主要选择优势。交替剪接能产生有组织和细胞特异性的蛋白质,不但节省DNA上的编码信息,而且可提高基因表达的灵活性与多样性,同时有利于生物适应环境。但是这对基因与多肽链之间的线性序列对应关系提出了挑战,同时也赋予基因概念新的内容。当然这也说明内含子并非是“含而不显”,而外显子也不是“显而不含”[1]。

在真核生物基因组中有85%-90%的DNA是非编码序列。如此多的非编码序列肯定会影响DNA双螺旋的空间结构,进而影响基因表达。早在上世纪70年代末,人们根据DNA寡聚体的X射线衍射结果,发现DNA双螺旋的参数随着碱基序列的变化而在一定范围内起伏变化。这些参数包括:螺旋扭角、碱基转角、主链扭角及螺旋浆式扭角。DNA双螺旋局部构象的起伏变化起着精细调节DNA与蛋白质(酶)之间相互识别尺寸的作用,故称其为DNA双螺旋精细调节。由此看出,非编码序列的存在引起双螺旋结构参数的变化影响到蛋白质与DNA的识别及结合对调控基因表达有重要作用。

2. 两类遗传信息的区别

2.1 结构基因表达需要通过转录与翻译过程来完成,因此需要转录酶系和蛋白质合成体系,而基因序列本身的区别只是提供了这些酶或蛋白质识别的分子基础。因此第Ⅰ类遗传信息的解毒解读机制是外在的。第Ⅱ类遗传信息的表达除了需要酶和蛋白质与之作用外,还能够主动修饰本身的双螺旋空间结构。也就是说调控DNA序列通过与调控蛋白的作用而改变本身的构象,以便实现对基因表达的调控,故第Ⅱ类遗传信息的解读是通过内在与外在相结合的方式进行的[2]。

2.2 解读第Ⅰ类遗传信息是根据碱基互补配对的原理完成的。根据碱基互补配对的关系,使遗传信息由DNA→RNA→蛋白质;而且在信息的传递过程中中断了原有的碱基对后又形成了新的碱基对;第Ⅱ类遗传信息的解读没有中断原有的碱基对,也没有形成新的碱基对,而是通过调控蛋白中的氨基酸侧链与DNA双螺旋大沟或小沟中的碱基作用并与DNA结合。

2.3 第Ⅰ类遗传信息通过转录与翻译把基因中的核苷酸序列转变成蛋白质中的氨基酸序列,故这种编码方式是线性一维的,且往往只位于DNA的一条链上;而第Ⅱ类遗传信息的编码方式是三维空间的(DNA分子的构象供调控蛋白识别与结合),可能是位于DNA的两条链上。因此人们称第Ⅱ类遗传信息为空间密码或调控密码。

2.4 第Ⅰ类遗传信息的三联体密码具有简并性,即一种氨基酸可有几个密码(1-6个)。而调控密码具有更高的简并性,如调控蛋白识别DNA时,一种碱基对能与不同的氨基酸侧链相互作用,一种氨基酸侧链也能与不同的碱基对相互作用。

综上所述,DNA分子中贮存着两类遗传信息。尽管它们的生物学功能、编码方式与解读机制都不相同,但是二者相互联系、相互配合、相互制约,共同控制并完成真核细胞的生命活动。

参考文献

[1]李振刚.中心法则导论.生物学杂志, 1993, (5) :1-2.

遗传算法在试题组卷中的应用 篇4

D=[]

D的每一行由某一试题的`控制指标组成,如题号、题型、章节、难度等,并且这些属性指标都进行编码表示成二进制形式,而每一列是题库中的某一指标的全部取值。在具体出题时,考方可能不会用到所有的指标,所以D包含的个体d_target可以表示为d_request和d_void,d_request表示考方要求的控制指标,d_void表示考方不要求的控制指标。即

d_target::=

::={0,1}m

::={0,1}n

试题库[STK]中的每一道试题在建库时都输入了相应的属性指标。试题模型的产生形式是:

if then

::={0,1,#}m

#表示0和1之间的任意一位。

考试自动出题的遗传算法如下:

(1) 根据考方的出题要求,规划状态空间库D中的数据,保留d_request部分,而不要d_void部分,对其剩余部分进行编码D [1],D[2],……D[i]。

(2) 初始化试题库[STK]。随机从题库中抽出一组试题,并进行编号STK[1],STK[2]……STK[j],确定合适的交换概率Pc和变异概率Pm;并定义其适应值flexibility[k](k=1,2……j)

flexibility[k]<-0 (k=1,2……j)

(3) 从试题库[STK]中取出STK[m](0≤m≤j)与状态空间库[D]中的指标D[n] (0≤n≤i)进行匹配。如果STK[m]与D[n]完全匹配,则

flexibility[k]<-flexibility[k]+1

如果不匹配,则有

flexibility[k]<-flexibility[k]+0

(4) 进行淘汰选择,保留具有高适应度的试题。即把flexibility[k]为0的STK[m]去掉,这样就生成了一

个新的试题模型STK[h]。

(5) 重复过程2生成新的试题模型STK[p]。按一定的交换概率Pc从[STK]中随机选取模型STK[h]和STK[p],交换彼此位串中对应的值,产生新的试题模型STK[h]、STK[p],如

交换前STK[h]=1 1 0 1 0 1 1

STK[p]=0 0 1 1 1 1 0

交换前STK[h]=1 1 1 1 0 1 1

STK[p]=1 1 1 1 1 1 0

(6) 按一定的变异概率从题库[STK]中随机选出一试题模型STK[h]进行基因突变,产生一个新的试题模型。

(7) 在完成以上选择、交叉、变异步骤后,产生一个考试试题模型,按照事先确定的误差精度对其进行收敛性的判别,当其适应度高时,试题组卷成功,转向步骤8,如果其适应度低,则转向步骤3继续执行。

(8) 输出相应的考试试题,组卷结束。

以上用遗传算法抽题时,交换概率Pc和变异概率Pm的确定很重要。Pc

太小使选题工作进展缓慢,太大则会破坏适应值高的试题模型。通常规定其为0.4。同样,Pm太小就不能产生新的试题模型,太大又会产生过多的试题模型。它宜规定为0.1。

在自动选题时,选题的方式可采用父辈挑选和生存选择两种。父辈挑选就是采用不返回随机抽样,它使每个题目都有被选中的可能;生存选择采用允许父辈和子代进行竞争,并让其中的优良者进入下一轮竞争环境的二分之一择优选择。两种选择方式共同作用于选题保证了选题的顺利完成。在选题的过程中,哪一道题目被选中是一个非均匀随机事件,其概率依赖于上一次选题的过程。

5结束语

本文利用遗传算法的全局寻优和收敛速度快的特点,结合随机选取法和回溯试探法的优点,设计了一种用于自动组卷的好的算法,使自动组卷的成功率和速度都得到了明显的提高。要使自动出题的误差精度和收敛速度进一步得到改进,还需要做出更深的研究。

参考文献

[1] J.H.Holland ,Adaptation in natural and artificial systems[M],Ann arbor: University of Michigen press,1975.

[2] Hamilton M A. Java and the Shift to Net-centric Computing. IEEE Computer, 29(8),1996.

[3] 袁富宇等,多目标相关分类的算法,浙江大学学报,33(3),1999

[4] 张师超 蒋运承 ,模糊数据库中近似相等的研究,计算机科学,25(6),1998.

遗传类测试题 篇5

新疆地处亚欧大陆腹地,地域辽阔,属典型的大陆性气候,自然环境极为复杂多样,寒暑变化剧烈雨量稀少,干旱期长,两栖动物相对匮乏。对新疆蛙科动物的研究工作起步较晚,最早的研究报道于1979年,马积藩将采自新源县的一例雌蛙鉴定为湖蛙R.ridibunda,叶昌媛等[1]报道了分布于新疆喀纳斯一带的阿尔泰林蛙R.altaica,为中国新记录,此后陆续有见新疆蛙科地理分布、分类以及繁殖生物学方面的报道,遗传学方面只有关于染色体核型的报道。目前,已经发现新疆有4种蛙类:中国林蛙R.Chensinensis、中亚林蛙R.asiatica、中亚侧褶蛙P.terentievi和阿尔泰林蛙R.altaica。中国林蛙是中国特有种,产地主要在陕西、甘肃、宁夏、内蒙古、新疆等地,在新疆分布于伊犁谷地和博斯腾湖一带[2]。中亚林蛙是新疆特有品种,主要分布于伊犁河、巩乃斯河上游和伊宁县[3]。魏刚等[4]分析了中亚林蛙的核型、C带和银带,并探讨了田野林蛙的起源。中亚侧褶蛙,国内在新疆霍城和伊宁有分布,国外分布于东欧、南欧、北欧、亚洲西部及咸海流域。吴敏等[5]报道了中亚侧褶蛙的染色体组型和Ag-NoR s研究。总之,关于新疆蛙类的研究报道较少,未见有关新疆所有蛙类物种遗传多样性方面的系统报道。

新疆蛙科种质资源的独特,限于日趋恶化的生态环境,对新疆蛙科进行系统的研究刻不容缓。由于遗传多样性研究是保护和利用野生种质资源的重要途径,且线粒体基因的DNA序列分析对两栖类的遗传多样性研究比较有效[6,7],本研究通过分析新疆4种蛙类的线粒体基因12S RNA序列,系统地揭示新疆蛙科动物的遗传多样性、遗传结构和系统发生关系,确定种的地理分布,了解种群的生存现状,对其种质资源的保护和管理具有重要的意义。

1 材料与方法

1. 1 材料

分别于新疆7 个地方的河段每隔大约5 km采集1 只,共采集蛙类标本53 只,保存于无水乙醇溶液中,带回实验室,解剖取其腿部肌肉,- 20℃ 保存备用。4 种蛙类样品采集信息见表1。

1. 2 方法

1. 2. 1 基因组DNA提取

采用上海生工生物工程股份有限公司的EZUP柱式动物基因组DNA试剂盒提取。

1. 2. 2 PCR扩增

采用primer 5. 0 设计覆盖12S RNA全序列的两对引物,由上海生工生物工程股份有限公司合成,引物分别为:

t12SF: 5' - CAAAGGTTTGGTCCTGCCTTGTGGT- 3';

t12SR:5'-TTTCCAAGCACACCTTCCGGTATACTTACC - 3';

f12SF: 5' - AAAGGTTTGGTCCTAGCCTTACTAT- 3';

f12SR: 5' - GTTGTAAGCAAGTGCACTTTCC- 3'。

PCR扩增体系为: 基因组DNA 1 μL ( 约100ng) ,上、下游引物( 10 μmol / L ) 各1 μL,Taq PCR Buffer 2. 5μL,d NTP 2 μL,Taq酶1 μL,dd H2O 16. 5μL。整个反应体系为25 μL; PCR扩增程序为: 94℃变性3 min,94℃变性30 s,55℃ 退火30 s,72℃ 延伸1 min,35 个循环,72℃ 延伸10 min,4℃ 保存。

1. 2. 3 测序结果与数据分析

PCR产物经1% 琼脂糖凝胶电泳检测合格后,送生工生物工程( 上海) 股份有限公司纯化和测序,测序结果用chromas Pro( version1. 7. 4) 进行拼接,然后在NCBI网站中比对,确保所得到的序列是目标序列; 采用Clustal X1. 81 进行序列间比对,并对比对结果进行检查和纠正; 利用Dna SP v5 ( version5.10. 01) 软件计算各碱基组成比例、单倍型多样度( Hd) 、核苷酸多样性( Pi) 、平均核苷酸差异数( k) 、种群间核苷酸平均差异数( Kxy) 、遗传分化系数( Gst) 、核苷酸歧义度( Dxy) 、和固定系数( Fst) ,并进行中性检验; 为准确了解新疆蛙类的系统发育地位,从Gen Bank数据库中下载了黑龙江林蛙R. amurensis( 登录号: DQ359979. 1 ) 、镇海林蛙R. zhenhaiensis( 登录号: KF204597) 、金线侧褶蛙R. plancyi( 登录号: EU386885. 1) 和田野林蛙R. arvalis ( 登录号:AB058865. 1) 的12S RNA的基因片段作为外群,运用MEGA5. 05 软件计算11 个群体之间的遗传距离( 采用Kimura双参数模型) ,采用NJ法( Bootstrap抽样重复次数为1 000 次) 构建4 种蛙类的系统发生树。

2 结果与分析

2. 1 PCR扩增结果

以基因组DNA为模板对4 种蛙类的12S RNA区进行扩增,经电泳检测,得到与预期目标片段大小一致、整齐而清晰的条带,随后进行纯化和测序。

2. 2 12S RNA序列碱基组成

测序结果经chromas Pro拼接后,除去引物部分,获得的12S RNA基因序列为893 bp,经在线Blast比较,证实所得序列为12S RNA基因片段。4 种蛙类的平均碱基含量见表2,G + C含量在46. 1 ~ 46. 7之间,碱基转换与颠换的平均比值R = 2. 09,A + T的含量明显高于G + C的含量,G含量最低,且明显低于其它3 种碱基的含量。

2. 3 遗传多样性分析

应用Dna SP 5. 0 软件计算各群体的遗传多样性参数( 表3,表4) 。中国林蛙的单倍型多样度最高,为0. 933,中亚侧褶蛙的单倍型多样度最低,只有1个单倍型。4 种蛙类53 只个体共定义了21 个单倍型,其中,中亚林蛙的阿勒泰群体和伊宁群体共享1 个单倍型,阿尔泰林蛙的哈巴河群体、布尔津群体和喀纳斯群体共享1 个单倍型。通过Tajima's D检验,中亚林蛙的伊宁群体Tajima' s D值为- 2. 167 66,中性检验极显著( P < 0. 001) 。

注: 括号内数字为样本数,下划线显示的为部分群体间共享单倍型( 2 个) 。

2. 4 遗传分化分析

应用Dna SP软件分析4 种蛙类7 个群体的基因差异程度( 表5、表6) 。结果显示,各群体总遗传分化系数Gst为0. 367 88,总固定系数Fst为0. 871 56,总基因流Nm为0. 04。各群体间核苷酸差异数Dxy在0. 024 3 ~ 0. 671 9 之间,均值为0. 418 2; 核苷酸歧义度Kxy在21. 000 0 ~ 580. 000 0 之间,均值为376. 634 3; 固定系数Fst在- 0. 022 6 ~ 0. 999 4 之间,均值为0. 729 8; 遗传分化系数Gst在- 0. 032 26~ 0. 683 4 之间,均值为0. 243 3。

2. 5 遗传距离与聚类分析

利用MEGA5. 05 软件中的Kumara2 - parameter模型,以田野林蛙( 登录号: AB058865. 1) 、黑龙江林蛙( 登录号: DQ359979. 1 ) 、镇海林蛙( 登录号:KF204597) 、金线侧褶蛙( 登录号: EU386885. 1 ) 为外群,计算了这些群体之间的遗传距离( 表7) 。其中中国林蛙与中亚林蛙之间的遗传距离最大,为0. 158; 中国林蛙与中亚侧褶蛙之间的遗传距离次之,为0. 137; 阿尔泰林蛙与田野林蛙之间的遗传距离最小,仅为0. 001。

用转换和颠换信息构建NJ系统树( 图1) ,分为两个大分支,第一个大分支包括3 个小分支,阿尔泰林蛙的3 个地方群体与田野林蛙聚为一小支,中国林蛙与镇海林蛙聚为一小支,黑龙江林蛙为一小支;另一个大分支包括2 个小分支,中亚侧褶蛙与金线侧褶蛙聚为一小支,中亚林蛙的两个地方群体聚为一小支。

3 讨论

线粒体基因组是母系遗传,不同基因的进化速率也不相同,种群之间的遗传差异易被检出,线粒体基因组中,12S RNA基因相对比较为保守,即它的进化速率偏慢,常用于种间差异[8,9]和近缘种关系研究[10]。4种碱基在线粒体基因组中的分布也呈不均一性,所测定的4种蛙类mt DNA 12S RNA序列,碱基A、T、G、C的平均含量分别为30.5%、23.1%、20.0%、15.5%、26.4%,A+T含量(53.6%)高于G+C(46.4%),符合脊椎动物mt DNA碱基组成的特点[11],与大头蛙属Limnonectes[12]、湍蛙Amolops[13]、棘蛙属Paa[14]的碱基组成基本一致,也反映了蛙类12S RNA碱基组成的特性。

物种的遗传变异反映了该物种适应环境变化能力的强弱,遗传变异程度高,说明群体的多样性越丰富,对环境变化的适应能力也就越强[15];而低的遗传多样性对物种的生存有着不利影响,增加了物种灭绝的风险。根据Grant WS等[16]对线粒体DNA序列的遗传变异的分类,中国林蛙巩乃斯群体、中亚侧褶蛙五家渠群体、阿尔泰林蛙的哈巴河群体和布尔津群体都具有高的单倍型多样度(Hd>0.5)和高的核苷酸多样性指数(Pi>0.005),说明这些群体遗传变异较为丰富,可产生出许多新的突变,有较强的适应能力、生长能力和进化潜力。而中亚林蛙的伊宁群体具有低单倍型多样度(Hd<0.5)和高核苷酸多样性指数(pi>0.005)说明其遗传多样性较丰富;中性检验显示伊宁群体显著偏离中性,提示可能经历过群体扩张或瓶颈。阿勒泰群体只有一个单倍型,说明其遗传多样性非常低。

遗传分化指数值通常用Fst表示,Fst值在0~0.05之间表明群体间的遗传分化程度很小,在0.05~0.15之间表明群体间遗传分化程度中等,在0.05~0.25之间表明群体间的遗传分化较大;Fst>0.25表明群体间的遗传分化很大[17]。除中亚林蛙的阿勒泰群体与伊宁群体遗传分化程度小外,其余群体之间的遗传分化都较大。本研究中,总群体基因流Nm=0.04<4[18],表明各地理种群间的基因流较小,这与群体间遗传分化程度较高的结论相对应。由于新疆地域辽阔,4种蛙类的采集地点是围绕着新疆西北边境的狭长地带,中间有城市相隔,地理屏障可能是影响群体遗传分化的主要因素。

中国林蛙是中国的一个特有物种[19],分布主要局限于长江以北,随着经纬度变化,身体特征会有一定的差异[20],其生物学特性决定了其自然生存环境要有水源存在[21],而且对森林覆盖类型具有一定的要求[22]。巩乃斯位于新疆巴音郭楞州境内,生态环境主要为森林和草地,同时是巩乃斯河系贯通的河谷山地草原,符合中国林蛙的生长环境。同时,受保护区的影响,群体遗传性丰富。中亚林蛙的单倍型多样度在这4种蛙类中最低,说明中亚林蛙遗传变异较低,可能面临生活力下降、个体变小和抗逆性差的问题。在我国,中亚林蛙仅分布在新疆巩乃斯河、伊犁河上游和伊宁县[2]。本研究所用样本采自伊宁县和阿勒泰,说明这些地区的中亚林蛙生存前景堪忧,需要引起足够的重视。中亚侧褶蛙遗传多样性差异较大,表现出明显的地理趋势,阿尔泰林蛙的3个地方群体单倍型多样度都比较高,这与其生态环境密不可分。哈巴河、布尔津和喀纳斯自然条件非常好,至今保持着原始的生态环境,没有对阿尔泰林蛙的生存造成影响。据报道阿尔泰林蛙为“易危”种,种群数量有下降趋势,但从实验结果看,阿尔泰林蛙的遗传多样性是非常丰富的。

新疆分布的4 个群体中,中国林蛙和阿尔泰林蛙遗传距离较小,为0. 035,系统进化树也证实了这一点,中国林蛙和阿尔泰林蛙聚为一支,这与传统的分类相一致。根据染色体对数,林蛙可划分成2n =24 的类群和2n = 26 的类群[23],其中中国林蛙和阿尔泰林蛙属于核型2n = 24 的一组。阿尔泰林蛙是叶昌媛等1981 年报道发现的[1],魏刚[24]认为阿尔泰林蛙是欧洲林蛙2n = 26 与亚洲2n = 24 的林蛙群的过渡种类。杨军校等[25]认为阿尔泰林蛙与田野林蛙( R. arvalis) 的同物异名,本研究也证实了这一点,阿尔泰林蛙与田野林蛙的遗传距离接近0。镇海林蛙属于核型2n = 24 的类群,黑龙江林蛙属于核型2n = 26 的类群[2],因此,新疆地区的中国林蛙首先与镇海林蛙聚为一支,再与黑龙江林蛙聚为一支。中亚侧褶蛙与金线侧褶蛙同为侧褶蛙属,因此先聚为一支,然后与中亚林蛙再聚为一支,说明中亚林蛙与侧褶蛙有更近的亲缘关系。中亚林蛙以前曾命名为欧洲林蛙,费梁1990 年将其订正为中亚林蛙,而中亚侧褶蛙曾命名为湖蛙,叶昌媛等1993 年将其订正为中亚侧褶蛙,由于缺少对中亚林蛙和中亚侧褶蛙深入的研究,有可能导致划分不合理。

用一个基因评估群体遗传多样性差异往往有一定局限性,要进一步研究新疆蛙类的群体遗传结构还需研究线粒体其它基因或核基因,后续将进一步深入开展相关方面的研究工作,探究新疆蛙类的遗传背景,为更加合理保护蛙类提供一定的理论基础。总之,新疆四种蛙类中除了中亚林蛙的遗传多样性较低外,中国林蛙、中亚侧褶蛙和阿尔泰林蛙都表现出丰富的遗传多样性,这与当地良好的生态环境有着密切的关系,探讨新疆蛙类的遗传多样性,有助于对新疆分布的四种蛙类生存现状有清晰的认识,同时也有助于开展保护工作和研究起源、分化,对认识新疆蛙类具着重要的意义。

4 结论

新疆地区的中国林蛙、中亚侧褶蛙和阿尔泰林蛙的遗传多样性丰富,中亚林蛙的遗传多样性较低,各群体遗传分化程度较高; 中国林蛙与阿尔泰林蛙的遗传距离最近; 阿尔泰林蛙与田野林蛙很可能是同物异名; 中亚林蛙还需进一步的研究。

摘要:[目的]为了解新疆地区中国林蛙中亚林蛙、中亚侧褶蛙和阿尔泰林蛙的遗传多样性及系统发育。[方法]分别于新疆7个地方采集了4种蛙类共53个个体,对线粒体12S RNA基因进行了扩增和测序。[结果]经过拼接和比对,得到长度为893 bp片段的序列,4种蛙类共定义了21个单倍型,其中,中国林蛙、中亚侧褶蛙和阿尔泰林蛙遗传变异程度高,而中亚林蛙的遗传变异很低。各群体总遗传分化系数Gst为0.367 88,总固定系数Fst为0.871 56,总基因流Nm为0.04。中国林蛙与中亚林蛙之间的遗传距离最大,为0.158,与中亚侧褶蛙之间的遗传距离次之,为0.137,与阿尔泰林蛙之间遗传距离最小,为0.034。聚类分析显示中国林蛙和阿尔泰林蛙聚为一支,中亚林蛙和中亚侧褶蛙聚为一支。[结论]新疆地区的中国林蛙、中亚侧褶蛙和阿尔泰林蛙的遗传多样性丰富,中亚林蛙的遗传多样性较低,各群体遗传分化程度较高。

遗传类测试题 篇6

模糊聚类以Zadeh提出的模糊集理论[1]为基础,描述了样本在性态和类属方面存在着不确定性,能够客观地反映现实世界,已经成为聚类分析研究的热点。在众多基于目标函数的模糊聚类算法中,模糊C-均值聚类算法[2]理论最完善、应用最为广泛。模糊C-均值聚类算法采用一种迭代的爬山技术来寻找最优解的局部搜索算法,它对初始化值非常敏感而容易陷入局部极小值,对于这一缺点学者们提出了一些改进方法[3,4]。

遗传算法[5]是一种模拟自然进化过程搜索最优解的全局优化方法,是一种与求解问题无关的算法模式,能够有效解决模糊C-均值聚类算法对初始值敏感的问题。文献[6]提出用模糊C-均值聚类算法代替遗传算法的交叉操作,从而实现遗传模糊聚类算法,但由于每次都要运行模糊C-均值聚类算法,且没有对遗传算法做其他改变,所以运行时间和聚类效果不佳。文献[7]也是在遗传算法中引入了模糊C-均值聚类算法,在遗传操作之后,用模糊C-均值聚类算法局部寻优,并使用最短距离法进行整体交叉的操作,提高了算法的全局搜索能力,聚类效果进步不少,但是难以改变时间消耗的问题。本文在这些研究的基础上对遗传算法进行了改进,使得聚类在运行效率和聚类质量上都有一定的提高。

1 遗传模糊聚类

模糊C-均值聚类算法因对初始值非常敏感而容易陷入局部最优,在迭代过程中由于保证不了向着全局最优的方向搜索,所以也就不能保证收敛到全局最优。算法是否能够收敛到全局最优值,这在一定程度上依赖初始值的选择,如此重要的选择让那些学者们在初始化数据时总是想方设法地使用一些更好的办法。

遗传算法是一种最受关注的全局优化算法之一,通过模拟生物进化和遗传过程中个体的选择、交叉和变异机理,来完成搜索问题最优解的过程。它以群体搜索技术进行操作,用遗传算子交换个体间的信息,经过对种群中的个体适应度的评价,使得群体中的个体一代一代地不断进化,并渐渐逼近最优解。它以决策变量的编码作为运算对象,以目标函数值作为搜索信息,从多个点同时搜索,并且使用概率搜索技术,使得该算法有很强的寻优能力,即使是在很复杂的解空间中,也很快就能找到良好的解。遗传算法正是具有这些优点,才能够有效解决模糊C-均值聚类算法易陷入局部极小值的问题。模糊C-均值聚类算法是局部寻优,遗传算法是全局寻优,两者结合起来使用,可以同时体现两个算法的寻优能力,提高了收敛速度,能更好地解决聚类问题。

2 遗传模糊聚类改进策略

目前对遗传算法应用到聚类中已经有许多研究[6,7,8,9],但遗传算法仍然存在局部搜索能力差、容易早熟、效率不高[10]等缺陷,针对这些问题提出一种基于改进遗传算法的模糊C-均值聚类算法,该算法使用遗传算法对初始聚类中心进行优化,而后执行模糊C-均值聚类算法。

2.1 主、副种群隔离机制

传统的遗传算法将个体进化过程放在一个种群内反复进行,这样做使得种群内基因交流畅通,个体很难向着各自的方向发展,从而导致种群多样性的不足。另一个原因是采用比例选择算子有缺陷,当种群中有个别个体的适应度值远远大于种群的平均适应度值时,这些个体将迅速扩张,从而使种群中个体相似度降低,破坏种群多样性。遗传算法全局搜索能力不强的主要原因是种群多样性不足,而小生境技术的引入可以解决这一问题。

种群依据离最优种子的距离动态地分成主种群和副种群两部分,对主、副种群隔离进化,提高算法效率,缩短遗传算法的运行时间。通过设定一个自适应的距离,该距离能够隔离出一个随当前最优种子变化的小生境。针对小生境外部,用较大变异概率的方法实现种群的多样性,而对于小生境内部,主要选择以交叉为主的方法来稳定选择压力,如此划分的目的是使种群的多样性和选择压力达到一种平衡状态[11]。

2.2 实数编码机制

遗传算法主要通过遗传操作对种群中的个体进行重新组成,通过不断优化种群中的个体,渐渐逼近问题的最优解,直至最后达到搜索到最优个体的目的。对于一些高维、高精度要求的优化问题,使用二进制编码将会带来计算误差、编码空间Hamming 悬崖等诸多问题[12,13],为了克服这些不足,提出了实数编码的方法。实数编码是每个个体向量被编码成一个与解向量相同长度的实数向量。遗传操作过程中,遗传空间就是问题空间,个体直接反映了问题的规律与特性。

在遗传算法编码中采用了把聚类中心作为个体的实数编码方式,这种表示方法使用决策变量的真实值来编码,达到较高精度要求,并且个体搜索空间比较大,利于全局搜索。

2.3 双精英参与机制

为了防止己经得到的最优种子不被淘汰掉,所以经常使用精英保留策略来保证算法的收敛性。除此之外,精英种子还能够引导种群向最优值搜索。然而,保留的精英种子和引导搜索的精英种子可能不是同一个种子;若发现某精英种子是已经搜索到的局部极小值时,则需要把它作为己经获得的最优值保存起来,而不能让它再引导种群搜索。因此,为了划分出精英保存策略的功能,提出了双精英种子参与机制,一个是保存起来的己经获得历史局部极小值的精英种子,一个则是作为前最优值引导搜索的精英种子。为此,第一步是采用精英保存策略保存精英种子,而下一代的交叉、变异操作需要引进当前精英个体,使其引导种群向全局最优解逼近;第二步是依照个体适应度值,采用轮盘赌选择策略把当前群体中的个体选出来,并对主、副种群进行相应策略的交叉、变异操作,以提高种群的平均适应度和增加种群的多样性。

3 算法描述

N为种群总规模,N1为主种群的种子个数,N2为副种群的种子个数,初始化时N1和N2约为种群总规模N的二分之一。种群在主副种群距离界限值不断减小的情况下逐步进化,进化中主种群进化比较快,副种群进化相对比较慢,究其原因是主种群里保持比较大的选择压力,而副种群里因变异概率和交叉概率比较大选择压力比较小。

算法步骤如下:

(1)初始化参数,生成初始种群;

(2)计算各个个体适应度值;

(3)判断是否满足停止准则,满足则执行(4),否则执行(9);

(4)求出N1,N2,其中N1=INT(N×0.5) ,N2=NN1;

(5)求出当前最优种子,并计算各种子到当前最优种子的欧氏距离;

(6)计算主副种群的距离界限值L,L为最大距离×0.5和排序后距离向量的中位数,二者中的最小值。根据L划分主副种群并计算N1、N2,设D为个体与当前最优种子的距离,ε为一个设定的极小值,则:

如果 L>ε, N1={DL的个体},N2={D>L的个体};

否则,N1={D>L的个体和当前最优种子},N2=空集。

(7)对主种群和副种群里的种子按各自策略分别进化;

(8)将进化后的主种群和副种群混合生成新种群,令T=T+1,T为遗传代数,返回(2);

(9)求出最优个体;

(10)执行模糊C-均值聚类算法,输出聚类结果。

4 实验仿真及应用

4.1 仿真结果

本文应用改进的遗传模糊聚类算法(简称为IGAFCM)对标准IRIS数据集进行了仿真实验,并与模糊C-均值聚类算法(FCM)、遗传模糊混合算法(HGFA)相比较,三种算法的比较结果如图1和表1。

图1中T表示进化代数,J表示目标函数值,其定义为:J=i=1cj=1nμijmxj-vi2,c代表聚类中心数,n代表样本总数,m为模糊因子(取值一般为2),U=[μij]c×n表示划分矩阵,‖xj-vi‖表示样本xj到聚类中心vi的欧式距离,其中,

图1中J-T曲线是目标函数值J跟随进化代数T的变化趋势。不难看出,随着进化的不断进行,三种算法都能达到相应的目标函数值。曲线变化表明,本文提出的改进算法在达到目标函数值的时候所用的迭代次数最少,即收敛速度要比其他两个算法快,充分体现该算法在收敛速度方面的优势。

三种算法从进化代数、误分数、误分率方面来比较。误分是指本属于某类的样本被错误地划分到其他类的样本,所有类中被错误划分的样本个数之和称为误分数。误分率定义为:

误分率=×100%

表1中数据显示,本文算法在进化次数上最少,误分数最少,误分率最低,即在聚类精度上有一定的提高,从而保证了聚类的质量。

4.2 算法应用

为了进一步验证该算法的有效性并加以利用,取一组实际数据作为测试用例,数据集来自某次学生考试成绩库,试卷包括五个大题,每题20分。实验中抽取总得分为70—80的100位考生的考试数据进行模糊聚类分析。聚类结果如图2所示。

经过大量实验得出聚类结果可有效地分为五个类别,并将聚类后的数据作均值化处理,结果发现五个类别中有一类是各题得分比较均匀,其他四类中总有某一个题目得分比较低,这就给我们提供了聚类的依据,能够充分挖掘、分析试卷数据。

显然,基于本文算法的试卷分析和传统的试卷分析都是把学生成绩作为分析对象,但传统的试卷分析只是考虑了学生的成绩排名情况,所以基于本文算法的试卷分析要比传统的试卷分析有内涵。按照传统的试卷分析方法来看,本文所列举的100位考生应属于一个类别,而基于本文算法的试卷分析将学生依据题目得分高低划分为有意义的若干类别,可以更加深刻和准确地发现这些学生对知识点的理解程度有所不同,掌握知识点的能力不尽相同,这也为以后的教学工作提供了改进的思路和方法,具有一定的现实意义。

5 结语

由于模糊C-均值聚类算法强烈依赖于参数初始化的优劣,而一个靠近最优解的初始化方法将以更少的迭代步骤收敛到全局最优解,所以采用遗传算法初始化聚类中心,并提出了改进的遗传模糊聚类。仿真实验结果体现了改进算法的优越性,并将该算法应用到试卷数据聚类分析中,深层次的挖掘出隐含的信息,有目的、针对性地指导个性化教学。虽然改进后的算法提高了聚类质量,但还遗留许多问题丞待解决,例如在处理数据的维度高、量大时收敛速度比较慢,消耗时间比较多;增加动态聚类分析方法的研究,以便处理数据动态增加的情况;复杂类型数据集聚类分析的研究,寻求新的度量方法,以便处理复杂的数据集等等。

遗传类测试题 篇7

在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。这些部分常称为目标,其他部分称为背景,它们一般对应图像中特定的、具有独特性质的区域。为了辨识和分割目标,需要提取并分离这些区域,在此基础上才有可能对目标进一步利用。图像分割是指把图像分成各具特征的区域,并提取出感兴趣目标的技术和过程[1]。

图像分割在实际中已经得到广泛的应用,例如工业自动化、在线产品检验、生产过程控制、文档图像处理、遥感和生物医学图像分析、保安监视以及军事、体育、农业工程等方面[2]。总的来说,在各种图像应用中,只要需要对图像目标进行提取、测量之处都离不开图像分割。图像分割技术的发展与许多其他学科和领域密切相关。近年来,随着各学科许多新理论和新方法的出现,人们也提出了许多新的图像分割技术。例如不断涌现出利用马尔可夫随机场、专家系统、Gibbs随机场、Bayesian理论、小波模极大值、分形、布朗链、模拟退火、聚类算法和遗传算法等新的分割算法[3,4]。

1 模糊C均值(FCM)聚类算法

聚类分析方法大致可以分为四种类型:谱系聚类法、基于等价关系的聚类法、图论聚类法和基于目标函数的聚类方法。前三种方法由于各种原因实际应用不够广泛,普遍受欢迎的是第四种方法,即基于目标函数的聚类方法。该方法把聚类分析归结成一个带约束的非线性规划问题,通过优化求解获得数据集的最优模糊划分和聚类。该方法设计简单,解决问题范围广,FCM算法就属于这种方法。

给定数据集X={x1,x2,…,xn}⊂R为模式空间中n个模式的一组有限观测的样本集,对给定样本集的X聚类分析就是要产生X的聚类类别数c(2≤cn)划分[5]。硬聚类算法将每个辨识对象严格地划分为属于某一类。不过在实际中一些对象并不具有严格的属性,它们可能位于两类之间,这时采用模糊聚类可以获得更好的效果。FCM算法是由隶属度确定每个数据点属于某个聚类程度的一种聚类算法[6],准备将给定数据集X分为c类,设X中的任意样本xk对第i类的隶属度为μik(0≤μik≤1);该分类结果可以用一个c×n阶矩阵U来表示,该矩阵称为模糊划分矩阵。

FCM的一般描述为:

式中:m称为加权指数,又称作平滑参数;MfcX的模糊c划分空间:

上述目标函数中,样本xk与第i类聚类原型pi之间距离度量的一般表达式定义为:

式中:As×s阶的对称正定矩阵,当A取单位矩阵I时,上式对应于欧氏距离。

聚类的准则是求取Jm(U,P)的极小值min{Jm(U,P)}[4]。

由于矩阵U中各列都是独立的,因此:

考虑到dik可能为0,应分两种情况加以讨论。对于∀k,定义集合IkΙk¯为:

使得Jm(U,P)为最小的μik值为:

用类似方法可获得Jm(U,P)为最小值时pi的值:

若数据集X、聚类类别数c和加权指数m值已知,就能确定最佳模糊分类矩阵和聚类中心。

2 基于模糊聚类的遗传算法

传统基于目标函数法的聚类算法本质上是一种局部搜索方法,它们采用的是迭代爬山技术来寻找最优解,存在的致命问题是容易陷入局部最优解。在一定的条件下,利用遗传算法(GA)可以在搜索空间中收敛到全局最优解。

遗传算法是一种借鉴生物界自然选择和自然遗传机制的随机全局搜索和优化方法。其本质是一种高效、并行、全局搜索方法。它能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程,以求得最优解[7]。

采用遗传算法可以做到对可行解表示广泛、群体搜索性强、不需要辅助信息、内在启发式随机搜索特性,具有固有的并行性和并行计算能力,可扩展性强,易于与别的技术混合等。因此遗传算法不易陷入局部最优解,并能快速可靠地解决求解非常困难的问题[8]。用遗传算法求解聚类问题,首先要解决以下两个问题:

(1) 如何将聚类问题的解编码到基因串中。对于聚类问题的编码,有两种方式:第一种是对硬划分矩阵U进行编码,设n个样本要分成c类,用基因串a={α1,α2,…,αi,…αn}来表示某一类的分类结果,其中:αi∈{1,2,…,c};i=1,2,…,n;第二种是采用对聚类原型P进行编码,把c组表示聚类原型的参数连接起来,根据各自的取值范围,将其量化值(用二进制串表示)编码成基因串b={β1,β2,…,βk,βk+1…,β2k,…,βck},其中每个聚类原型Pi都有一组参数与之相对应。b中的前k个表示的是第一个k维聚类原型,第k+1到第2k表示的是第二个k维聚类原型,同理,共c个聚类原型。第二种方法的搜索空间只与原型参数数目和类别数有关,与数据量无关,搜索空间往往比第一种方法小的多,所以在此采用第二种编码方法。

(2) 如何构造适应度函数来度量每条基因串对聚类问题的适应程度,该方法可以这样判别:如果某条基因串的编码代表着良好的聚类结果,则其适应度就高,反之则低。

对于基于目标函数的模糊聚类问题,其最优聚类结果对应目标函数的极小值,即聚类效果越好,则目标函数越小,而此时适应度越大,因此可以借助目标函数Jm(U,P)来定义GA的适应度函数:

基于模糊聚类遗传算法的实现步骤:

① 设定种群数目N,对聚类原型pi进行二进制编码,并产生初始种群;

② 对初始种群进行解码,并用式(8)计算每条基因串的适应度值;

③ 将适应度大的个体复制到下一代种群中,然后对父代进行选择、交叉、变异等遗传算子运算,产生下一代种群的其他基因串;

④ 如果达到了设定的繁衍代数,返回最优的基因串并解码,否则,返回到步骤③进行下一代的繁衍。

3 图像分割实验结果与分析

ΡentiumR4CΡU2.66GΗz+1024ΜBDDR400+Windows XP Professional平台上,利用 Matlab 6.5编程,用简单遗传算法、传统FCM算法以及该文描述的基于模糊聚类的遗传算法实现对原始图像Lena(灰度图像,像素为256×256)和人造图像(灰度图像,像素为64×64)的分割。实验结果图以及实验分析如图1,图2所示。

这里取基于模糊聚类的遗传算法种群数目N=30,聚类数C=2,搜索代数为200代,交叉率前期为0.6,后期为0.75,变异率为0.02。

从分割图1(d)中可以看出,该算法实现了图像的有效分割,人物轮廓清晰,物体的受光面和阴影面区别明显。在分割图2(a)中,由于添加了高斯噪声,对原图的污染比较严重,但从分割图2(d)上可明显看出,采用基于模糊聚类遗传算法,其分割结果明显优于前两种方法。根据分割评价中的定性实验性准则可知[9],如果算法分割的结果大致相同,那么对预/后处理要求低的算法的相对性能要更优越一些,聚类算法对预处理的要求比较高,对初始点的选择很敏感,所以可能使分割效果不太理想,如图2(c)所示;在引入遗传算法后,利用遗传算法的全局搜索特点,可以解决FCM对初始化敏感的问题,增强了算法的抗噪性,所以图2(d)的分割效果最好。在分割速度方面,传统FCM算法的运行速度较慢,遗传算法自身具有隐并行性的特点,比盲目的搜索效率要高。用遗传算法和聚类相结合的方法,既解决了对初始化敏感的问题,又能在一定程度上提高程序的运行速度。表1列出了对图1、图2进行分割的时间列表。

4 结 语

在此,采用基于模糊聚类遗传算法的图像分割。实验表明,比传统FCM算法和简单遗传算法有了较大的改进。在保持聚类算法良好的分割效果的同时,降低了对初始化的要求,并在一定程度上提高了运行速度,验证了本文方法的有效性。遗传算法与FCM算法的结合正是近年来研究的热点之一。

参考文献

[1]章毓晋.图像分割[M].北京:科学出版社,2001.

[2]章毓晋.图像处理和分析基础[M].北京:高等教育出版社,2002.

[3]IM J,Jensen J R,Tullis J A.Object-based Change DetectionUsing Correlation Image Analysis and Image Segmentation[J].International Journal of Remote Sensing,2008,29(2):399-423.

[4]Wu Yi-Ta,Shih,Frank Y,et al.A Top-down Region Divid-ing Approach for Image Segmentation[J].Pattern Recogni-tion,2008,41(6):1 948-1 960.

[5]高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2003.

[6]匡泰,朱清新,孙跃.FCM算法用于灰度图像分割的初始化方法的研究[J].计算机应用,2006,26(4):784-786.

[7]雷英杰.Matlab遗传算法工具箱及应用[M].西安:西安电子科技大学出版社,2005.

[8]李敏强.遗传算法的基本理论与应用[M].北京:科学出版社,2004.

[9]狄宇春,邓雁萍.关于图像分割性能评估的评述[J].中国图像图形学报,1999(3):183-187.

遗传类测试题 篇8

关键词:遗传算法,聚类分析,交叉概率,变异概率

0 引言

遗传算法(简称GA)作为一种自适应全局优化概率搜索方法,它最早由美国Michigan大学的Holland教授提出。该算法具有很好的鲁棒性、随机性、全局性,现已被人们广泛地应用于以下主要应用领域[1]:自动控制、图像处理、机器学习、数据挖掘。聚类分析[2]是模式识别理论的一个重要方法,聚类分析通常是基于距离的,通过构造一个m维空间的距离函数,利用这个距离函数来进行聚类。传统的基于聚类准则的聚类算法本质上是一种局部搜索算法,它们采用了一种迭代的爬山技术来寻找最优值。因此,存在两个问题:一是处理大数据量费时,二是容易陷入局部极小值。

利用遗传算法可以降低传统聚类算法对初始化的要求。例如傅景广[3]等人提出了一种基于遗传算法的聚类分析方法,该算法采用二进制编码方式对聚类的中心进行编码,用特征量与相应聚类中心的欧氏距离之和来判断聚类划分的质量;张伟[4]等人也提出了一种改进的遗传算法,并用来解决聚类问题;国外也有Krishna K等人于1999年在IEEE上发表的文章《Genetic K-means Algorithm》[5],也是一种遗传K-means聚类算法。本文在总结多位专家学者的研究后,改进了传统GA算法应用于聚类分析中的交叉概率和变异概率,引入了一种与进化代数相关联的交叉概率和与个体适应度相关联的变异概率,它们具有的自适应性质能够较好地改进算法的全局性能。将该改进算法应用到图像聚类实验,并且和k-均值算法进行了比较,结果表明了其准确率明显优越于k-均值算法。

1 改进的遗传算法

1.1 传统的GA

人们习惯上把1975年提出的GA称为传统的GA,它的主要步骤如下。

编码:GA在进行搜索之前先将解空间的解数据表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合便构成了不同的点。

初始群体的生成:随机产生n个初始串结构数据,每个串结构数据称为一个个体, n个个体构成了一个群体。GA以这n个串结构数据作为初始点开始迭代。

适应度评估检测:根据实际标准计算个体的适应度,适应性函数表明个体或解的优劣性。不同的问题,适应性函数的定义方式也不同。

选择:选择的目的是为了从当前群体中选出优良的个体,使它们有机会作为父代为下一代繁殖子孙。遗传算法通过选择过程体现这一思想,进行选择的原则是适应性强的个体为下一代贡献一个或多个后代的概率大。选择实现了达尔文的适者生存原则。

交叉:交换操作是遗传算法中最主要的遗传操作。通过交换操作可以得到新一代个体,新个体组合了其父辈个体的特性。交换体现了信息交换的思想。

变异:变异首先在群体中随机选择一个个体,对于选中的个体以一定的概率随机地改变串结构数据中某个串的值。同生物界一样,GA中变异发生的概率很低,通常取值在0.001~0.01之间。变异为新个体的产生提供了机会。

经典遗传算法的一次执行过程如图1所示,该图给出了第n代群体经过选择、交叉、变异生成第n+1代群体的过程。

1.2 自适应交叉概率pc与变异概率pm的设计

遗传算法中交叉概率控制着交叉算子使用的频率,交叉率越高,群体中结构的引入就越快,已获得的优良基因结果的丢失速度也相应提高了,而交叉概率太低则可能导致搜索阻滞。变异操作是保持群体多样性的手段,变异概率太小,可能使某些基因位过早地丢失信息无法恢复;而变异概率过高,则遗传算法将变成随机搜索。在传统GA算法中,pcpm值在整个遗传优化过程中采用固定值,这就使得遗传算法在应用过程中出现一些问题(如收敛速度过慢、局部极值,很容易出现成熟收敛)。目前,国内外专家学者们认识到:如果pcpm值能随着遗传进程而自适应地变化,那么这种有自组织性能的遗传算法将具有更高的鲁棒性、全局最优性和更快的收敛速度。

文献[6]中设计了与进化代数相关的交叉概率:

mtmp=pc,Max×2(-t/TGen) (1)

pc(t)={mtmpif(mtmppc,Μin)pc,Μinelse(2)

式中,mtmp是一个中间计算变量;TGen为预设的最大进化代数,t为当前进化代数(0≤tTGen);pc,Max是预设置的最大交叉概率;pc,Min是预设置的最小交叉概率;pc(t)是当前种群(第t代)的交叉概率。

在此基础上,本文利用Gauss函数和sigmoid函数构造与进化代数相关的交叉概率计算公式:

pc(t)=(pc,max-pc,min)·f(t)+pc,min (3)

f(t)=e-A(TGen-2t)+(1+e-B(TGen-2t))-1 (4)

式(4)中,AB都为形状参数。该公式有利于加强GA算法在优化初期对新个体的开发和后期保护算法的稳定性。

同一代种群中各个个体的变异概率应该随个体优劣变化而变化。为了保证算法的稳定性,变异概率的取值应该是随进化过程而逐渐减小,从而使群体能够迅速集中。基于此,给出一种具有自适应的变异概率pm

pm(t)=exp(fmax-f(Xi)fmax)(pm,max-pm,min)f(t)+pm,min(5)

式(5)中, f(t)为式(4),f(Xi)为待变异个体的适应度值,fmax为第t代群体中的最优个体适应度值。pm,max为预设置的最大变异概率;pm,min为预设置的最小变异概率;pm(t)为第t代种群中个体的变异概率。

2 算法设计描述

综上所述,结合传统的GA算法,改进的自适应遗传算法步骤如下。

Step 1:初始化相关参数

初始化种群总数PopSize,初始代数T=0,预设的最大进化代数TGen,预设置的最大交叉概率pc,max,预设置的最小交叉概率Pm,min,为预设置的最大变异概pm,max;预设置的最小变异概率pm,min,选取参数AB的值。

Step 2:产生初始种群

产生PopSize个满足约束条件的初始染色体xn,xi,min≤xixi,max,k=1,2,…,PopSize,xi,min和xi,max分别为第i个染色体的约束条件,并计算每个染色体的评估值Value。

Step 3:适应值与评估值计算

对这个群体以Value值排序,求出序号index,根据index计算适应度值f(index),记录当前群体中最优和最差个体。建立适应度数组cfitness[PopSize],cfitness[i]的值为从第1个个体到第i个个体适应度值之和与所有个体适应值总和的比例。

Step 4:遗传运算

①选择运算

采用比例选择法执行选择操作,形成种群规模为PopSize的父代。

②交叉运算

对选择出的每一个染色体计算根据公式(3)、(4),以求得当前的,每个个体对按交叉概率pc经过杂交(即互换串中部分代码)产生两个新的子个体。

③变异运算

在群体中随机地选择一个个体,对于选中的个体以当前变异概率pm(由公式(4)、(5)求出)改变字符串中某位上的字符的值,以得到新的个体。

Step 5:停机判断

当前群体的进化代数是否大于最大迭代次数或是否达到最优解,否则转到Step 3继续执行。

3 实验仿真

目前国内外学者多用数据集进行聚类仿真并分析结果,本文现给出改进的自适应遗传算法在图像聚类方面的应用。通常在所给出的一幅图像中同时含有多个物体,在图像中进行聚类分析时需要对不同的物体分割标识。将改进的自适应遗传算法应用于图像聚类分析的重点是寻找这些物体特征的相似性。分别对三幅不同的二值图像分别应用本文算法和k-均值聚类算法进么图像聚类划分。要想对图像中的物体进行归类,则必须先找到各个物体,让计算机能够识别它们,因此,首先要确定物体是否是独立的目标物体,此处,图像中物体的标识依据图像的8点连通域判别方法。

图2(a)、图2(b)、图2(c)图分别为标准体数字的二值图、包含不同大小的几何图形物体的二值图、手写体数字的二值图。分别对三幅图用本文算法和k-均值聚类算法进么图像聚类划分,k-均值算法的迭代次数都设为100,物品间的距离计算公式采用欧式距离法。本文算法参数选取为:TGen=100,pc,min=0.1,pc,max=1,pm,min=0.01,pm,max=0.1,A=0.2,B=6.0。结果如图3所示(在进行聚类划分时,通过观察,可分别为图2(a)、图2(b)、图2(c)图标记类中心数目为4、3、4,)。

图3的各子图中,图3(a)-图3(c)图为应用k-均值聚类算法划分结果;图3(d)-图3(f)为应用本文算法划分结果。各子图内每个物体(数字或几何图形)的右下标即为类号,例如(d)图中,数字“4”的右下标都为1,说明被划分到“第1类”;数字“1”的右下标都为2,说明被划分到“第2类”;数字“2”的右下标都为3,说明被划分到“第3类”;数字“3”的右下标都为4,说明被划分到“第4类”。

为了比较两种算法,此处,定义识别率为ψ,令

ψ=nΝ(6)

其中,n为当前被正确识别的物体数目,即既不存在同类物品归入不同类中,也不存在不同类物品归入同类中。N为总的识别物体数目,计算图3各子图中的识别率,统计得到表1。

由表1可知,本文算法对3幅图像中的物品均达到了准确的聚类划分,没有误差,而k-均值算法对3幅图像的物品的聚类划分都没有“成功”,效果不佳。实验表明,对比于k均值聚类算法,本文算法具有较好的聚类划分效果。

4 结束语

文中提出的一种改进的自适应遗传算法的聚类分类,在保证全局寻优能力和收敛速度的前提下,进一步提高了在聚类分析上的准确性,并通过实验仿真对比说明这一方法的可行性。但是,当图像内含物体(样品)数量多,物体(样品)本身有较高复杂性等情况时,用本文算法还是难以达到很高的准确率。因此还有许多工作有待进行更深一步的细致研究。

参考文献

[1]张文修,梁怡.遗传算法的数学基础[M].西安:西安交通大学出版社,2000.

[2]Han J,Kambr M.Data mining:Concepts and techniques[M].Be-jing Higher Education Press,2001.

[3]傅景广,许蹦,王裕目.基于遗传算法的聚类分析[J].计算机工程,2004.

[4]张伟,廖晓峰,吴中福.一种基于遗传算法的聚类新方法[J].计算机科学,2002,29(6):114-116.

[5]Krishna K,Muay MN.Genetic K-means Algorithm[J].IEEE Trans.on System,Man,and Cybernetics,Part B,1999,29(3):433-439.

遗传类测试题 篇9

在数控加工作业中,通常要求CAM软件能够读取Auto CAD的图形数据并将其转化为数控加工系统所执行的加工G代码。图形交互式文件(drawing interchange format,DXF)是Autodesk公司推出的Auto CAD与CAD/CAM编程系统进行加工图形数据交换的标准格式文件[1]。但DXF文件中的图形元素是依据产品设计人员绘制图元的先后顺序而自动保存的,具有一定的随机性。若CAM系统对读取的DXF文件图元数据不进行优化处理而直接产生加工G代码,会造成数控加工系统刀具的空程路径过长和频繁起落。根据加工对象的复杂度即加工轨迹段数量,非切削时间占整个加工任务周期的15%~30%[2]。当加工轨迹段较复杂时将明显降低加工效率并影响刀具使用寿命,因此对DXF文件中的加工图元信息进行空程路径优化显然尤为重要。

目前,国内外学者对数控加工路径优化做了许多研究,但大多集中在孔群加工路径优化[3,4,5,6],平面加工轮廓的路径优化也有部分相关研究,但主要针对封闭式加工轮廓或支持简单图元类型,而对多图元复杂混合轨迹加工路径优化问题的研究相对较少。通常孔群路径优化问题可当作旅行商问题(traveling salesman problem,TSP)进行求解,即孔群被认为是一系列点来处理,由于处理对象单一,其数学模型较为简单。而平面加工轮廓路径优化可转化为广义旅行商问题(generalized traveling salesman problem,GTSP)求解。针对平面封闭式轮廓轨迹路径优化的研究,相关算法有最短近邻算法[7,8]、结合局部搜索的蚁群算法[9]和遗传算法[10],但此类研究均没有对非封闭及多类图元混合轨迹图形路径优化进行说明。

根据数控加工行业的需求,本文提出基于改进遗传算法的多类图元混合复杂轨迹加工路径优化策略。针对复杂路径优化问题,引入直线、圆弧、椭圆弧和B样条等图元数据对象,基于GTSP问题模型,应用改进的遗传算法求解全局最短路径,并对封闭式轨迹段和非封闭式轨迹段进行起点计算与局部寻优,以实现多类图元混合轨迹加工路径优化。该方法不仅可显著减少刀具空走路径,提高加工效率,而且可方便扩展图元类型,适用于木工、型材、电子等多个行业。

1 加工路径图元数据读取

为满足CAM编程系统的兼容性与扩展性,采用C++面向对象的思想,并基于开源C++库dxflib构建DXF文件读取类库。其中,dxflib库的可靠性高,可实现任何操作系统上的DXF文件的读取,且不产生任何附加成本[11]。DXF文件具有严格规范的存储格式,由标题段、表段、块段、实体段、对象区段和文件结束段6部分组成,其中加工图形几何信息均定义在实体段中,一个实体对应一个图元。DXF文件读取流程如图1所示。

2 问题描述与数学模型

在数控加工过程中,通常需要对多个轨迹图形进行一次加工完成,以缩短换刀次数和换刀时间,提高机床加工效率。但在多个轨迹图形加工过程中,相邻两个加工图元之间需要跳刀空走,并从加工图形文件读取的加工图元排列无序,且加工轨迹图形数量通常较庞大,若不进行加工空程路径优化,将严重影响加工效率。

针对木工、型材、电子等行业数控雕刻、切割、钻铣加工,其加工轨迹从曲线类型上一般包含点、直线段、圆弧、椭圆弧和B样条等图元。由于加工路径由一系列轨迹图形组成,路径优化即是对加工轨迹图形进行合理排序,使轨迹间跳刀距离总和最短。由于优化过程中只需关注图元间的距离,因此为简化问题模型及便于遗传算法编码,本文提出将加工图元重构:1)对于由点、圆、椭圆形成的单轨迹图形,只考虑图元的中心点;2)对于由直线、圆弧、椭圆弧或B样条形成的单图元轨迹图形,只考虑图元的两端点;3)对于由多个图元构成的非封闭式轨迹图形,将该多个图元组成一个组合体,忽略图形中间节点,取轨迹图形两端点;4)对于由多个图元构成的封闭式轨迹图形,取其中任意一点作为初始点。

多图元混合加工路径可看作不同类型轨迹段图形(包括单个非封闭图元、单个封闭图元、多图元非封闭式图形和多图元封闭式图形)的集合。对于单个非封闭图元或多图元非封闭式图形,两端点均可作为加工轨迹段起始点;对于单个封闭图元,轨迹段图形上任一点可为加工起始点;对于多图元封闭式图形,任一节点都可以作为加工轨迹段的起始点。加工路径的优化即通过算法对所有加工轨迹段进行排序及加工轨迹起点与方向选择,使得按所排顺序形成的加工回路最短。

因此,多图元混合加工路径优化问题的数学模型为:给定m个点集V1,V2,…,Vi,…,Vm,把Vi内的点数记作ni,则m个点集的总点数n=n1+n2+…+ni+…+nm(i=1,2,…,m)。从每个点集Vi中取1~2点(如对于非封闭轨迹段取两端点,对于封闭轨迹段任取一点)构成赋权图Gj(j=1,2,…,n1,n2,…,nm),需要找到一条可遍历m个点集的最短Hamilton回路Lj,则刀具的最短加工路径L应满足[10]

其中D(L)、D(Lj)分别表示路径L和Lj的长度。

由数学描述可见,多图元混合加工路径优化问题是一个带约束且节点可变的第二类GTSP问题。目前针对该类问题的研究相对较少,文献[12]提出了基于最短路径思想的重构距离矩阵算法,将第二类GTSP转化为第一类GTSP,再利用混合遗传算法进行求解,该算法复杂,实现过程较困难。本文针对加工路径中不同轨迹类型进行个性化编码设计,直接将多图元混合加工路径优化问题转化为TSP问题求解,然后通过轨迹段(包括封闭式与非封闭式)起点计算和路径自调整简易算法对优化后的轨迹段序列进行后处理,从而获得多图元混合加工路径最短空程距离。

3 多类图元混合加工路径优化策略

遗传算法是一种通过模拟自然界的进化过程,搜索全局最优解或近似最优解的方法,具有良好的鲁棒性、隐式并行性和全局搜寻能力,对于加工路径的优化具有良好效果,但也存在易于过早收敛和难以跳出局部最优解的不足。文献[13]与贪心算法结合,提高了搜索效率和结果,但增加了程序运行成本。为将多图元混合加工路径优化复杂问题转化为数学模型简单的TSP问题,对不同轨迹段图形进行分类编码设计,并采用线性定标及自适应遗传算子等方式进行初步路径排序,最后通过加工路径后处理算法求解最短加工路径。

3.1 基于改进遗传算法的全局路径优化

3.1.1 染色体编码

实数序列编码相对于二进制编码、参数编码等方式,具有良好的适用性和可操作性,可解决多图元轨迹混合路径编码带来的复杂问题,故本文采用实数序列编码。由于多图元混合加工路径存在直线、圆弧、椭圆弧和B样条单个图元以及非封闭轨迹图形,为适用TSP问题的遗传算法求解,故根据加工轨迹段图形类型进行分类编码,染色体编码见表1,Pi表示第i个编码点对象。

3.1.2 初始化种群

当染色体编码完成后,需产生一个初始种群当作遗传进化的初始解。对于加工路径优化问题,种群大小一般随着轨迹段数目而改变,取值范围50~200[8]。根据轨迹段数量自适应调整种群大小的函式定义:

其中,M表示种群数目;N表示加工轨迹段数目;k表示不同加工轨迹所对应的取值。

如式(2)所示,种群个数M在50~200之间随加工轨迹段数目不同而自动变化。

3.1.3 适应度函数

适应度函数是评判种群中个体优劣程度的指标,根据所求问题的目标函数进行评估。适应度值大的个体被遗传到下一代的概率较大,适应度值小的个体被遗传到下一代的概率较小。由于每段加工轨迹本身长度不变,其长度总和可视为常数C。为保持良好个体的竞争力并且抑制早熟情况的出现,针对适应度函数引入线性定标方式进行调整,由此个体适应度函数为

其中,k和l为适应度调整系数。

3.1.4 选择、交叉和变异

1)交叉和变异概率的自适应处理

通常遗传算法中的交叉和变异概率均采用固定数值,无法反映种群的进化过程。为进一步避免出现早熟现象,防止算法在搜索空间中陷入局部最优情况,对交叉和变异概率在平均适应度值处进行自适应缓慢调整处理,提高适应度接近平均适应度个体的交叉和变异概率,保证当代种群中优良个体仍具一定的交叉和变异概率。为了能在算法演化后期尽可能地保留较优个体,应平滑最大适应度值处的自适应调整曲线,改进后的交叉和变异概率自适应处理函数为

其中,fmax和favg分别为每一代群体中的最大适应度值和平均适应度值;f'和f分别为交叉的两个个体中较大的适应度值和变异个体的适应度值;pc1和pc2分别为交叉概率的上限和上下幅值;pm1和pm2分别为变异概率的上限和上下幅值。

2)操作算子

选择算子:采用多轮轮盘赌选择算子,根据M个个体的适应度计算选择概率并划分M个区间,计算每个区间产生的随机个数,利用产生的随机个数取最大值所在区间对应的个体作为本轮选择的个体,重复选择M次以达到种群大小。

交叉操作:采用部分映射杂交,先随机地在父体中选取两个杂交点,再交换相应段,然后根据段内的值确定部分映射。

变异操作:采用均匀变异运算,对个体定义一个较小区间作为变异域,随机取一个数代替变异域,得到变异后个体。

3.2 路径优化后处理

设遗传算法排序所确定的初步路径为

其中,i=1,2,3,...,m;m为轨迹段数;Pi为LGA中第i条轨迹段的编码几何点;LGA的总长度为

其中,d(PiPi1)是点iP到Pi1的距离。

对于封闭式轨迹段图形,其起点可在节点集中任意选取,通过为每条轨迹段选择新的起点使得d(PiPi1)减小,以缩短D(LGA),达到进一步优化加工路径的目的;对于非封闭式轨迹段图形,由于是利用该轨迹段两端点连线的中点进行遗传进化,因此需对该段轨迹的始终点进行合理选择才能确保刀具空程最优。

设当前路径序列为L,其初始值为LGA,具体算法实现如下:

1)遍历遗传算法排序所确定的路径序列L,并获取轨迹段i;

2)判断该轨迹段的类型,若属于单图元封闭式轨迹如圆、椭圆则执行步骤3);若属于多图元封闭式轨迹段则执行步骤4);若是非封闭式轨迹段则跳至步骤5);

3)取当前轨迹段i几何点iP、上一轨迹段几何点Pi-1和下一轨迹段几何点;建立过Pi1和Pi1两点的直线Pi1Pi1,并计算该直线与当前轨迹段i的交点,若存在一个交点,则取该交点为当前轨迹段i新几何点,若存在两个交点,则取其中任一交点为当前轨迹段i新几何点,若无交点,则过当前轨迹段i几何点iP作垂直于直线LPi1,Pi1的直线LiPO(O为垂点),并计算直线LPiO与当前轨迹段i的交点,取该交点为当前轨迹段i新几何点;当i=1时,则计算直线PiPi1与当前轨迹段的交点,并取其为当前轨迹段i的新几何点;当i=m时,则计算直线Pi1Pi与当前轨迹段的交点,并取其为当前轨迹段i的新几何点;将新几何点更新至路径链表L中,并跳至步骤7);

4)依次取封闭式轨迹段i的每一个节点vj(j1,2,3,...,ni),计算vj到前一条轨迹段的新几何点pi1(i=1时P0用原点代替)和到后一条轨迹段的原始几何点pi1(i=m时Pm+1用原点代替)的距离之和,把具有最小距离之和的点vj作为轨迹i的新起点,更新到路径L中,并跳至步骤7);

5)对于非封闭式轨迹段i的节点vj(j=1,2,3,...,ni),取两端点v1、,依次计算v1、到前一段轨迹的新几何点pi-1(i=1时P0用原点代替)和v1、到后一条轨迹段的原始几何点pi+1(i=m时Pm+1用原点代替)的距离,并分别记为,形成的路径组合有则将v1作为该段轨迹起点,为终点,若,则将作为该段轨迹起点,v1为终点,并重构更新到路径L中;

6)计算该段轨迹两端点v1、之间的距离di,若di>d(PiPi-1)+d(PiPi+1),则将第i-1与i段轨迹调换顺序,并计算i-2到i+2段间的路径总和åi,1,同理将第i与i+1段轨迹调换顺序并计算i-2到i+2段间的路径总和与原路径相比,取最小路径所对应的轨迹序列更新至整个路径链表中;

7)若i≤m,转步骤1),并计算下一轨迹段的新起点。

4 路径优化流程

多类图元混合加工路径优化过程主要涉及图元数据读取、图形重构与编码、遗传进化优化和局部路径寻优计算,多图元混合路径优化流程如图2所示,具体步骤:

1)通过读取DXF文件,获取图元信息;

2)对路径图形进行重构处理,并根据图形类型进行分类编码,将多图元路径优化问题转化为TSP模型;

3)定义线性定标适应度函数,并确定遗传算法的算子和参数,包括选择、交叉和变异方法、群体容量M、最大遗传代数N等;

4)根据轨迹段数量自适应计算初始种群大小,种群中的个体则称为染色体,此时遗传代数为零,即N=0;

5)使用上述确定的适应度函数,计算群体中每一个染色体的适应值;

6)通过适应度判断该群体是否满足结束条件,若满足则结束算法,否则继续执行;

7)对当前群体进行遗传操作(选择、交叉和变异),直至形成下一代群体;

8)判断新产生的群体是否能满足结束条件,若满足则继续下一步,否则返回步骤7);

9)遍历遗传算法排序形成的加工轨迹段序列,根据轨迹段图形类型进行相应的轨迹段加工起始点计算,以确保加工路径局部近似最优;

10)获取优化后的加工路径。

5 实验及其结果

算法基于Windows 7操作系统实现,计算机配置为Pentium(R)Core(TM)i3-3110 CPU 1.8 GHz。采用GAlib(Genetic Algorithm Library,美国麻省理工学院的Matthew Wall用C++开发的一套遗传算法类库,其设计合理、功能强大且易于扩展)结合Visual Studio2010编写程序验证算法的有效性。

基于改进遗传算法的多类图元混合路径优化程序界面及未优化测试用例如图3(a)所示,测试用例从DXF文件读取的路径涵盖单个直线段、圆弧、椭圆弧和B样条图元以及由多个图元构成的非封闭和封闭式轨迹图形。在对加工路径进行优化时,改进遗传算法的初始种群数为65,初始交叉率为0.8,初始变异率为0.01。如图3(b)所示为经改进遗传算法优化并结合后处理算法所得最短路径结果。

图4为改进算法与传统遗传算法的实验结果对比图。可以看出:采用改进的遗传算法并结合后处理技术得出的加工路径优化结果优于传统遗传算法,具有更快的收敛速度,并改善了传统遗传算法的早熟和易陷入局部最优的缺点。

6 结语

针对DXF文件中图元排列无序和多类图元混合加工路径中的单图元轨迹段与多图元组合轨迹段、非封闭式轨迹段与封闭式轨迹段给加工走刀路径优化带来的困扰,提出基于GTSP问题模型与改进遗传算法的加工路径初步排序方法。通过对不同轨迹段的分类编码,将复杂的第二类GTSP模型转化为TSP问题,同时采用基于线性定标及交叉、变异概率自适应处理的遗传算法加工路径进行全局路径初步排序,再通过轨迹段的起点计算与局部寻优实现最短路径优化,有效解决多类型图元混合加工路径的优化问题,可广泛应用于电子、木工、铝材等加工行业,提高机床加工效率。

摘要:为解决数控加工中复杂轨迹的排序规划问题,提出基于改进遗传算法的多类图元混合加工路径优化方法。针对不同轨迹段图形进行分类编码设计,将适用多类图元混合路径优化的第二类GTSP模型转化为TSP问题,同时在遗传进化过程中采用线性定标和自适应遗传算子等方式进行全局路径排序,最后通过封闭式与非封闭式轨迹段的起点计算与局部寻优求解最短路径。通过扩展应用开源GAlib库进行了测试,试验证明:算法快速收敛,有效解决多类图元混合路径优化问题,可提升数控机床加工效率。

上一篇:纪录片的发展趋势下一篇:生物农药