遗传程序设计

2024-09-20

遗传程序设计(通用12篇)

遗传程序设计 篇1

摘要:遗传程序设计是近几年各专家学者研究的热点之一。主要论述了6种线性遗传程序设计的原理, 比较分析了各线性遗传程序设计的共同点和差异性, 简单介绍了各遗传程序设计的应用领域, 总结了针对不同的问题采用相应的遗传程序设计的方法。

关键词:遗传算法,线性遗传程序设计,基因

0 引言

线性遗传程序设计是一个对个体进行线性表示的遗传程序设计方法。线性是一个涵义很广的数学或物理概念, 在不同的情况下有不同的定义。数学中线性函数、线性规划等问题, 物理中有线性元件。喜欢视频编辑的人都知道有线性编辑、非线性编辑之说。“基因在染色体上呈线性排列”并不是说基因的形状是线形的, 而是指基因的排列是线性的 (注意是“线性”, 而不是“线形”) 。基因线性排列是指基因是一个接着一个, 之间没有重复、倒退、分枝等现象。

1 线性GP原理

1.1 GADS

Paterson和Livesey介绍了一种被称为GADS (Genetic Algorithm for Deriving Software) 的技术, 其基因型个体是表示某语法定义的产生式编号的整数序列。该序列用来生成表现型个体, 即相应语法定义的程序。在这个技术中, 基因型是表现事物语法的一系列整数。这被用来产生表现型, 表现型是用被这种语法定义的语言来编写的一个程序。这种表现型语言的语法是用Backus Naur Form (BNF) 来写的。因为每一个用一种语言编写的形式良好的程序都可以用一个产生式来表示, 任何一个产生式都可以用一系列的整数来表示。这些整数符合在推导过程中产生的成果, 任何程序都可以用一系列整数来表示。在GADS中, 这是程序表示的基础。在某些问题上, GADS比传统的以树为基础的遗传程序设计更加有效。

1.2 笛卡尔遗传程序设计

在笛卡尔遗传程序设计 (Cartesian Genetic Programming, 简称CGP) 中, 一个程序被表示为一个被编上了索引的曲线图。曲线图是用一个线性的整数串的形式来编码的。输入或终结符集和结点输出都被顺序编号了。结点函数也是独立编号的。基因型仅仅是一连串的集合和函数结点。然后, 把基因型映射到一个可以作为一个程序执行的编上了索引的曲线图。演化算法被用来使基因型进化。在CGP中, 有大量的冗余, 这些冗余用来增加有用的中立潜能。在CGP中, 没有必要的修改机制。CGP已经被证明对布尔函数学习问题十分有效, 并且已经延伸到真值数据和具有时间依赖行为的问题。

1.3 二进制遗传程序设计

二进制遗传程序设计基因编码采用二进制串, 表现型用程序树来表示。BGP有一个映射转换图表, 该表就是把固定长度 (5个比特) 的二进制串转换成函数和终结符。二进制串的第一个比特被称为分类比特, 指出这个比特是一个函数的编码, 还是一个终结符的编码。一个基因型-表现型的映射是为了确保所研究问题的表现型的解决可行性而构造的。以防万一只剩一个非终结符又没有指定一个终结符, 采取了一种补救机制:以一个合法的符号替换不合法的符号。因此, 规范的遗传算法可以用来寻找问题的解。在编码时, 有一定量的冗余, 比如:不止一个串被映射到同一个符号上。中性变体因此是时常发生的, 并且在维持遗传基因的多样性方面扮演重要的角色。

二进制遗传程序设计中的映射框图如图1所示。

1.4 线性遗传程序设计 (LGP)

线性遗传程序设计 (Linear Genetic Programming, 简称LGP) , 是遗传程序设计 (GP) 的变体。与基于树的遗传程序设计相比较, 它的主要特征是:演化个体不是用一种功能性的编程语言表达的表达式, 而是用一种命令式的语言编写的程序。这能极大地促进进化过程, 无论一个个体最初如何被表示, 最后它总是必须同样地被表示成一个机器密码, 如同适应度评价需要实际的实行一样。在LGP中演化的基本单位是原始的机器码的指令, 这些指令是运行在浮点处理单元上的。因为, 不同的指令可能有不同的长度, 在LGP中, 将指令协调地放在一起形成一个一个的32位的指令块。每个指令块到底是包含一条还是多条原始机器码指令, 取决于指令的长度。一个交叉点只能在一条指令与另一条指令之间, 绝对不能在一条指令内部。然而, 变异操作却没有这样的限制。一个LGP个体是由一串可变长度的简单的C语言指令表示的。指令是对编有索引的变量 (寄存器) r, 或者对来自预定义集合中的常量进行操作。

1.5 语法演化

语法演化 (Grammatical evolution, 简称GE) 中使用一种语言的BNF规范作为其输入, 并且允许它产生用任意语言编写的, 任意复杂度的程序。GE和GADS技术是相似的。给出一个问题和一个适合的预先确定的BNF定义, 然后使用基因型, 将开始字符映射成终结符, 通过读取8个比特的密码子来产生一个相应的整数。在这个过程中, 将选择出一个合适的产生式。通过使用MOD来选择一个规则。在从基因型向表现型映射的过程中, 个体有可能用光所有的密码子, 在这种情况下, 个体被包装并且重复使用密码子。这种包装结果的技术造成真实的基因长度一般来说比有效基因更长。每个GE个体都是可变长度的二元数组, 包含在其基因码中的信息用来从BNF语法中选择一个产生式规则。

1.6 基因表达式程序设计

在基因表达式程序设计中, 个体被编码成固定长度的线性串 (基因组或染色体) , 然后被表达成不同长度和形状的非线性实体 (简单图表示或者表达式树) 。基因表达式程序设计, 是一个基因型/表现型结构的基因算法 (线性的和非线性的) 。基因表达式程序设计使用由一个头和一个尾这样结构的基因组成的线性染色体。染色体的功能和染色体组的功能是一样的, 并且可以通过突变、变换、根变换、基因变换、基因重组、一点--两点重组这些方法进行改变。染色体对被选择出来的对象的表达式树进行编码。

2 线性GP比较分析

上面简单介绍了各种线性GP算法的基本原理。之所以提出各种不同的线性GP, 是因为各种线性GP都有自身的特点, 都有其自身适用的领域。下面对以上提到的几种线性GP作个简单的比较。

2.1 共同点

(1) 它们的个体表示都是线性的。

(2) 它们都通过基因型———表现型映射的机制, 将问题的搜索空间和解空间严格区分开。

2.2 不同点

(1) 具体的编码方式不一样。具体的比较见表1。

(2) 由于编码方式不一样, 遗传操作一般不完全相同, 像LGP的交叉操作, 交叉点位置的选择就有限制。像BGP的选择操作中, 要添加必要的修改机制。

(3) 具体的应用方面也不一样。

3 线性GP的应用

(1) 董红斌、刘亦龙从个体的表示方法和种群结构入手, 提出用知识库存放描述式 (descriptor) , 并提出多目标机制, 以达到简化个体的表示, 提高种群中个体的多样性, 以及使用户能够引导搜索过程的目的。

(2) 四川大学在2000年底开始对GEP进行跟踪研究, 在公式发现、函数挖掘、关联规则挖掘V因式分解和太阳黑子预测中获得好的进展。用于说明基因表达式程序设计的高效性和多功能性的问题包括符号退化问题、伴随和不伴随常量创建的连续归纳、堆栈问题、用于密度分级的细胞自动复制规则的问题、布尔概念学习的两个问题:11路复用器和遗传程序设计规则。

(3) Wolfgang Banzhaf将BGP算法思想应用于优化回归问题的数学模拟, 由此实现运用基于GPM的遗传算法解决有限制条件的优化问题。

(4) Norman R.Paterson和Mike Livesey将GADS算法应用于手推车中心化问题上, 并总结说明GADS在该问题上是简单可行的。

(5) Julian F.Miller, PeterThomson将CGP应用于六次多项式的符号回归问题、控制一只人工蚂蚁遍历Santa Fe蚂蚁踪迹。并归纳说明CGP在解决Santa Fe蚂蚁问题上并不比其它形式的GP差。

4 结束语

GP的思想是上世纪90年代初提出的, 而作为GP的变体———线性GP是一个十分崭新的研究领域。线性GP的种类有很多, 并且各自有不同的应用方面。今后可以进一步研究并比较各种线性GP的效率、搜索空间、收敛速度等相关方面, 以便将它们更合理地应用到各个方面。

参考文献

[1]王小平, 曹立明.遗传算法——理论, 应用与软件实现[M].西安:西安交通大学出版社, 2005.

[2]Chi Zhou, gene expression programming and rule induction for do-main knowledge discovery and management, Doctoral dissertation, Department of Computer Science, University of Illinois at Chicago, Chicago, IL, 2003.

[3][美]G.科内尔.Java核心 (第2版) [M].杨秀军, 丁兴农, 何粼, 等, 译.北京:科学出版社, 1997.

[4]唐常杰, 张天庆, 汪锐, 等.基于基因表达式编程的知识发现——沿革, 成果和发展方向[J].计算机应用, 2004 (10) .

[5]周宇, 宋捷.使用TCL语言实现DHCP的冒烟测试[J].软件导刊, 2008 (4) .

遗传程序设计 篇2

知识:1.领会伴性遗传的特点。 2.理解人类红绿色盲症。

能力:1.通过分析人类红绿色盲症的遗传,培养学生的推理能力。

2.举例说出伴性遗传在实践中的应用。

情感:通过学习,树立优生、关爱生命、关爱遗传病患者的意识。

学习重点:1.伴性遗传的特点。 2.人类红绿色盲症的遗传。

学习难点:1.分析人类红绿色盲症的遗传。 2.伴性遗传在实践中的应用。

我的课堂:

自学等级

一.情境导入:

二.课前预学:

1.发现色盲症的第一人是 ,被发现是色盲症的第一人是 ,《论色盲》是 写的。

2.基因由 携带着从亲代传给下一代。即基因在 上, 和 存在着明显的平行关系。(萨顿)

3.摩尔根在研究果蝇时发现,基因在染色体上呈 排列。

4.染色体可分为 和 两种。

5.伴性遗传是指控制生物性状的基因位于 上,所以遗传上总是和 相关联。

6.色盲基因只位于 上,为 基因,可表示为 。

7.请填出人的正常色觉和红绿色盲的基因型和表现型

女性 男性

基因型

表现型

三.合作探究:

1.分析下面几组人类红绿色盲症家族系谱图:

第一组: 第二组:

P 正常女性×色盲男性 P 色盲女性×正常男性

↓ ↓

子代 男女正常 子代 正常女性 色盲男性

根据上述材料分析可得出什么结论?

由第一组可得出:色盲基因为 基因。为什么? 。

由第二组可得出:色盲的遗传方式为 。为什么? 。

综合一、二可得:色盲的遗传方式为 。

2.分析红绿色盲的两种交配方式:(即P35—图2—12和图2—13)

得出:红绿色盲具有 (或 )的特点。

3.阅读教材P36,学生分组完成图2—14和图2—15的遗传图解。

得出:男性患者 于女性患者;女性患者的父亲和儿子 是患者。

四.我的疑问:

五.自我检测:1.伴性遗传是指 ( )

A.性染色体控制的遗传方式 B.X染色体所表现的遗传方式

C.Y染色体所表现的遗传方式 D.性染色体上的基因与性别相联系的一种遗传方式

2.下列有关性染色体的叙述正确的是 ( )

A.多数雌雄异体的动物有性染色体 B.性染色体只存在于性腺细胞中

C.哺乳动物的体细胞中没有性染色体 D.植物的性染色体类型都是XY型

3.某男性色盲,他的一个次级精母细胞处于后期时,可能存在 ( )

A.两个Y染色体,两个色盲基因 B.一个X染色体,一个Y染色体,一个色盲基因

C.两个X染色体,两个色盲基因 D.一个X染色体,一个Y染色体,没有色盲基因

4.血友病是伴X隐性遗传病,下列哪种基因的传递是不可能发生的 ( )

A.外祖父→母亲→女儿 B.祖母→父亲→儿子

C.祖母→父亲→女儿 D.外祖母→母亲→儿子

5.某女同学在体检时发现是色盲,该同学的父母的色盲情况是 ( )

A.父色盲,母正常 B.父正常,母携带者 C.父正常,母色盲 D.父色盲,母携带者

6.(08广东)右图为色盲患者的遗传系谱图,以下说法正确的是 ( )

A.II-3与正常男性婚配,后代都不患病

B.II-3与正常男性婚配,生育患病男孩的概率是1/8

C.II-4与正常女性婚配,后代都不患病

D.II-4与正常女性婚配,生育患病男孩的概率是1/8

7.某种雌雄异株植物有宽叶和窄叶两种类型,宽叶由显性基因B控制,窄叶由隐性基因b控制,B和b均位于X染色体上。基因b使雄配子致死。请回答:

(1)若后代全为宽叶雄株个体,则亲本的基因型为

(2)若后代全为宽叶,雌雄植株各半时,则亲本的基因型为

(3)若后代全为雄株,宽叶和窄叶个体各半时,则亲本的基因型为

(4)若后代性比为1:1,宽叶个体站3/4,则亲本的基因型为

8.现有一母子去医院看病,医生发现其母亲患有血友病(血友病是一种伴X染色体隐性遗传病,用h表示其致病基因),儿子有色盲,随即医生在其儿子的病历上写上血友病,为什么?试写出儿子的基因型。

9.已知猫的性别为XY型,__为雌性、XY为雄性。有一对只存在于X染色体上的等位基因决定猫的毛色,B为黑色、b为黄色,B和b同时存在为黄底黑斑。请回答(只要求写出遗传图解即可)

(1)黄底黑斑猫和黄色猫交配,子代性 (2)黑色猫和黄色猫交配,子代性别和毛

别和毛色表现如何? 色表现如何?

反思与积累:

第3节 伴 性 遗 传( 第 二 课 时)

《伴性遗传》的教学设计方案 篇3

1.教学设计思想

此节课将通过探究实验培养学生的科学态度和合作精神,同时培养学生的评价水平,以教师为主导学生为主体,培养学生归纳总结的能力,并使学生学会伴性遗传题的解题方法。

2.学习目标

(1)知识目标

①了解伴性遗传的应用。

②概述伴性遗传。

(2)技能目标

①培养学生的观察能力、综合分析能力。

②学生运用所学的知识解决遗传学的问题,培养学生解决问题、分析问题的综合能力和创新精神。

(3)情感目标

①通过对自己色盲情况的了解,培养学生对科学探究的兴趣。

②了解伴性遗传在生产实践中的应用尤其是,在优生优育方面增强学生提高人口素质的责任感。

3.重难点

(1)重点

伴性遗传的特点。

(2)难点

分析人类红绿色盲症的遗传。

二、学生学情分析

在学习伴性遗传之前,学生已学过减数分裂和性别决定的知识,已经掌握基因分离定律和基因自由组合定律,在已有的知识基础上,通过红绿色盲的调查活动及结合课堂的探究活动,对伴性遗传现象进行分析和总结。

三、教材内容分析

“伴性遗传”是人教版高中课程标准实验教科书《生物2·遗传与进化》第二章第三节的内容。以人类的红绿色盲症为例,总结伴性遗传的特点和规律。

四、教法设计

1.利用课件,采用探究、讨论相结合的模式

利用教学课件,采用探究、讨论相结合模式;利用资料分析和遗传图谱,采用质疑、讨论问题、表达、交流的教学方法。

2.讲练结合

讲练相结合的方法对知识进行巩固。

五、教學过程

1.引入新课题

【教师活动】人们对遗传现象进行研究时发现,有些性状的遗传现象常常与性别相关联,这种现象就是伴性遗传。

阅读33页“人类红绿色盲症”的资料:道尔顿发现色盲症……

【学生活动】阅读。

【设计意图】创设情境,激起求知的欲望。

2.引导探究

【教师活动】多媒体展示红绿色盲检查图。

【学生活动】观察图片,亲身体验。

【教师活动】指出对红绿色盲的调查,据统计,我国男性红绿色盲的发病率为7%,女性色盲的发病率为0.5%。男性患者远多于女性患者,这是为什么?

【学生活动】思考问题。

【设计意图】提高学生的学习兴趣。

3.教师讲解

【教师活动】原来这种病是位于X染色体上的隐性基因(b)控制的,Y染色体由于过于短小而没有这种基因。因此红绿色盲属于X染色体隐性遗传病,色盲基因是随着X染色体向后代传递的。

思考题:根据基因B和基因b的显隐性关系,说出人的正常色觉和红绿色盲的基因型和表现型。

【学生活动】写男、女相关的基因型和表现型。

【设计意图】规范书写染色体的基因型,练习、巩固。

【教师活动】多媒体展示基因型及表现型。

4.引导探究

【教师活动】思考题:与上述基因型及表现型相关的婚配方式有几种?——六种。

问题:写出六种婚配方式的遗传图解。

【学生活动】分析、讨论、练习画遗传图解(分组,每组找一个人上黑板进行书写)。

【设计意图】理解新知识、巩固旧知识进一步激发学生参与课堂的兴趣。

5.强化学生归纳总结

【教师活动】思考:对遗传图解进行分析色盲遗传有什么特点?

【学生活动】分析、归纳、回答。

【设计意图】培养小组合作精神。

【教师活动】对学生的作答,正确的地方给予肯定,归纳不到位或有偏差的地方给予指正,并多媒体显示遗传特点。

并提出问题:为什么患者是男性多于女性?

【学生活动】思考作答。

【教师活动】修正并多媒体展示。

因为色盲基因是隐性基因,女性只有XbXb才表现色盲,XBXb不表现色盲;而男性只要X染色体上带有色盲基因b,就表现为色盲,所以男性色盲多。

【教师活动】位于X染色体上的基因不但有隐性基因,也有显性基因。如抗维生素D佝偻病就是一种X染色体上的显性基因(D)控制的遗传病。

指导学生阅读课本36页,了解抗维生素D佝偻病的遗传特点。

【学生活动】学生阅读、了解抗维生素D佝偻病的遗传特点。

【教师活动】多媒体展示伴X染色体显性遗传特点。

【设计意图】区别、比较X染色体上的显性基因、隐性基因控制的遗传病的特点。

【教师活动】伴性遗传现象在生物界中普遍存在,除了人类的红绿色盲、抗维生素D佝偻病、人的血友病、外耳道多毛症、芦花鸡羽毛上的黑白横斑条纹、雌雄异株植物(如女娄菜)中某些性状都是伴性遗传。其中人的外耳道多毛症基因位于Y染色体上,那么该性状的遗传有什么特点?

【学生活动】思考并得出答案。

【教师活动】我们研究伴性遗传有什么意义呢?学生阅读课本37页,了解伴性遗传在生活实践中的作用。

【学生活动】学生阅读、了解伴性遗传生活实践中的作用。

【教师活动】多媒体展示伴性遗传在生产实践中的应用。

【设计意图】结合生活事例,进一步了解伴性遗传在生活实践中的作用,并巩固、深化、理解。

6.强化训练

【教师活动】多媒体展示一些试题。

【学生活动】思考后作答。

【设计意图】巩固学到的新知识。

《遗传信息的传递》教学设计 篇4

关键词:遗传,分子基础,DNA,知识

一、教学内容与任务分析

本节课的内容是建立在学生已经学习过有丝分裂, 孟德尔的遗传规律, 减数分裂, 受精作用等知识的基础上, 而这些知识可为本部分的学习提供必要的线索。DNA分子的结构和复制是遗传学的基本理论。本节内容在联系DNA结构的基础上, 进一步阐明DNA通过复制传递遗传信息的功能。同时也为后面遗传信息的表达、生物的遗传变异理论、基因工程和生物进化等知识的学习提供了必要的知识储备。

二、教材处理

新课改背景下, 课时紧张的状况普遍存在, 这就要求教师能灵活运用教科书这一载体, 在完成新课标任务的前提下能充分开发和利用课程资源。

三、学习者分析

本节课的教学对象是普通高中的高二学生。处于这个阶段的学生的认知体系基本形成, 认知能力不断完善。本节在教材中属于较抽象较难理解的一部分内容, 而学生对DNA的结构特别是空间结构的理解有待深刻, 因此在教学中, 教师除了通过启发式教学, 设置大量问题情境, 来激发学生的学习兴趣和进一步培养他们的分析和归纳能力。

四、教学目标

(一) 知识与技能目标

(1) 说出DNA复制过程的同位素示踪实验。 (2) 概述DNA分子的复制。 (3) 探讨DNA复制的遗传意义。

(二) 过程与方法目标

(1) 通过分析DNA复制过程的同位素示踪实验结果, 提高观察、分析、推理和总结概括的能力。 (2) 通过对多媒体演示DNA复制的过程的学习, 培养信息处理能力。

(三) 情感态度与价值观目标。通过“活动:探究DNA的复制过程”, 感悟科学实验中蕴涵的理性精神与求真意识, 批判精神与创新意识, 逐步领悟科学的本质特征。

五、重难点分析

重点:1、DNA的复制方式和过程。

难点:1、思考DNA复制过程的同位素示踪实验的结果。

2、理解DNA分子复制的过程。

六、教学方法

教师将采用“提出问题—分析问题—解决问题”的问题教学法, 层层设关, 步步追问, 让学生在问题的引导下, 进行自主思考、分析和讨论。

七、教学程序

[导入新课]讲述提问:DNA可以像指纹一样用来识别身份, 这种方法就叫DNA指纹技术。这项技术也经常被用于侦察破案, 但是从犯罪现场提取的原始DNA是非常少的, 怎样才能得到大量的DNA呢?这样激起学生思考和学习兴趣, 从而引入新课内容“DNA的复制”。

学生行为:回顾DNA是主要的遗传物质, 遗传信息的传递是通过DNA复制完成的以及DNA的双螺旋分子结构。

设疑:DNA是怎样进行复制的, 复制与它的双螺旋分子结构有什么关系。从而进入对DNA分子复制的推测的学习。

[引入假说]讲述:结合课件向学生阐述沃森, 克里克提出的关于DNA分子复制方式的假说是怎样的, 引入对“半保留复制”概念的学习。同时使用课件给出关于DNA分子复制方式的另一假说———全保留复制的概念。

提问:DNA究竟是以半保留还是全保留方式进行复制的呢?在学生探究之前首先教师会提出问题:以什么作为依据去判断DNA是以哪种方式进行复制的, 引导学生从两种复制方式新合成的子代DNA有什么不同的这一方面去思考, 由学生自己总结得出答案。

设计思路:以此激发学生的求知欲望, 从而引导学生对DNA分子复制的方式进行探究。

[分组探究, 自主学习]展示:运用课件的方法将DNA复制过程的同位素示踪实验展示给学生, 然后层层设疑, 逐步分析此实验过程。

引导:引导学生分析实验使用同位素示踪标记法的目的是什么?在得到解答之后, 让学生领会到此实验设计的巧妙之处。

学生行为:以小组讨论的形式思考并自主阐述当DNA的复制分别是全保留复制和半保留复制时, 它的实验应该呈现怎样的结果。在教师展示实验结果后, 结合猜测能得出结论:DNA是以半保留方式进行复制的。从而完成对DNA半保留复制实验证据的学习。

设计思路:通过让学生领悟实验设计的巧妙和让学生自主探究实验结果的过程, 引起了学生积极的思考, 较好地突破了教学的第一个难点。

设疑:DNA复制过程具体是如何的呢?引起学生的好奇心, 从而转入对DNA分子复制过程的学习。

[深入学习]展示动画并提问:关于DNA复制具体过程的教学, 教师将展示DNA复制的动画, 在第一次展示后, 提出3个问题:什么是解旋, 解旋的目的是什么?什么是子链?简述子链形成的过程?让学生带着问题再看一次动态演示过程, 在这一次的演示过程中, 教师将边演示边讲解边启发学生思考分析, 充分回答提出的问题, 使学生明白DNA复制的大体过程。

设疑:利用课件设置4个问题: (1) DNA复制的时间和场所 (2) DNA复制的条件 (3) DNA复制准确的原因 (4) DNA复制的特点。让学生思考分析后得到答案, 从这4个方面让同学们领会DNA的结构和碱基互补配对与复制的关系, 进一步加深学生对DNA分子复制过程的理解。

设计思路:充分利用多媒体课件, 结合问题层层推进, 让学生一步步加深对DNA复制过程的理解, 很好突破了第二个难点, 也突出了本次教学重点。

巩固新知:结合DNA复制过程的同位素示踪实验中大肠杆菌半保留复制图列, 计算在第一代, 第二代和第三代中含15N DNA分子个数及所在的比例, 进一步强调半保留复制的特点。提问:新合成的子代DNA与亲代DNA是不是完全一样的?

遗传学自主实验设计 篇5

闵令霞朱英秀王丽娟张媛媛

临沂大学生命科学院生物科学2班

摘要:对小麦根尖的取材、预处理、固定、解离、染色、制片等技术环节的探索,并用不同浓度汞离子处理小麦根尖,结果表明,小麦染色体发生不同程度的变化,并阐述了汞胁迫对小麦染色体的影响。

关键词:小麦;染色体;染色体数目;染色体形态变化

染色体是物种特有的遗传信息携带者,有很高的稳定性和再现性。通过汞的不同浓度对小麦的染色体进行分析,并对细胞核染色体的数目,各染色体的大小和形态特征进行综合描述,进而能够得到汞小麦根尖染色体的影响。

重金属污染是当今污染面积最广、危害最大的环境问题之一。据报道,我国受重金属污染的耕地面积近2000万hm,约占耕地总面积的1/5[1 3]。而汞是一种极具毒性的重金属元素,其毒性位于各金属元素之首,其对环境的污染主要来源于工业废物、废水、开采矿产活动、生活垃圾及汽车排放的尾气等。随着人口增长、工业的发展、汞矿的不断开采、废渣废水及矿山废弃物的排放,环境严重受到污染。而汞进入土壤环境后不易被降解,不仅影响作物的产量和品质,并且还会通过微生物的分解进人食物链,引起生物细胞内遗传物质的改变,影响细胞正常的生理、生化和代谢活动等,危害人体健康。目前,许多研究仅注重于汞对土壤和作物质量的影响,而关于汞对植物染色体影响的报道很少。本研究拟通过对受汞污染的小麦与正常小麦根尖染色体进行分析比较,从染色体水平上探讨汞污染对小麦的影响。

1.材料和方法

1.1 材料

所用材料为小麦种子萌发的根尖。

1.2 方法

1.2.1材料处理与取材,选用饱满、大小均匀的小麦种子在25℃恒温下浸泡24h,待其充分吸涨后,放入铺有湿纱布的培养皿中,置于25~C的培养箱中催根培养2-3d。当初生根长到1.5—2cm时,选取发育良好,大小相近的幼根作为研究对象。

1.2.2 材料的预处理

本试验设计6个不同浓度的氯化汞溶液,分别为:0.1,0.5,1.0,1.5,2.0mg/L,以蒸馏水为对照。将选取的小麦幼根放入盛有汞溶液或蒸馏水的培养皿中浸泡5h后,洗净吸附在根表面的汞溶液并恢复培养19h。剪下根尖用0.2%秋水仙素处理8h【4 后用蒸馏水清洗并将材料上的水吸干,放人配置好的卡诺氏固定液(冰醋酸:无水乙醇=1:3)中进行固定。

1.2.3 材料的固定

将材料放入配置好的卡诺氏固定液(冰醋酸:无水乙醇=1:3)中固定2Ah左右。固定好的材料 如不能及时解离,可将其保存在70%的酒精中。

1.2.4 材料的解离

将固定好的材料用蒸馏水冲洗2-3次后放人预热为60~C,1mol/L的盐酸溶液中解离 10一l5min。

1.2.5 材料的染色及制片

用龙胆紫染色[5-6,10],常规压片方法压片[11-12]、镜检。将解离好的根尖用蒸馏水冲洗2—3次后截取生长点部分l—2mm用龙胆紫染色。染色后将染料清洗干净,用50% 的甘油压片后用显微镜进行观察。

2.结果与分析

2.1 染色体数目

小麦染色体形态及数目如图1(依次是蒸馏水、0.5mg/L氯化汞、1.Omg/L氯化汞、1.5mg/L氯化汞处理后的图像)。小麦根尖的染色体数目为2n=2x=12。蒸馏水处理的小麦根尖染色体分散良好,数目恒定。0.5mg/L氯化汞和1.Omg/L氯化汞处理的蚕豆染色体分散良好,数目恒定;而1。5mg/L氯化汞处理的小麦根尖染色体数目大多数为12,少数细胞的染色体则多于或少于12(这些可能是因为染色体丢失或汞污染使染色体发生断裂引起)。

3. 结论与讨论

重金属胁迫会使生物的染色体产生变异。不同种类的重金属及其不同浓度梯度对生物造成的影响不同。汞是一种重要的重金属,其对环境的污染主要来源于工业废物、废水、开采矿产活动、生活垃圾及汽车排放的尾气等。

染色体畸变是外界环境有害因子作用于机体或培养的细胞后所导致的最常见的细胞染色体损伤指标之一,也是细胞遗传毒理学研究中最常用的检测手段之一。它具有许多其他检测手段无法比拟的优点。首先,它的可靠性和灵敏性较高;其次,植物核型分析试验的成本较低,这对于一种致突变性检测方法是十分重要的;第三,它的检测物谱较广;第四,在方法学上,它也特别适合环境致突变性监测。与其它动物试验或细胞学试验相比,试验材料容易获得,仪器设备简单。与其它植物测试法相比,它还具有个体差异小及不受地理、气候条件限制等优点。本实验以0.5mg/L、1.0mg/L、1.5mg/L的HgC1 溶液为胁迫压力对蚕豆根尖进行处理,比较其染色体的数目,形态的变化。结果表明,随着汞离子浓度的不断升高,染色体在数量及形态上的变异都非常显著,其直接影响了植物的有丝分裂,故汞离子的毒性不容忽视。而汞是一种累积性毒物,虽然人体对其具有一定的排泄能力,但只要摄人量超过人体的排泄能力,就会在人体内累积,对人体造成危害,影响人类染色体的正常分裂。参考文献:

[1]李懋学,陈瑞阳.关于植物核型分析的标准化问题[J].武汉植物学研究,1985,3(4): 297—-302.

[2]李懋学,张赞平.作物染色体及其研究技术[M].北京:国农业出版社,1996,1-_6O.

[3]杨大翔.遗传学实验[M].北京:科学出版社,2004,75—84.

[4]中国科学院植物研究所.中国高等植物图鉴(四)[M].北京:科学出版社,1975,201 .

[5]西南林学院云南省林业厅.云南树木图志(下)[M].昆明:云南科技出版社,1991,1102— 1 106.

[6]张磊,王启超,李志博,等.中国城市汞污染及防治对策[J].生态环境,2004,13

(3):410-_413.

[7]陈彦云,曹君迈,李国旗,等.罗布麻染色体核型分析[J].北方园艺,2O08,(1):21X)--202.

[8]熊大胜,王文龙.鱼腥草染色体核型分析[J].湖南文理学院学报,2004,16(1):39—40.

[9]段承俐,李一果,杨艳琼,等.三七的染色体核型分析[J].西南农业学报,2007,20

(3):565—567.

[10]郑万钧.中国树木志(四)[M].中国林业出版社,2004:4611一_4613.

[11]祝长青,李明敏.铅胁迫对甜瓜染色体核型的影响[J].种子,2008,27(5):29_31.

[12]吴松权,王立平,孙丽娜,等.黄芪染色体核型分析[J].湖北农业科学,2006,45

(5):631__633.

遗传程序设计 篇6

根据新课程理念,高中生物学教学重在培养学生的科学思维、科学方法、科学精神等生物学科学素养,因此,本节课以“自主合作探究科学发现的过程来学习科学研究的方法”为设计理念,切实落实主体性教学,提高学生的探究能力,训练学生科学的思维方法。

二、教学目标

知识与技能:使学生掌握证明DNA是遗传物质的两个实验的过程和原理,以及从实验中得出的结论形成相应的知识结构,培养学生生物科学素养。

过程与方法:通过重演科学家发现DNA是主要遗传物质的过程,体验科学家的探究思维,学会科学研究的方法和基本步骤。

情感态度与价值观:概述人类对遗传物质的探索过程发展科学思维和创新的能力。

教学重点:肺炎双球菌转化实验和噬菌体侵染细菌实验的原理和过程。

教学难点:肺炎双球菌转化实验的原理和过程。体验科学家的探究思维。

三、教学方法及学法

根据以学生为主体的教学原则,以“自主性、探究性、合作性”为模式,以培养学生的科学素质为指导,以侧重科学方法教育为归宿,本节课采用“问题探究法”教学方法,并配以多媒体辅助教学,引导学生按如下6步探究模拟科学发现过程,发展其科学思维和创新的能力。

学法:

1)复习旧知——由已知引入未知;

2)创设情境——提出问题;

3)过程探究1——对照分析体验方法;

4)过程探究2——设计实验分析评价;

5)过程探究3——引导分析突破难点;

6)总结反思——提高认识,建立知识体系。

四、教学程序及设想

(一)复习旧知——由已知引入未知

教师利用多媒体引导学生回忆孟德尔通过豌豆实验的证明和摩尔根通过果蝇实验的证明及其他科学家的发现提出问题:谁是遗传物质?

设计意图:以史导史,认同科学是一个过程。同时创设问题情景,以此来激发学生强烈的求知欲。

(二)自主学习——对照分析体验方法

探究过程1 体内转化实验——格里菲思等

指导学生阅读:对遗传物质的早期推测及肺炎双球菌的转化实验。同时请学生思考问题:

1.实验先进行第一、二组的目的是什么?可否直接进行第四组?

2.对比分析第一、二组说明什么?第二、三组说明什么?第三、四组又说明什么?

学生交流:用语言表述实验过程中想到的问题及相应结论。

设计意图:以史激趣,促使学生“发现问题”。让学生沿着科学的发展轨迹分析问题。同时培养学生的语言组织能力及观察和分析问题的能力。

(三)合作探究——设计实验分析评价

过程探究2寻觅“转化因子”

教师指导小组通过讨论合作完成设计实验。

提出问题:哪种物质是“转化因子”?

作出假设并设计实验(技术手段﹑预测结果)

设计意图:体验科学家的探究思维,学会科学研究的方法和基本步骤。

介绍艾弗里等科学家完成的体外转化实验提出思考题:

1.艾弗里等科学家成功的原因?

2.如何使结论更可靠?

3.实验⑤⑥⑦能说明什么问题?

4.该实验能否证明DNA是遗传物质?该实验的结论是什么?

5.艾弗里实验最关键的设计思路是什么?

设计意图:渗透科学方法,引导学生“分析问题”。指出实验局限,促使学生“再生问题”。培养学生观察能力和分析问题的能力及合作精神。

(四)探究学习——引导分析突破难点

过程探究3噬菌体侵染细菌的实验——赫尔希和蔡斯

教师引导学生由以下几个问题入手1.DNA和蛋白质的化学元素组成?2.用哪些同位素对噬菌体进行标记,就可将蛋白质和DNA彻底分开?……进行诱思导学、答疑解惑,完成实验材料的探究和研究方法的探究,并共同探究分析噬菌体侵染细菌的实验。

设计意图:培养科学素养,让学生沿着科学的发展轨迹分析问题。引导学生“解决问题”。

(五)总结反思——提高认识,建立知识体系

教师提出问题:科学家为什么能成功地揭开遗传物质的神秘面纱?请同学讨论回答。

设计意图:揭示成功原因,树立科学的价值观。培养学生自主学习的能力。

实战演练:案例介绍:科学家通过大量的研究发现,绝大多数生物的遗传物质是DNA,但RNA病毒只含有RNA和蛋白质(如烟草花叶病毒),它的遗传物质是RNA。

设计实验:证明烟草花叶病毒的遗传物质是RNA。

学生结合肺炎双球菌转化实验和噬菌体侵染细菌的实验进行分组讨论、设计实验方案,进行实验探究;然后汇报交流实验方案和实验现象、分析原因。

设计意图:培养学生探究问题与设计实验的能力及创新意识。培养学生应用知识解决实际问题的能力在探索过程发展科学思维和创新的能力。

五、课后反思

以新课程理念设计的教学思路来引领教学过程,能够把本节内容放到整个模块中看待其地位,在课堂上引领学生通过重演科学家发现DNA是主要遗传物质的过程,体验科学家的探究思维,学会科学研究的方法和基本步骤。既可提高学生的科学素养和人文素养,也让学生体验学习过程中的成功喜悦。逐步构建完整的知识体系。

重视对学生回答的评价和肯定,从学生回答中发现问题、分析解决问题在发现问题,体现了“问题导学法”的核心理念的同时,引导学生学会在思考中学习、在学习中思考。发展学生思维的逻辑性、深刻性并培养其知识迁移应用的能力。

基于遗传算法的采购成本优化设计 篇7

关键词:遗产算法,采购成本,优化,设计

近年来, 随着我国社会主义市场经济的不断发展与经济全球化发展进程的加快, 全球各企业面临的市场环境瞬息万变、竞争日趋激烈。随着我国在企业管理体制改革的不断深入, 企业的生产方式、组织结构等都发生了明显的变化, 很多企业在激烈的竞争环境中树立了现代企业管理理念, 并逐步向企业管理的精细化方向发展。面对激烈的市场竞争, 企业只有不断提升自己的核心竞争力才能在激烈的竞争环境中求得生存。提升企业核心竞争力的一个主要手段就是不断降低成本, 提高企业的经济效益。在制造业中, 原材料的采购成本占企业销售成本的40%以上, 因此, 有效的控制企业的采购成本是进行企业管理的重要内容。据相关数据资料统计显示, 如果企业的采购成本能够降低1%, 那么惬意的经营利润将增加5%-10%。面对不断紧张的企业资金与激烈的市场竞争, 采购成本的降低已经成为现代企业提高利润的重要途径。

1 采购成本的主要构成内容

现代企业的采购成本主要是由物资成本、采购管理成本、储存成本三部分内容共同构成的。其中, 储存成本主要包括:仓库保管费、损坏的存货、其他费用。才我姑管理成本主要是由人力成本、办公费用、差旅费、信息费等费用构成的。惬意的全部采购成本还应该包括在采购准备阶段发生的成本, 例如:调查货源及供应商的费用、确认需求的费用等。如果单从企业的原材料采购流程来看, 可以将企业的采购成本划分为交易前成本、交易成本、交易后成本。对于制造企业而言, 物资采购是一项极为烦琐的工作, 企业必须根据本企业的业务实际准确把握好物资采购的重点环节, 选择最恰当的物资采购策略, 时刻树立成本管理的理念, 努力实现降低成本、提高企业经济效益、提升企业核心竞争力的最终目标。

2 遗传算法的起源与组成

2.1 遗传算法起源

早在二十世纪七十年代中, J.Holland等人 (美国Michigan大学) 在进行学习、研究中, 受到“适者生存”观念影响提出了一条全球新理念, 这理念就是遗传算法。同时, 美国的一位博士把这些遗传的算法运用的函数优化的范围内, 由此为遗传算法打下基础。之后, 又有很多的专家与学者对原来的遗传算法进行了大量的改进, 使遗传算法得到了更为迅速的发展。并且提出了许多遗传算法模型, 这让遗传算法在更广的领域当中得到了更广大的运用。进入二十世纪九十年代, 其遗传算法得到了迅猛的发展, 逐渐成为不同领域中最使用、最高效的优化技术。

此外, 在刚兴起的遗传编程以及人工生命等, 专业人员非常巧妙地将遗传算法以及计算机融合, 并且模拟生态界中的再生、适应、组织能力设计了带有生命特性的人工系统。

2.2 遗传算法的组成结合

目前的遗传算法一共有六个部分, 分别遗传的操作方式、初次的群体产生法、编码的类型、关于算法的参数设置、算法的结束条件。如果要运用遗传算法解决在采购中所遇到的成本问题, 那么每一个环节的设计都是关键性问题。

在选择供应商时, 一定要在采购前对他们的各方面都综合考虑清楚, 特别是要对他们的批量采购以及信用等级方面进行采购, 一定要进行大量的采购, 最大限度减少采购的成本。

遗传算法是构建在生物自然性选择的算法, 其可处理任何形式的非线/线性、连续的探索空间目标函数。这些年, 工程系统所遇到的问题是非常复杂的, 特别是在遗传算法在制造业中已得到成功运用的今天。如:设备布置、分配, 作业调度、排序等。由此可见, 遗传算法可更好优化企业内部的采购策略, 可在一定程度上提升企业经济的利润。

3 采购成本数学模型的建立

3.1 具有多供应商采购的基本形式

在企业采购中, 对企业采购成本影响的元素很多。可造成最大影响的有原材料的价格、运输费用等等。所以在构建采购成本数学模型时, 一定要考虑价格和运输费用这两个元素。例如之前所说的具有批量折扣的多个供应商基本采购方式为企业同时可向多个供应商采购的原材料;如果供应商或是同商生产批次不同, 则单价也是不同的, 运输的费用也是有差异的。

3.2 采购模型的假设

本模型的目标函数是为了可以实现采购成本的最低最低价格, 设供应产品单价批量的折扣函数是已知数, 并且供应商有能力承受企业的订单数。

3.3 遗传算法的计算流程

本文研究的采购成本优化的设计主要是运用C+语言, 在NET的藏在上, 对数据库的基础进行编写, 拟定出采购模型遗传的算法。其具体的执行步骤主要有以下几步:

第一, 对采购的原材料进行选择, 并对多个供应商的采购原件根据信用的等级, 来选择本次材料采购的供货商。

第二, 输出基本数据, 如采购的数量、变异与交叉的概率等。

第三, 对于各个供应商的供货能力进行提取, 在各供货商供货范围内产生一个采购的数量 (即正随机数) , 之后转成二进制并根据顺序进行组合, 最后可得到pop_size染色体。

第四, 当染色体产生以后就要对不同的染色体进行计算, 对其累计等概率进行计算。并利用转轮法, 产生pop_size个, 即0-1个随机数之后, 根据染色体累计概率选择, 同时对选中的染色体给予自制, 同时添加置新的种群当中。

第五, 对所产生的随机数, 在选择出随机数小于交叉概率的染色体后对2个交叉染色体随机选择一个断点, 同时与双亲的断点进行交换, 并在右端后形成一个新的染色体。

第六, 在这些随机数中, 要选择出随机数小于变异概率的染色体并产生一个变异位, 之后对其基因做变异方面的处理工作。

4 遗传算法在采购成本中的设计

如前面所讲的遗传算法是构建在生物界自然选择以及遗传规律随机搜索中的算法, 可处理各种形成的非线线性、连续等, 以此分析空间中的目标函数以及约束。在制造工程系统当中, 存在许多复杂性的问题, 传统的优化方法很难得到求解。而遗传算法则成功地在这些问题中显示出优势。从上述采购成本的数学模型中可以看出, 当企业的原材料采购物种比较繁多、供应商的数据呈现出多样化的特点时, 成本目标函数所表现出的是一种具有离散性的非线性函数, 面对此情况, 可以适用遗传算法, 并运用这种算法更好地对数据进行优化。

处理好目标函数中的约束条件。在遗传算法中通常情况下对于有约束目标函数处理法包括以下的内容:拒绝、修改、改进遗传算法、惩罚等策略。以下就是对几种算法进行简单的说明。所谓拒绝和修复策略实际上都是在进货过程中才起到作用的, 前者是将不可进行染色的染色体全部遗忘, 不做任何选择。而后者则是对不可性染色体进行修复, 在修复过后可达到染色体的修复目的。但是, 改进遗传算法则有不同, 主要指的是设计上的一种专门的算法, 并以此算法来维护染色体中的可行性。这三种策略在理论上分析是不会产生“不可行”的解, 但也有缺点, 即没有办法把可行外的点融入在内, 对约束严重的, 不可行解所占的比例大, 如果将搜索制约在可行区域内, 则无法找到最优化的解。

和以上三种策略比较, 惩罚策略可允许在不可行的区域内进行搜索, 能快速获得最佳方案, 对于采购成本要采用惩罚的策略来处理约束性的方程。

5 实例的讲解

某起重实业企业, 因业务上的需要要购进一万台CD-1号型的电动葫芦。为了可以最大限度地减少成本, 要对采购方案进行优化。通过遗传算法, 可采取以下的方式进行:

首先, 需要设置次次采购供应商的信用等级线, 并在这范围内选择一个信用达标的供应商。在符合范围的供应商中共三家, 但三空的运输费用、产品价格、供货能力均不一样, 同时如果企业是采取批量购买, 供应商所给出的优惠也不相同。

其次, 根据各种样的基本费用, 根据公共中的第7项的惩罚因子r为各类供应商原料单价平均值的两位, 且f1-f要确证为正数, 参考企业前的采购资金, 且f1=2亿, 代表公式中可得供应商一的供货能=5000, 供应商二=4000, 供应商三=5500, 转化二进制位数可得供应商一、三为13, 供应商二为12。由此可见, 染色体的总长度是三者的总和, 为38如果以采购数量为一万计, 那么其中的变异尼为0.001、交叉率为0.6、种群规模80, 得出最大进货代数为500。

总之, 对现代企业的采购成本控制与优化能够提升企业的经济效益, 因此, 现代企业在材料采购成的管理中应选择适当的方法在努力降低采购成本的同时提高采购效率、提升企业的经济效益、提升企业的核心竞争力, 为保证现代企业的健康、可持续发展奠定基础。

参考文献

[1]邢岩, 叶柏青.工程机械企业如何建立供应商评价体系[J].现代经济, 2008, 7:57-60.

[2]张韵君.采购成本的有效控制策略[J].中国市场, 2009, 10:121-123.

[3]黄灏然, 等.基于AHP的模糊综合评价方法在方案评价中的应用[J].价值工程, 2007, 1:84-86.

[4]李敏强, 等.遗传算法的基本理论与应用[M].北京:科学出版社, 2002.

深基坑支护工程遗传优化设计算法 篇8

深基坑支护设计问题作为深基坑工程的重要内容已经逐步成为我国建筑工程界的热点和难点问题。由于深基坑支护设计的理论不完善,模型试验、工程测试都有待进一步发展,不同的支护方案所采用的细部结构和设计参数各不相同,支护方案与细部结构的设计又相互联系,使得支护设计有较大的随意性。这种随意性带来了计算的不可靠和不稳定,所以,进行深基坑支护工程优化设计找到一组最优的设计方案、最佳的设计参数,成为目前一个研究热点课题。

深基坑支护工程计算涉及很多因素,每个因素之间具有互相关性,设计参数也具有离散特性。因此,深基坑支护工程中因素和因素之间的关系很难用确定的数学表达式加以描述,若用基于数学方法的传统优化模型来解决深基坑支护工程优化问题变得十分困难。

遗传算法是一种概率搜索算法,但是它不是简单的随机走动,它可以有效地利用已经有的信息处理来搜索那些有希望改善解质量的串,而不局限于解的性质和空间条件。因此,把遗传优化方法引入深基坑支护工程优化设计中,可以有效克服传统优化模型的困难,但是简单的遗传算法由于固有的内部缺陷,实用效果并不理想,因此我们适当对算法进行改变,提高算法收敛性和工程实用性,以解决深基坑支护工程的实用算法计算问题。

1 遗传算法的一般结构

设p(t)和C(t)分别表示第t代的双亲和后代,Grefenstette和Baker描述的算法步骤可以作为遗传算法的一般结构:

begin

t←0;

初始化p(t);

评估p(t)

while不满足终止条件do

begin

重组p(t)获得C(t);

评估C(t);

从p(t)和C(t)中选择p(t+1);

t←t+1;

end

end

2 深基坑支护工程设计的数学模型

深基坑支护工程的数学模型如下:

F(X)=minf(X),X∈U En,

s.t.e(X)=0,v=1,2,...,k

ie(X)≤0,u=1,2,...,m;

其中:X是由x1,x2,…,xn组成的向量,是设计过程中要优选的设计参数,如桩径、桩长、混凝土强度等级等;min表示极小化,即以基坑支护工程总造价最小为优化目标;s.t.表示需要满足的约束条件,e(X)为等式约束条件,k为其数目;ie(X)表示不等式约束条件;m表示其数目。约束条件主要有三类:

(1)设计变量约束:指设计变量本身的取值区间,亦即值域;

(2)变量一致性约束:指各种设计变量之间明显存在的、相互制约的关系;

(3)设计准则约束:指规范、规程中规定必须得到满足的条件。

这些条件都可以采用等式或不等式数学描述,即前面所说的e(X), ie(X)。

3 遗传算法在深基坑支护工程设计的应用

3.1 简单遗传算法应用在支护工程设计

根据深基坑支护工程的数学模型,以F(X)为适应度函数,选取群体规模30,交叉概率Pc=0.90,变异概率Pm=0.01。简单遗传算法的程序流程图如图1所示。

3.2 改进遗传算法应用在支护工程设计

为提高算法的工程实用性,我们在算法中引入文化概念,对应相应的遗传策略,在染色体进化的同时也进行遗传策略的进化,最终选取最合适的遗传策略完成优化结果。

改进遗传算法的结构示意图如图2所示。

4 结束语

遗传优化设计算法具有鲁棒性强、全局优化、并行处理等优点,我们将其应用于深基坑支护工程优化设计,相对于经典优化设计方法,实验表明,算法得到的结果较好,能够满足工程实践要求。同时经过改进的遗传算法相对于简单遗传算法稳定性和收敛性都有提高,反应了文化策略的引入对遗传算法的工程实用性提供了改善。

参考文献

[1]孙国玺,多变异拟子基因共同进化算法的理论及应用研究[D].广州:华南理工大学,2006.

[2]史佩栋.高层建筑基础工程手册[M].北京:中国建筑工业出版社出版,2000.

[3]Zhou Gen-Gui,Gen Mistsus,Wo Tian-Zu,A new approach to the degree-constrained minimum spanning tree problem using ge-netic algorithm.Proc IEEE International Conference on Systems,Man and Cybernetics,Beijing,1998,2683-2688.

[4]周明,孙树栋.遗传算法原理及应用[M].北京:国防工业出版社,1999:1-166.

并行设计任务调度的遗传算法研究 篇9

本文针对产品并行设计的特点,从任务调度的角度提出了一种并行设计任务调度的遗传算法,该算法在满足时序关系、信息流动和资源约束的前提下调度设计任务,缩短并行设计过程,针对并行设计任务遗传算法易停滞的问题,引入基因突变、种群突变等策略来解决。

1 并行设计任务分析模型

1.1 并行任务描述

产品并行设计过程是由多个设计任务组成的,这些任务之间存在着复杂的关系,可以用任务偏序图来表示。任务偏序图是用一个有向非循环图(Directed Acylic Graph,DAG)表示任务间的信息依赖和时序关系的任务关系图,如图1所示。任务偏序图可用四元组G=(N,prest,avert,r)来描述,其中:N为任务集,N=(1,2,…,n),n是产品并行设计过程的任务总数;prest是有向边集,表示任务间的顺序关系;avert为任务的平均执行时间集,avert=(t1,t2,t3,…,tn);r是设计资源集,现代企业的设计资源主要是设计人员、计算机、网络和相关软件。根据并行设计的要求,将设计人员及配备的计算机软硬件划分成若干个设计小组,每个小组能独自承担全部或部分设计任务,设计小组可以看成是能完成一定设计任务的设计单元。因此r是单一元素的集合,则r={m},m是设计单元数量。

1.2 基本定义

(1)用时序矩阵prem表示各设计任务的紧前任务状况,将每个任务的紧前任务集合作为一个列向量从左至右依次排列组成一个矩阵,行数表示最多的紧前任务数目,不足行数的列以零补充。prem简便而有效地描述任务时序关系,便于在计算机上实现[12]。图1的时序矩阵如下:

任务号1 2 3 4 5 6 7 8 9 10 11

(2)用关联矩阵An×n表示任务之间的相关性,A中的元素按式(1)取值:

式中:i,j-任务ID号,i,j=1,2,…,n。

(3)用任务层次集L表示偏序图中各任务之间的相对层次关系,L中的元素按式(2)取值:

式中:prest(i)-任务i的紧前任务集。

图1的关联矩阵和任务层次值如表1所示。

(4)用调度矩阵dism×n描述任务与设计单元之间的调度关系,其元素取值如下:

要求调度至同一设计单元的所有任务按层次值升序排列。这样,一个调度矩阵实际上就是一个时序可行的并行设计任务调度方案。

(5)用效率矩阵effi描述各设计单元执行任务的工作效率,时间矩阵exect描述各设计单元执行任务的实际持续时间。每一个设计单元因设计人员的专业知识、专业技能、设计经验等方面的差异,执行同一个设计任务所需要的时间是不同的,即工作效率是不同的。则有:

其中:ei,j-效率矩阵effi的元素,表示单元i执行任务j的工作效率;eti,j-时间exect的元素,表示单元i完成任务j实际持续时间;tj-平均执行时间集avert的元素,表示各设计单元完成任务j所需时间的平均值;m-设计单元数;n-设计任务数。

1.3 任务规划模型

根据上述描述,并行设计过程中的任务调度的规划问题是:在满足时序关系的前提下将设计任务分别调度给各个设计单元,使得并行设计过程执行效率最高,持续时间最短。目标函数是:

式中:sti,last-调度到设计单元i中的最后任务last的执行结束时间;sti,j,fti,j-设计单元i中的任务j开始执行时间和执行结束时间;eti,j-设计单元i执行任务j的实际持续时间;prest(j)-任务j紧前任务集。

为了充分利用设计资源,规定每个设计单元至少应调度到一个设计任务,并且一个任务只能调度给一个设计单元,即任务调度给设计单元时要求任务匹配矩阵中的元素满足以下条件:

2 遗传算法设计

上述规划问题在大多数情形下是一个NP难题,也是一个组合优化问题,传统的随机搜索法、爬山法等算法难以解决这类问题。而新的并行优化搜索方法——遗传算法,则是一种基于进化论优胜劣汰、自然选择、适者生存和物种遗传思想的随机优化算法,通过群体进化来进行全局性优化搜索。该算法以其很强的并行性和全局性日益受到人们的关注。其基本要素主要有染色体结构设计(编码)、种群初始化、个体适应度评价、遗传操作及运行参数设定等。

2.1 适应度函数

遗传算法的适应度函数是对个体适应能力的评价函数,一般要求适应度函数值非负、与目标函数值对应、二者具有相同的极值点。本文由优化调度目标函数映射得到适应度函数,如下式所示:

式中:t(x)-当前代第x个个体的目标函数值;f(x)-当前代第x个个体的适应度值;Tmax-一个常数,表示所有设计任务在各设计单元中执行所需时间最大值的总和,能保证f(x)为正值。

2.2 染色体编码

为了清楚而准确地表示设计任务间的关联信息,采用前面定义的调度矩阵dism×n来构造染色体。矩阵中的行称为基因行,反映了调度在一个设计单元中的任务列表及其执行顺序;矩阵中的列称为基因列,反映了设计任务与设计单元间的匹配关系。一个用二维矩阵描述的染色体也就是设计任务的一个调度方案。

2.3 种群初始化

种群初始化分三步进行:第一步,根据任务偏序图的层次值将设计任务分为l(最大层次值)个任务子集;第二步,将每个任务子集的所有任务随机地指派到m个设计单元中去;第三步,将调度到同一设计单元中的设计任务按层次值升序排列。这样就得到一个任务调度方案,也就是一条用二维矩阵表示的染色体,重复执行第二和第三步就能生成一定规模的初始种群。

2.4 遗传操作

2.4.1 选择操作

采用保优策略进行选择操作,按适应值由高到低选择一定比例的个体作为待配种群(父本),适应值最大的两个个体直接保留下来作为下代个体。

2.4.2 交叉操作

采用内、外两种交叉运算:两个染色体对应基因列之间的外部交叉运算;同一染色体内部的两个基因行对应基因段之间的内部交叉运算。

(1)外部交叉运算的操作过程如下:

step1.生成一个随机数q(1≤q≤n-1),以q为交叉点将两个父本P(i)和P(j)按基因列分成前后两部分;

step2.互换P(i)和P(j)对应交叉点后(前)的所有基因列,生成两个新的子代个体O(i)和O(j);

(2)内部交叉运算的操作过程如下:

step1.生成一个随机数q(1≤q≤n-1),从父本P(i)中随机选择两个基因行,以q为交叉点将两个基因行分成前后两部分;

step2.互换两个基因行对应交叉点后(前)的所有基因段,生成一个新的子代个体O(i);

2.4.3 变异操作

变异操作是增强子代多样性,避免进化过程早熟的重要手段。采用任务迁徙策略进行变异操作,过程如下:

step1.生成一个随机数q(1≤q≤l),选择一个父本P(i),计算P(i)各基因行中层次值为q的任务数Mi(0≤i≤m);

step2.从Mi最大的基因行中随机选择一个层次值为q的基因(任务),迁移到Mi最小的基因行中,生成一个新的子代个体O(i);

显而易见,交叉和变异操作后得到的新染色体基因行中的各基因(任务)仍然按层次值升序排列的,新染色体(新个体)是可行的调度方案。

2.4.4 突变操作

为了避免种群进化过程中出现早熟而停滞不前,本文运用基因突变和种群突变两种进化突变机制。

(1)基因突变

进化过程中满足下列条件时,交叉概率增大至初始交叉概率的10倍:

式中:mature-当前代适应度相对差值;maxf-当前代最优个体的适应度;minf-当前代最差个体的适应度;avef-当前代个体的平均适应度。

(2)种群突变

如果连续遗传50代,种群最优值保持不变,则将选择概率、交叉概率减小至一半,按种群初始方法随机产生种群规模半数的新个体作为下代个体,增强种群的多样性。

3 任务调度遗传算法结构

并行设计任务遗传算法总体结构如下:

step1.数据输入。

step2.种群初始化POP(t),t=0。

step3.终止条件是否满足?是,则转step8;否,则执行step4。

step4.计算种群中各个体的目标函数值和适应值,记录最优个体和最优值。

step5.进化过程是否停滞?是,则执行step6;否,则转step7。

step6.执行突变操作。

step7.执行选择、交叉、变异操作,产生下代种群POP(t+1),t=t+1,转step3。

step8.输出最优解,终止算法。

4 遗传算法仿真

铝型材挤压生产的产品开发设计是一个非常复杂的过程,经过对设计任务的耦合识别、解耦和断耦等操作重构设计过程后的设计任务偏序图如图1所示[13,14]。根据并行设计的思路,将某铝型材挤压生产企业的产品开发设计资源(各类技术人员及相关软、硬件设备)划分成3个设计小组[15]即3个设计单元。对工程技术人员调研得到设计单元执行任务的效率矩阵见式(12),任务平均执行时间矩阵avert=[30,26,20,28,24,12,40,16,22,25,26],单位为h。

对上述设计过程分别采用一般遗传算法和本文的遗传算法进行优化调度。取种群规模200,遗传代数300,初始交叉概率和变异概率分别是0.95和0.001,用MATLAB7.0编程在PC机(PentiumⅣ1.8GHz)上进行仿真运行10次,结果如表2所示。可以看出,一般遗传算法有两次运行的目标最优值是101.8h,分别出现在第112、98代,采用突变机制的遗传算法运行10次的目标最优值都是100.9h,对应的染色体(调度方案)如式(13)所示,调度Gannt图如图所示。

5 结语

基于均匀设计的遗传算法及其应用 篇10

遗传算法是一种模拟自然界生物进化和遗传过程,具有极强鲁棒性的并行启发式的有导向的随机搜索优化算法,以其简易实用、适应性强,不需要专门领域知识的特点,倍受人们的青睐。目前已广泛应用于理论及工程技术等各个领域,并体现了强大的解决优化问题的能力。然而,遗传算法作为一种新的优化算法,其理论基础还十分薄弱,在许多方面有待研究和完善。在实际工程应用中也有诸多不尽如人意的地方,其中之一就是对遗传算法各操作参数及初始种群的选取往往靠经验,带有盲目性,且需大量反复的试验才能获得比较理想的操作参数和初始种群。而这些参数及初始种群选取质量的好坏直接影响着算法寻优性能。为此,一些文献给出了确定某些参数的公式[1]和提出利用GA本身来进行这些参数优化与选取,但在实践中均未达到令人满意的效果[2]。基于上述现状,本文将均匀设计与遗传算法结合,为遗传操作参数和初始种群的选取提供科学依据。

2 遗传算法及其与初始种群和遗传操作的关系

2.1 遗传算法

遗传算法(GA)是基于自然选择和基因遗传学原理的有导向优化搜索方法,它将“适者生存”的生物界进化原理引入待优化参数形成的编码串群体中,按一定的适配值函数及一系列遗传操作对各个体进行筛选,从而使适配值高的个体保留下来,组成新的群体,新群体包含了上一代的大量信息,并有优于上一代的个体。就这样周而复始,群体中各个体适应度不断提高,直至满足一定的极限条件就结束算法运行[3]。此时,群体中适配值最高的个体所对应解即为待优化问题的最优解或满意解。

有上述遗传算法运行机制,可知初始种群、遗传操作、适应度函数和算法终止条件这四个因素,是决定我们能否找到待优化问题最优解或满意解的关键控制量。下文简单介绍下本文所关心的初始种群和遗传操作两控制量对遗传算法性能的影响。

2.2 遗传算法与初始种群的关系

由模式定理[4]及马尔科夫性质可知初始种群的个体分布状况直接影响遗传算法全局最优解的收敛性能。定理1假定是标准遗传算法种群马

定理1假定是标准遗传算法种群马尔可夫链,,有以下结论:

其中,Pm为变异概率;为初始种群的最小模式;X(n)为第n代的种群;Y为种群中的个体[5]。由上述定理1)可知,标准遗传算法仅依靠交

由上述定理1)可知,标准遗传算法仅依靠交叉机制有能力搜索包含当前种群极小模式中的所有个体(尽管有可能需迭代很多次);2)可知标准遗传算法仅依靠交叉机制搜索不到由初始种群确定的极小模式之外的个体。即交叉机制只能在问题解空间的一个由初始种群规范的最小模式子空间上进行问题最优解的搜索。这就是说,如果初始种群模式空间不包含全局最优解的信息,而突变算子Pm又不能在有限的进化代数内将搜索空间扩延到包含全局最优解的区域,那么过早收敛就不可避免。为有效避免过早收敛并提高算法寻优的速度与精度,除了选择合理的突变算子外,主要是靠初始种群充分必要的多样性与个体分布的合理性。只有初始种群的多样度越大,种群个体基因长度适度,才能使初始种群包含越多的极小模式,交叉机制的搜索空间才越大,搜索到最优解或满意解的概率才越大。在对问题解空间构成缺乏认识和经验时,为了保证初始种群的多样性和分布的合理性,最简单也最有效的办法就是让初始种群的个体均匀地散布在解空间上,而均与设计正好为我们提供了这样的方法。

2.3 遗传算法与遗传操作的关系

对遗传算法性能影响比较显著的5个遗传操作的具体分析如下:

群体规模M:指种群中包含个体的数量,在遗传算法整个寻优过程中担任着极其重要的角色。因为它限定了每次迭代搜索样本个体的多少,当种群规模较小时,可以提高算法速度,但不能保证种群具有充分的多样性,容易过早收敛到局部最优解;当种群规模较大时,可以防止过早收敛到局部最优解,但增加计算负担,有可能导致一个无法接受地缓慢的收敛率。因此,群体规模不是越大越好,要具体问题具体对待,设定一个比较理想的种群规模,一般取值范围为30~210.

编码长度L:主要是指采用二进制编码的个体染色体所包含基因位数的多少,与问题求解精度有关,并间接地影响算法的收敛速度与寻优结果。编码长度一般取值范围为8~32.

交叉概率Pc:是控制交叉运算频率的操作参数。交叉运算是遗传算法有别于其他进化算法的重要特征,在遗传算法中起着重要作用,是产生新个体的主要方法。交叉概率作为控制交叉运算的主要操作参数,一般取较大值,但取值过大虽可加快群体个体的更新速度,但容易破坏群体中的优良模式,对进化计算产生不利影响;而取值过小又会使群体中新个体的产生速度过慢,致使算法停滞不前,降低寻优速度及收敛性能,一般取值范围为0.7~1.0.

变异概率Pm:是控制变异运算频率的操作参数。变异运算是遗传算法寻优必不可少的,它能改善遗传算法的局部搜索能力,并引入新的种群模式,配合交叉运算从全局较好的个体出发对搜索空间的细节进行局部搜索,使个体更加逼近最优解,进而提高算法的局部搜索能力。变异概率作为控制变异运算的主要参数,依据变异算子的作用,变异概率过大虽能产生较多的新个体,但也增大了破坏较好个体的机会,降低寻优速度(pm=0.5时,遗传算法与随机搜索法无异);若变异概率过小则影响种群的多样性,使算法全局收敛及局部搜索能力变差。变异概率一般很小,通常取值范围为0.01~0.20[6]。

终止条件:指满足一定条件算法就停止运行,一定程度上影响着算法的寻优性能。常用的终止方式有两种,一种是当算法寻找的结果满足我们所预期的精度(即e<ε)时,就停止运行;另一种是当算法迭代到我们所设定的终止代数时,就停止运行[4]。本文为了与传统的标准遗传算法(GA)所得优化结果进行比较,将算法终止条件设定为迭代300次,因为固定最大迭代次数为衡量优化方法的最客观标准[7]。

通过上述分析,可看出遗传算法的全局收敛与其收敛速度本身就是一对矛盾。寻找合理性的算法结构与参数,就是为了协调这对矛盾,使算法以最佳方式寻得问题的最优解。

目前,关于算法参数设定的理论尚不成熟,实际应用中主要是以试探法,即先根据一定经验尝试确定各参数,再经过多次试验获得比较满意的参数值。但遗传算法各操作参数功能各异且相互耦合,试探法显然不够科学,也耗时费力,无法应用于大型优化问题。而均匀试验设计所积累的方法则为算法参数的合理配置提供了参考。

3 均匀设计法在GA参数及种群优化选择中的应用

3.1 均匀设计试验法

均匀试验设计方法是我国数学家方开泰和王元应用数论方法舍弃正交设计的整齐可比性,只考虑实验点在实验范围内均匀散布,针对多因素控制且水平数较大的试验问题提出的一种直接优化方法。实践表明,使用该法均匀安排的实验点只需同问题水平数相等的实验次数即可获得解空间中一个比较好的解,是一种用最少的信息来获取空间最多信息的方法[8]。有文献证明,应用均匀设计设定遗传算法运行参数的科学性[9]。

均匀设计的主要工作就是构造均匀设计表Un(n m),其中U是均匀设计表代号,n表示水平(试验)数,m为因素数。本文采用好格子点法(glp)生成均匀设计表,并通过最常用的中心化L2-偏差法来测度其均匀性(n为偶数时,采用Un+1(n+1s)得到Un(ns)的修正好格子点法产生的均匀设计表[10])。均匀设计表具体构造方法为[8]:

(1)当n和s较小时,对于给定水平数n,令生成向量,其中,(gcd为最大公约数,φ(n)为欧拉函数);当n和s较大时,为简化计算采用整数同余幂法生成向量H。

整数同余幂法令a为小于n的整数,且在(mod n)(同余运算)意义下互不相同,且at+1=1(mod n),则称a对n的次数为。若a对n的次数,且gcd(a,n)=1,则可用作为生成向量H,称a为均匀设计的生成元。

(2)构造均匀Un(nm)的矩阵Ui×j,其中。

(3)通过均匀性度量函数中心化L2-偏差(记作CD2(P))从Ui×j矩阵中选出均匀性最好的s列构成均匀设计表Un*(ns),其中中心化L2-偏差CD2(P)计算公式如下:

3.2 利用均匀设计法优化配置GA操作参数

1)根据具体问题选择合理的试验因素数和水平数

运用均匀试验设计法设计试验优选GA操作参数,选定种群规模M、编码长度L、交叉概率cP和变异概Pm率为4个试验因素,兼顾试验精度与速度确定每个因素的水平数为7个,则每个因素的范围划分为7个等级,如表1所示。

2)运行Matlab生成均匀设计表U7*(74),并安排试验

由Matlab7.0生成的均匀设计表U7*(74),如表2所示。按照均匀设计表2重新排列因素水平表1中的每列值,获得试验安排表3安排每次试验。

3.3 利用均匀设计表产生GA初始种群

应用均匀设计法产生GA初始种群的办法有两种,一种是不管种群规模大小,直接运行编写好的Matlab程序生成所需的均匀设计表Un*(ns),再转换为相应初始种群;另一种根据中心化L2-偏差对坐标系旋转有不变性[11],得到:

准则均匀设计方案阵的任两列交换所得新方案与原方案在均匀性相同意义下是等价的。

实现了低水平均匀设计表经多次变换生成高水平均匀设计表,克服了种群规模较大时,直接运用均匀设计产生的计算量大,对计算机性能要求高的缺点。本文实例应用中采用了直接生成法。

4 实例应用

为了说明均匀设计的遗传算法的性能及其工程使用价值,本文将其应用于全维状态观测器的设计,寻找工程上满意的T、F、G和H矩阵。

1)全维状态观测器设计对象

取3维连续线性时不变观测系统,状态空间描述为:

相应全维状态观测器的状态空间描述为:,其中待定系数矩阵,

对于全维状态观测器的设计原理及方法步骤,文献[12]有详细的叙述,这里限于篇幅不再敖述。

2)均匀设计的遗传算法的应用

从工程实践意义来看,全维状态观测器设计所得T、F、G和H矩阵元素越小系统就越经济。具体求解过程中,T由F和G求得,其元素大小与F和G中的元素大小成正相关,所以选择优化目标为T矩阵元素最小,即遗传算法适应度函数:。。

根据表3配置的遗传操作参数并直接产生均匀设计表生成相应的初始种群(其余操作均采用标准GA的操作)进行试验,每次试验重复10次,每次试验算法迭代300次的终止,试验结果,如表4所示。

由表4所示7种试验结果数据可知,2号试验的收敛次数最多,平均收敛代数最少,平均适应度收敛值最小。因此,针对本实例由均匀试验设计所得遗传参数最优组合为:群体规模M=180、编码长度L=16、交叉概率Pc=0.8、变异概率Pm=0.14。

为说明均匀试验设计提供的遗传操作参数组合,确实比随机选择和主观经验所得参数组合优越且可信,本文运行Matlab7.0对三种参数配置情况下的遗传算法各进行了20次实例仿真。三种方法遗传操作参数配置如表5所示,仿真结果如图1所示。

仿真结果表明:均匀设计设定参数的遗传算法可以找到比随机选择和主观经验设定参数的遗传算法更满意的解。这表明将均匀设计法应用于遗传算法各参数的优化组合具有切实意义。

5 结论

本文介绍了遗传算法各操作参数和初始种群及其对遗传算法性能的影响,阐述了均匀设计的原理及方法步骤,实现了用均匀设计方法生成遗传算法初始种群及优化配置遗传操作参数。实验分析表明在对所优化问题解空间缺乏必要认识时,应用均匀设计获得初始种群与遗传操作参数的遗传算法,比应用主观臆断随机产生初始种群与遗传操作参数的遗传算法具有更好的寻优性能。均匀设计方法与遗传算法的结合为我们更好的应用遗传算法提供了科学依据。

参考文献

[1]Srinival M,Patnaik L M.Genetic Algorithms:A Survey[J].Computer,1994,27(6):17~26.

[2]Grefenstette J.Optimization of Control Parameters for Genetic Algorithms[J].IEEE Trans Syst Man and Cy-bernetics,1986,16(1):122~128.

[3]何毅,魏衡华.均匀设计在遗传算法中的研究和应用[J].计算机仿真,2006,23(4):170~173

[4]王小平,曹立明.遗传算法——理论、应用与软件实现[M].西安:西安交通大学出版社,2002.

[5]徐宗本,高勇.遗传算法过早收敛现象的特征分析及其预防[J].中国科学(E辑),1998,26(4):364~375.(Xu Z B,Gao Y.Character analysis and prophylactic of genetic algorithm’s premature convergence[J].Sicence in China(Series E),1998,26(4):364~375.)

[6]张克,刘永才,关世义等.均匀设计在遗传算法中的应用研究[J].战术导弹技术(Tactical Missile Technology),2003,5(9):35~40.

[7]Stuckman B E,Easom E E.Acomparison of Bayesian/Sampling Global Optimization Techniques[J].IEEE Trans Syst Man and Cybernetics,1992,22(5):9~18.

[8]曹慧荣,李莉.均匀设计表的MATLAB实现[J].知识丛林,2005,26(9):144~146.

[9]何大阔,王福利,贾明兴.遗传算法初始种群与操作参数的均匀设计[J].东北大学学报(自然科学版),2005,26(9):828~831.

[10]方开泰,李久坤.均匀设计的一些新结果[J].科学通报,1994,21(39):1921~1924.

[11]Hickernell F J.A generalized discrepancy and quadrature error bound[J].Math Computation,1998,67:299~322.

遗传程序设计 篇11

摘要:组卷算法设计是考试系统设计的核心。在分析通用在线考试系统的特点及组卷原则的基础上,首先建立一种改进的组卷数学模型;接下来依据该模型主要从编码方式选择、适应度函数的确定以及遗传算子的设计等方面详细设计通用在线考试系统采用的改进的遗传算法;最后,给出基于改进的遗传算法的智能组卷流程。应用表明,采用该算法实现的本系统的组卷功能在组卷的速度和成功率都得到显著提高,较好地满足了各类课程的组卷需求。

关键词:智能组卷;遗传算法;组卷数据模型;组卷流程;通用在线考试系统

中图分类号:TP311.13文献标识码:A

Abstract:Intelligent algorithm of assembling test taper is the core of the test system design. Based on analysis of the characteristics of the common online examination system and the general principles, firstly an improved test paper generated mathematical model was established. Then the improved genetic algorithm was designed mainly from the following three aspects: the coding scheme selection, the fitness function determination and the genetic operator design. Finally, the intelligent test paper process of the adopted improved genetic algorithm was shown. Applications show that the test paper speed and success rates have been significantly improved to better meet the needs of various courses of test paper.

Key words:intelligent generating;genetic algorithm;test paper generated mathematical model;test paper generate process;common online examination system

1引言

通用在线考试系统是我院自行开发,并且已经在军队院校以及各基层单位得到了广泛应用。在考试系统中,组卷算法设计的好坏将直接影响着考试系统性能的优劣。优秀的组卷算法不仅应该能够根据任课教师的各种要求及课程的特点智能生成考试试卷,还应满足考核不同层次学生的需要,以便能够真实、有效地反映学生的学习能力和教师的教学水平。

不论是在组卷质量还是在性能方面传统的组卷算法(如回溯试探法、随机抽题及误差补偿法等)都难以满足组卷要求。遗传算法(GA)是对自然现象或过程进行模拟而形成的,它通过模拟达尔文的自然选择学说和自然界的生物进化过程而形成的一种计算模型。它的收敛性也很好,可以有效解决计算量大的问题,而这些特点是处理智能组卷中所必需的,所以遗传算法已成为目前在线考试智能组卷的首选算法。[1-2]而传统的遗传算法在收敛速度和计算全局最优解之间存在矛盾,容易产生早熟现象、局部寻优能力差等缺点。因此,结合遗传算法的优点和缺点,通用课程在线考试系统在实现智能组卷时采用了一种改进的遗传算法来实现。

2智能组卷的数学建模

组卷问题的数学模型的建立是组卷算法实现的基础,它决定了组卷算法性能的好坏。结合通用在线考试系统的功能特点及组卷的原则,本文建立了一个适合于本系统的多目标优化组卷数学模型。

2.1试题属性的确定

通过遗传算法高效精确地完成组卷时,试题属性的设置要满足经典测量理论的需求。[2]试题属性的设置以能把整套试卷中的试题的情况说清楚即可,属性不能太多也不能太少。依据这一原则,本系统选取设置的试题属性主要有以下几个:

1)题号:区分试题的唯一属性,在数据库设计中设置为试题的主键。

2)题型:主要包含单选题、多选题、填空题、判断题、改错题、程序设计等多种题型,可根据课程特点对题型进行灵活地设计。

3)分数:该题目在试卷中所占的分值,主要依据题目的难度及所涉及的知识点来确定。

4)难度:反映试题的难易程度,从等级上大致分为容易、较易、中等、较难、难等多个等级,可通过设置范围为0.00~1.00的难度系数来体现。试题难度可以在系统启用初期由经验丰富的教师手动设置,也可以在系统使用一段时间后,根据学生测试的正确率自动调节(试题的回答正确率的近似值为其难度值)。

5)知识点:试题所考核的知识点的体现。通常情况下,如果试题属于相同知识点,则他们具有非常高的相似度,在生成试卷时,应最大限度地避免它们出现在同一试卷中。在考试系统数据库设计中,该属性作为外键。

6)曝光度:指本试题在历次考试中被选中的次数,该属性是进行考试评价和后期组卷策略调整的重要依据。

依据数学建模理论[3],如果要组一套含有n道试题的试卷,假设每一道试题含有m项指标,那么要确定这份试卷,就要先确定一个n*m 的矩阵,如下图1所示:

其中,矩阵中每一行为一道试题,每一列为试题的一个属性。对于本系统而言,n为6,这6个属性依次是:题号、题型、分数、难度、知识点和曝光度。

2.2组卷的约束条件

依据前述智能组卷基本原则及构建的组卷数学模型,本系统确定组卷的几个重要约束条件如下几个:试卷总分值约束;考试时间约束;题型和各题型的题量约束;考试范围约束;知识点分数分布约束;试卷的难度约束;试卷的区分度约束:区别不同层次学生能力水平的主要标准,也是衡量试卷质量的一个重要指标。

3多目标优化的数学模型的建立

如前所述,要组成一份试卷需要满足多个约束条件,整张试卷需要满足的所有约束条件集合构成了一个多维变量空间。而矩阵的维数越多求解就越复杂,也就是说,如果组卷玉树矩阵的维数设计不合理,会在很大程度上增加组卷算法设计的难度,同时也会降低组卷的效率。[3-5]为此,本系统采用的组卷算法在设计时,基于以下前提:试卷的总分、完成时间、包含的题目类型、各题型的题目数量、各题型中每小题的分值由教师设置的(或者由系统默认)。如对于《大学计算机基础》课程,考试通常包括选择、填空和应用设计三种题型,同一类题型中各小题分值是一样的,题量的设置可以根据考试时间来确定。因此,一旦固定了题量,算法就不再考虑各小题的分值和每个小题的做题时间。也就是说,可将试题的约束条件简化到“难度”、“知识点”、“区分度”和“曝光度”这四个属性。此时,试卷的约束条件简化到了一个四维空间,如下图2所示。

其中,矩阵中n行代表一套试卷的n 道试题,每一行表示一道试题相应的四个约束条件,分别是:难度、知识点、区分度和曝光度。

4算法的设计

在应用遗传算法解决组卷问题时,将一份试卷当成一个个体或者是染色体,而试卷中的每道题当作一个基因,多份试卷则称为一个种群。遗传算法的组成主要有编码方式、初始化种群、适应度函数、遗传算子(遗传、交叉、变异)以及终止条件(控制参数)的设定五个方面。下面主要从这个五个方面介绍本考试系统所采用的改进的遗传算法的设计。

4.1编码方式的选择

应用遗传算法完成组卷时,首先要解决的是个体的编码问题,编码用于产生初始种群。由于每道试题在题库中按照题型不同都有唯一的自然数编号,依据该特点本系统组卷算法采用整数分段编码方案。其主要思想是,整个编码分成独立的几段,其中每类题型对应一段,而每段的长度则由每个题型在待生成试卷中题目的数量决定;各题型间的编码是相互独立,各自按照整数编码方式进行编码;编码串的总长度等于待生成试卷要求的试题总数量。

整数分段编码的优点是:克服了二进制编码长度过长和搜索空间过大的缺点,从而节省了个体解码的时间,提高了遗传算法的计算效率;同时,由于同类型的试题放在同一段内,交叉和遗传操作均在段内进行,这样可以在一定程度上确保优化目标中题型匹配的正确性。

如前所述,在整数分段编码中,每一段代表一种题型,而每个基因就是被选中的试题编号。如《大学计算机基础》课程试题库中共有4种题型:单项选择题、填空题、判断题和应用设计题,共600道题,它们分别用符号X、K、P和Y表示,X类题型有300个,K类题型有100个, P类题型有100个,Y类题型有100个。各类题型在待组试卷中的试题数分别是s1(1≤s1≤300),s2(1≤s2≤100),s3(1≤s3≤100),s4(1≤s4≤100),编码的总长度S为待组试卷中的总题数,即s=∑4i=1si。编码方案如下表1所示。

4.2初始化种群的生成

在遗传算法搜索过程中,种群规模大小的设置对算法的收敛速度和求解最优解的几率有很大影响。通用在线考试系统为了加快算法的收敛速度,在生成初始种群时,采用了不完全随机的方式,使初始种群中的个体一开始就满足时间、题量、题型和分数的要求,从而在一定程度上提高了算法的搜索效率。种群初始化后,再对种群中个体的相似度进行比较,将相似度高的个体进行删除,从而避免了初始种群中出现过多的相似度高的个体,使初始种群的规模进一步减小。

4.3适应度函数的确定

组卷要求与染色体之间的差别是通过适应度函数来反应的,适应度函数是指导遗传算法的主要信息来源,同时它也是区分优劣个体的一个很好的工具。[5-7]要想保持群体多样性需要有一个良好的适应度函数,它能有效防止群体的早熟问题。通常情况下,个体的好坏与适应度函数值成正比,即适应度函数值越大,则个体越好。

如前所述,由于考试时间、题量、题型和分数题型要求在初始化种群时已经考虑。因此,适应度函数在确定时,仅需再考虑难度系数、知识点分数分布和试卷区分度这几个指标即可。由此确定的适应度函数仅与试卷难度系数(用P表示)、知识点分数分布(SPD)和试卷区分度(用D表示)有关。也就是说,试卷期望难度系数EP与试卷实际难度系数P之差Ep、用户的期望知识点分数分布ESPD与实际知识点分数分布SPD之差ES、和试卷期望区分度ED与试卷实际区分度D之差ED,越小越好。系统的适应度函数设计如下:

F=(Esw1+Epw2+EDwa)(1)

适应度函数F的值越小,则个体的适应度就越高。其中,Es=∑ki=1|ESPD-SFD|,即各章节知识点分数分布期望值偏差的绝对值之和,Ed=|ED-D|,Ep=|EP-D|,w1+w2+w3=1。

4.4遗传进化中的选择操作

遗传算法模拟自然界中的选择机制对群体中的个体按照其适应度值的大小进行优胜劣汰操作时,是通过选择算子来实现的。选择算子的强度不能太大,也不能太小,选择强度要适中才有利于算法搜索问题最优解。选择强度太大的算子,会使群体丧失多样性从而陷入局部最优,影响问题求解结果;而选择强度过小算子,会使种群的进化速度会十分缓慢,影响问题求解速度。[12-13]本系统采用了最优保持策略与轮盘赌选择策略相结合的方法,从而在一定程度上避免了轮盘赌选择策略的随机性。

轮盘赌算法:

设种群由M个个体组成,其中个体Mi的适应度用Fi表示,则此个体的选中率用Pi表示,则:

Pi=Fi/∑Mi=1Fi(2)

轮盘赌算法的操作过程如下:首先根据公式(1)计算群体中各个个体(每套试卷)的适应度值Fi,根据公式(2)计算出每个个体被选中的概率Pi;接下来计算群体中各个个体的累积率Qk=∑ki=1Pi并以此构建一个轮盘;求出Qk之后,依据 Qk的值来选择参与进入下一代的个体:确定一个[0,1]之间的值r(可随机产生),比较Qk与r的值的大小,若r≤Qi,就选择个体M1;若Qk-1≤r≤Qk,则选择个体Mk参与下一代群体;如上反复执行,直到产生M个个体,即M套试卷。

在遗传算法的进化过程中,通过执行选择、交叉及变异等操作从而不断生成越来越多的优良个体。但是,由于选择、交叉及变异操作的随机性,会导致适应度好的个体经常被破坏,从降低算法的收敛性和执行效率。[8]因此,为尽可能地使适应度好的个体保留到下一代群体中。通用考试系统在实现选择操作时,将轮盘赌选择策略和最优保留策略结合起来实现进化过程中的选择操作。

4.5遗传进化中的交叉操作

传统遗传算法在实现交叉操作时,采用的是恒定不变的交叉概率,这会导致遗传算法在解决复杂的优化问题时,效率很低且容易出现早收敛现象。[9]本系统为了加速算法搜索速度,并有效地防止早收敛现象,采用了Srinvivas提出的自适应交叉概率Zc。自适应交叉概率Zc的计算公式如下:

Zc=11+exp(-k1(Fmax-Favg))(3)

其中,k1为大于0的常数,本系统选择的是k1=0.6,Fmax表示种群中个体的最大适应度值,Favg表示群体中大于平均适应度的那部分个体的平均适应度值,Zc在[0.6,1]之间取值。

在算法的进化过程中。交叉概率Zc会根据Fmax-Favg的不同而自动调整,当群体趋于分散时,也就是Fmax-Favg增大时,交叉概率Zc增大,而对应的变异概率减小,从而使种群生成优良个体的能力增强;反之,当群体趋于收敛时,也就是当Fmax-Favg减小时,交叉概率Zc减小,而对应的变异概率增大,从而使群体保持多样性的能力增强。

基于上述自适应调整交叉概率的交叉操作过程如下:

1)设种群规模为N,将群体中的个体随机进行两辆交配,则会产生[]对个体组;

2)对种群中的个体随机生成交叉点,如果个体的编码长度为L,则有L-1个位置会成为交叉点;

3)如前所述在整数分段编码方案中,每一种题型对应一段编码,交叉操作在编码段内独立进行,这样可以保证每种题型的试题数量不变。即若交叉点在第i个基因段内,则前i个基因段保持不变,只需从第i+1个基因段开始逐个基因进行交换。

采用此方式可避免基因段内进行交叉后出现试题重复的弊端。执行完交叉操后,再按照适应度函数分别计算两个新生个体的适应度,并将其与父代个体的适应度进行比较,若两者适应度相同,则将其丢弃;若不同则对它进行变异操作。

4.6遗传进化中的变异操作

通过交叉与变异操作的相互配合,使得遗传算法有了较高的搜索能力。交叉操作是算法的核心,在进化过程中对算法的局部搜索能力起关键性作用;而变异操作则是影响算法的全局搜索能力的主要因素。[10]在进化过程中,当算法的搜索过程陷入局部最优时,通过有效的变异操作可跳出局部最优,从而达到全局寻优的目的。但变异概率过大也有破坏掉最优解的可能,因此,不能盲目地进行变异操作。同交叉操作一样,本系统采用了Srinvivas提出的自适应变异概率,其计算公式如下:

Zm=11+exp(-k2(Fmax-Favg))(4)

同前述自动调整交叉概率的计算公式一样,其中,k2为大于0的常数,这里选择k2=0.9,Fmax表示种群中个体的最大适应度值,Favg表示群体中大于平均适应度的那部分个体的平均适应度值,Pm在[0,0.5]之间取值。

同交叉操作一样,在执行变异操作时,各种题型也是在各自对应的编码段内进行。首先对群体中的各个个体生成一个与其编码长度L相同的随机数序列R={r1,r2……r1},其中,0≤r1≤1,0≤i≤1;对所有ri

1)查找出基因位i所在段对应的试题类型;

2)找出该基因位(题号)所代表的试题所对应的知识点、难度系数,然后随机生成一个新的满足要求的试题编号,从而产生一个新的染色体(试卷个体);

3)判断该新的基因串是否已经存在,如果存在则转向步骤2,再次生成新的染色体。否则用此新的染色体替换原来的染色体。

4.7终止条件的设定

基于遗传算法的实现时,就是反复从试题库中搜索符合相应约束条件的试题直到找到最优解的过程。如果经过反复多次选择、交叉、变异操作后,仍然没有找到最优解,那么搜过过程不可能无休止地循环下去迭代下去。此时,需要设定一个终止条件来结束这种无休止无意义的搜索迭代过程。终止条件的设定主要需要考率以下三种情况:

1)设定进化迭代最大次数,当最大值出现时,算法终止。一般为150-600。

2)设定好一个适应度最高值,若该值出现,即可终止算法。

3)如果连续几代个体适应度平均值的差异小于某一极小阈值或者当所有个体适应度函数值的方差小于某一极限阈值时,也可考虑终止算法的进行。

根据以上算法终止条件的判断,本系统组卷算法采用了以下两种终止条件:

1)种群进化到指定的迭代数,系统设参考范围为500-1000代,默认值取600。

2)最优个体的适应度与期望的最好适应度比值为96%以上,即用户对生成的试卷满意度为96% 。

在迭代过程中,只要满足其中任意一个条件,都会终止算法的操作,并输出相应的试卷;

5基于改进算法的智能组卷流程

基于改进后的遗传算法的智能组卷流程如下图5所示。6结论

本系统采用的改进的遗传算法的智能组卷策略,主要是结合组卷问题本身的特点,在遗传算法的染色体编码方式选择、初始化种群的生成以及适应度函数、交叉和变异操作的设定等方面进行了相应的改进。其中,整数分段编码方式节省了个体解码的时间,提高了遗传算法的计算效率;分段交叉方式和自适应交叉概率、变异概率的应用,提高了算法的收敛速度,较好地避免了传统遗传算法的早熟问题。应用表明,本系统的组卷功能在组卷的速度和成功率都得到显著提高,较好地满足了各类课程的组卷需求。

参考文献

[1]肖理庆,徐晓菊.改进遗传算法智能组卷研究[J].计算机工程与设计,2012,(10):35-39.

[2]唐启涛.基于改进的遗传算法的智能组卷算法研究[J].计算机技术与发展,2014,(12):241-244.

[3]袁桂霞.自动组卷的建模和仿真研究[J].计算机仿真,2011,(28):370-373.

[4]汪民乐.遗传算法的收敛性研究[J].计算技术与自动化,2015,(10):52-56.

[5]王吉权,王福林.单点交叉多子代遗传算法[J].生物数学学报,2015,30(2):305-311.

[6]李书全,孙雪.遗传算法中的交叉算子的述评[J].计算机工程与应用,2012,(1):67-71.

[7]贺荣,陈爽.在线组卷策略的研究与设计[J].计算机工程与设计,2011,(6):2183-2183.

[8]刘淳安,赵天绪,刘燚.智能组卷的优化模型及求解的遗传算法[J],科学技术与工程,2010,(10):2754-7456.

[9]张宗飞.网络化考试中智能组卷方法研究[J],中国教育信息化,2015,(16):79-81.

[10]柳良涛,谷林.自动组卷系统试题难度和知识点覆盖控制算法[J].西安工程大学学报,2015,(3):320-324.

遗传程序设计 篇12

网络和计算机技术的发展使得传统教育方式发生了翻天覆地的变化, 远程教育、在线测评、无纸化考试等先进的教学手段日益普及。在无纸化考试系统中, 随机从题库中选题是系统后台需要处理的一个关键问题, 所选考题质量直接影响到教学效果评价, 试卷生成过程中的选题算法是整个系统的核心。因此, 找到一种适合于大规模并行计算, 并具有自适应、自组织、自学习等功能的算法尤为重要, 遗传算法能较好地实现题库中的智能选题。

1 遗传算法概念

遗传算法 (Genetic Algorithm) 是一类借鉴达尔文生物进化论中适者生存、优胜劣汰遗传机制的自然选择和遗传学机理生物进化过程的计算模型, 是一种模拟自然进化过程搜索最优解的方法[1]。

遗传算法从代表问题潜在解集的一个种群 (Population) 出发, 一个种群由经过基因 (Gene) 编码的一定数目的个体 (Individual) 组成。每个个体是染色体 (Chromosome) 带有特征的实体。染色体作为遗传物质的主要载体, 其内部表现 (即基因型) 是某种基因组合, 它决定了个体形状的外部表现[2]。因此, 在一开始需要实现从表现型到基因型的映射即编码工作。初始种群产生后, 按照适者生存和优胜劣汰的原则, 逐代 (Generation) 演化产生出越来越好的近似解, 在每一代, 根据问题域中个体的适应度 (Fitness) 大小选择 (Selection) 个体, 并借助于自然遗传学的遗传算子 (Genetic Operator) 进行交叉 (Crossover) 和变异 (Mutation) , 产生出代表新的解集的种群, 最后一代种群中的最优个体经过解码 (Decoding) , 可以作为问题近似最优解。

2 遗传算法执行流程

遗传算法的基本执行流程如图1所示, 基本过程如下:

(1) 定义初始种群。设置进化代数计数器t=0, 择优产生初始种群P (0) 。

(2) 个体适应度计算。计算群体P (t) 中各个体的适应度。

(3) 选择运算。选择的目的是把优化的个体直接遗传到下一代或通过交叉或变异产生新的个体再遗传到下一代种群。

(4) 交叉运算。将交叉算子作用于种群。遗传算法中起核心作用的就是交叉算子。

(5) 变异运算。对群体中个体串的某些基因座上的基因值根据需求作适当改动。

种群P (t) 经过选择、交叉、变异运算之后择优下一代群体P (t+1) 。

(6) 终止条件判断。如果适应度达到期望值, 则以进化过程中所得到的最大适应度个体作为最优解输出, 终止计算。

3 基于遗传算法的题库选题设计

题库选题是指按照命题教师和教学大纲的教学要求, 由计算机自动随机从题库中抽取试题, 组成一份符合教学考核要求的试卷。目前, 无纸化考试系统中有很多选题的算法, 常见的有随机选题法、回溯试探选题法和使用遗传算法选题法。随机选题法具有选题直观、实现过程简单等优点, 但是不具有智能性, 生成试卷不尽合理, 试卷难度很难控制。回溯试探选题法成功率高, 适用于题型和题量较小的情况, 不足之处是当题库中题量较大时, 选题耗费时间长、效率低、选取试题随机性也差。遗传算法具有动态性、智能性、自适应性, 可以满足题库不断更新的需求, 采用十进制编码方式的遗传算法, 具有较高的选题成功率和较快的选题速度。因此, 本文选择经过优化的遗传算法作为题库的选题算法。

3.1 遗传算法中染色体编码及初始群体设计

染色体编译是遗传算法的基础, 在传统遗传算法中使用二进制编码方式, 使用1表示题被选中, 0表示题未被选中, 因为题库中每一道题都要出现在二进制串中, 编码较长, 且进行交叉算子和遗传算子操作时, 题型和数目都不好控制。本系统采用整数编码方式, 一套试卷使用一个染色体来编码, 染色体由不同题型的试题编号组合而成, 题号作为组成试卷的基因, 每种类型的试题放在一起, 使用时进行题型分段, 遗传算子操作时也按段进行, 从而使每种题型的题目总数不变。

试卷初始种群不采用完全随机的方法产生, 根据总分、题型比例、重复率、考试涉及章节等要求随机产生, 使开始的初始种群就能满足要求, 这样可以减少迭代次数和加快遗传算法的收敛。采用分组十进制数编码, 可以避免二进制编码搜索空间过大和编码长度过长的缺点, 缩短找到最优解的时间。

3.2 遗传算法中适应度函数设计

适应度函数 (Fitness Function) 是用来评价试卷群体中个体优劣的指标, 它的设计直接影响到遗传算法的收敛速度和能否找到最优解[3]。在选题应用中, 因为总分、题型比例等要求在初始种群中已经定义, 这里最重要的是要考虑难易程度, 即难度系数, 所以适应度函数由难度系数公式得到。选题难度系数公式:P=∑Dn×Sn/∑Sn, 其中n=1, 2, …, m (m是所抽试题总数, Dn和Sn分别是第n题的难度系数和分值) 。教师期望的难度系数EP和抽到试题的难度系数PP之差f越小越好, f=|EP-PP|, 而适应度函数是值越大越好, 所以将目标函数f转换成适应度函数F=e-0.03f, 利用加权误差的适应度函数可以较好地生成符合要求的试题, 当试卷个体对各项组卷约束条件误差越小时, 它的适应度函数值就越大, 则表示生成试题越接近试卷目标。

3.3 遗传算法中遗传算子设计

3.3.1 选择算子

选择算子能够根据个体适应度的优劣确定其在下一代被复制或是被淘汰。经过选择运算, 使适应度高的个体获得较大的生存机会[4]。本系统采用目前遗传算法中经典的选择方法:轮盘赌方法。它的实现方法为:规模为m的初始种群P中每个个体的适应度为:A1、A2、…Am, 则被选中的概率为:Ai/∑Ai (i∈[0-m]) 。

3.3.2 交叉算子

本系统采用整数编码方式, 采用按题型分段交叉, 整个染色体表现为多点交叉。交叉的过程:任意两两配对群体中的染色体, 对每对染色体生成一个随机数a, a为分段点 (取值范围[0, N-2]) , 将后两道题互换产生下一代。若在产生的下一代可能出现重复题号的情况, 将已出现过的题号换成未出现过的题号, 但要保证分值的一致性。

3.3.3 变异算子

变异发生的概率在遗传算法中较小, 因此采用不分段变异, 只针对某个基因变异。对某个染色体, 随机生成一个实数f (f∈[0, 1]) , 若f≤p (p一般取0.01~0.02) , 对该染色体变异, 否则不变异。变异的过程为:随机生成一个范围在[1, n]的段号s, s段的长度为L, 则随机生成一个变异位置p (p[1, L]) , 按一定的原则选择一个变异基因, 变异基因的选择要满足题型、试题章节、试题难度相同等要求。

4 基于遗传算法的题库选题关键算法实现

4.1 交叉实现

4.2 变异实现

5 结语

题库自动选题是在一定的约束条件下, 对多个目标进行优化求解的过程。遗传算法在实现自动选题时, 通过择优选取初始种群, 创建有效的选择算子、交叉算子和变异算子, 在问题解上直接进行遗传操作, 提高了遗传算法的选题能力, 能够取得较好的选题效果。同时, 遗传算法也存在一些问题, 如对算法的精度、可行度、计算复杂性等方面, 还没有有效的定量分析方法, 这也是今后需进一步研究的重要课题。

摘要:从遗传算法的应用入手, 阐述了遗传算法的相关概念和执行流程, 深入研究了遗传算法在题库选题系统中的应用, 探讨了初始种群、适应度函数、选择算子、交叉算子、变异算子的设计方法, 并给出了关键实现代码。遗传算法为题库选题提供了高效的解决方案, 能够取得良好的选题效果。

关键词:题库选题,遗传算法,初始种群

参考文献

[1]黄国政.基于遗传算法的自动组卷系统设计与实现[D].南京:南京理工大学, 2008.

[2]田民格.遗传算法在无纸化考试系统中实现随机抽题[J].三明学院学报, 2007, 24 (2) .

[3]黄英.试题库系统中随机抽题算法的设计与实现[J].现代计算机, 2010 (3) .

上一篇:环保节能设计下一篇:冬季汽车