密码子优化

2024-09-04

密码子优化(精选5篇)

密码子优化 篇1

1 引言

1976年Diffie Hellman发表的开创性论文《The New Direction in Cryptography》和次年NBS发布的DES的使用共同标志了现代密码学[1~3]的诞生。随着技术的进步, 即便DES的加强版本3DES的安全性也无法满足实践的要求, 于是NIST (美国国家标准技术研究院) 于1997年开始了高级加密标准AES的征集活动。这次公开征集活动掀起了分组密码研究的高潮。这次活动征集到15个算法, 这些算法反映了当今分组密码设计的最高水平。Serpent是世界著名密码学家Ross J.Anderson, EliBiham, Lars R.Knudsen向NIST的AES征集活动提交的算法。最终Rijndael获得了胜利, Serpent排名第2。Serpent的设计很大程度上反映了当今分组密码设计的技术与经验。

本论文依据Serpent密码算法原理, 对算法的实现进行了研究, 在Keil集成开发环境中用8051单片机[4,5]汇编语言对Serpent密码算法进行了实现和优化。

2 Serpent密码算法原理

Serpent密码算法[6]采用传统SP网络, 分组长度是128bit。该算法将明文分为4个32bit字进行32轮运算, 在33个128bit子密钥的控制下得到128bit的密文。该算法由初始置换IP、32轮迭代运算、末置换FP组成。设明文P经过初始置换IP后输出为B0, 并将其作为第一轮的输入, 第i轮的输出为Bi+1, 每一轮的迭代过程用轮函数Ri表示, 最后一轮的输出为B32, 整个算法如下:

3 Serpent密码算法的实现和优化

初始置换IP和末置换FP的设计和优化

初始置换IP是对128bit的明文数据进行比特置换, 初始置换IP只是对128bit明文的结构作初步调整, 对Serpent的安全性不起本质的作用。

由于8051的20h-2fh存储空间是可以位寻址的, 可以把16字节的明文数据传送到20h-2fh, 然后通过每一位的移动实现初始变换, 但是这样将使用很大的代码量, 冗余大, 浪费大量的存储空间。通过观察, 可以发现IP变换的规律, 就是取4个字节中相应的2个比特组成新的字节, 如取第1个字节, 第5个字节, 第9个字节, 第13个字节的前两个比特组成变换后的首字节。利用这个规律, 可以优化IP变换。同理, FP变换也可以通过这样的方法实现并且优化。

4 测试验证

完成程序设计及优化后, 可在Keil仿真软件上对程序进行最后的测试和验证工作。测试在仿真频率为24MHZ下进行, 测试向量[7]是:

明文:00000000000000000000000000000000

密钥:80000000000000000000000000000000

密文:A223AA1288463C0E2BE38EBD825616C0

进行优化后, 将初始程序与优化程序的性能进行比较, 优化程序占优。

5 结论

本论文所设计的8051单片机汇编语言程序实现和优化了Serpen密码算法。

参考文献

[1]金晨辉, 张少武, 胡斌, 郑浩然, 史建红.密码学[M].郑州:电子技术学院出版社, 2007

[2]李建华.现代密码技术[M].北京:机械工业出版社, 2007

[3]秦志光.密码算法的现状和发展研究[J].计算机应用, 2004.24 (2) :2-3.

[4]林申茂.8051单片机彻底研究[M].北京:中国电力出版社, 2007

[5]王守中, 51单片机开发入门与典型实例[M].北京:人民邮电出版社出版发行, 2007.

[6]Ross Anderson, Eli Biham, Lars Knudsen.The Case for Serpent[EB/OL].http://www.cl.cam.ac.uk/~rja14/Papers/serpentcase.pdf.

[7]Ross Anderson, Eli Biham, Lars Knudsen.Serpent-256-128.verified.test-vectors[EB/OL].http://www.cs.technion.ac.il/~biham/Reports/Serpent/Serpent-256-128.verified.test-vectors.

密码子优化 篇2

猪链球菌 (Streptococcus suis) 属革兰氏阳性致病菌, 是一种重要的人畜共患病病原体, 可引起猪的脑膜炎、关节炎、败血症等疾病[7], 亦可引起人类的感染, 导致脑膜炎及中毒性休克综合征等严重疾患[8]。2005年, 在我国四川等地发生有猪链球菌引起的暴发性流行, 造成200多人感染, 38人死亡[9]。本实验室分离了一株高致病性的猪链球菌GZ1, 并已完成其全基因组序列的测定[10]。本文将以猪链球菌GZ1为对象, 对其密码子使用模式及其受到的影响因素进行分析, 为进一步进行其基因组进化研究奠定基础。

1 材料与方法

1.1 数据获取

猪链球菌GZ1编码区序列从NCBI下载 (Genbank No. CP000837) 。采用Perl语言提取所有基因序列长度大于或等于300 bp的基因来分析密码子使用模式, 总共获得1742 个基因。

1.2 统计分析

利用在线工具Codon W (http://mobyle.pasteur.fr/cgi-bin/portal.py?form=codonw) (由John Peden编写并提供) 计算衡量密码子偏好的所有指标, 并用SPSS 13.0进行统计学分析。

1.2.1 密码子偏好的衡量指标

相对同义密码子使用 (relative synonymous codon usage, RSCU) 被用来研究整个基因中全部密码子使用变异, 它的值是实际观察值与理论期望值的比率[11]。如果该密码子使用平均, 无偏好性, 则RSCU值为1;如果该密码子比起其他同义密码子出现更为频繁, 则RSCU值大于1, 反之亦然[12]。

GC3s值是第三位密码子的G+C含量在基因碱基总量中所占的比率 (蛋氨酸、色氨酸和终止密码子除外) 。

GRAVY值是反映蛋白质的疏水性对密码子使用偏好的影响。

Aromo值是反映芳香族蛋白质对密码子使用偏好的影响。

有效密码子数目 (effective number of codons, ENC or Nc) 被用来检测单个基因密码子使用偏好性的高低。它的变化范围在20~61之间, 越靠近20表示基因的偏好性越大[11]。

密码子适应指数 (codon adaption index, CAI) [13]可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。CAI的值在 0~1 之间, 如果越高则表明该基因的密码子使用偏好性越强, 且表达水平也越高[11]。

ENC绘图分析 (Nc-plot) :主要是探索ENC值和GC3s分布的关系。图中标准曲线表示在不存在选择压力时, 密码子偏好性完全取决于突变压, 即序列本身核酸组成偏好性。 若一个基因的密码子使用模式受到GC碱基组成的影响, 那么这个基因将落在Nc-plot期望曲线的上面或较近的位置, 否则该基因将落在离期望曲线比较远的位置[14]。 ENC期望值可以通过以下公式计算:ENC期望值= 2 +s +{29 ÷[s2+ (1-s) 2 ] }, 其中s代表GC3s[14,15]。

1.2.2 对应分析

对应分析 (correspondence analysis, COA) [16]主要是用来检测基因RSCU值的变化并推测影响基因密码子组成的主要因素。所有的基因根据它们所包含的59个有义密码子的使用情况被分布在一个59维的向量空间中。通过检测相对向量和基因在主向量轴上的位置可以确定一组数据的主要变化趋势。

2 结果

2.1 猪链球菌GZ1基因组密码子使用分析

我们计算了猪链球菌GZ1整个基因组中59个有义密码子的RSCU (如表1所示) 。结果表明, 猪链球菌GZ1偏爱使用以U或A结尾的密码子, 其中12个是以U结尾, 5个以A结尾。由于猪链球菌GZ1基因组中GC含量仅为41.4%, 受碱基组成影响, 猪链球菌GZ1偏爱使用以U或A结尾的密码子。

为了分析基因组内部不同基因的同义密码子使用情况, 我们分别计算了不同基因的ENC值和GC3s值。ENC值的变化范围在28.02~61 (平均值为49.40, 标准偏差为6.19) , 这意味着猪链球菌GZ1基因组的密码子使用具有一定的偏好性, 且基因之间存在异质性 (标准偏差为6.19) 。

注:a AA 表示氨基酸;b N 代表同义密码子出现的次数;c 黑体表示每种氨基酸偏爱使用的密码子

2.2 对应分析

对应分析表明, 第1条向量轴贡献基因间总变异的14.49%, 其余3条向量轴分别贡献10.55%、5.84%和4.41%。第1条向量轴虽然是主要轴, 但是和第2条轴的贡献率差异不大。结果表明影响该菌密码子使用偏好的因素并不是单一的。

2.3 基因的碱基组成、表达水平对密码子使用的影响

对应分析的第1条向量轴与ENC (R=0.549, P<0.01) 、GC3s (R=0.067, P<0.01) 呈显著正相关, 与G+C (R=-0.216, P<0.01) 呈显著负相关。表明基因的碱基组成是影响密码子使用的一个重要因素。Wright[14]认为, Nc-plot曲线能有效的解释密码子使用偏性。从图1中可以看到有少量的基因落在Nc-plot连续的平滑曲线上而大部分基因偏离曲线。表明少数基因密码子使用仅受碱基组成影响, 大部分基因的密码子使用还受到其它因素的影响。

对应分析的第1条向量轴与CAI (R=-0.749, P<0.01) 呈显著负相关, 而CAI与GC3s (R=0.176, P<0.01) 、G+C (R=0.440, P<0.01) 呈显著正相关。这表明基因的表达水平是影响密码子使用的主要因素。表达水平高的基因有较高的GC含量并且偏爱使用以G或C结尾的密码子。

2.4 其它因素对密码子使用的影响

蛋白质的性质[4]也影响密码子使用偏好。为此, 我们考察蛋白质的疏水性以及芳香族蛋白质对猪链球菌GZ1密码子使用偏好性的影响。对应分析的第1条向量轴与GRAVY (R=0.17, P=0.487) 无相关性, 与Aromo (R=0.297, P<0.001) 呈极显著相关。而CAI与Aromo (R=-0.353, P<0.001) 呈极显著负相关。表明蛋白质的疏水性不会影响密码子使用偏好, 而芳香族蛋白质对密码子使用偏好有一定的影响。表达水平高的基因翻译成为芳香族蛋白质的频率不高。

3 讨论

不同基因组或基因组内部各基因对密码子的使用都是非均衡的, 具有一定的偏好性。突变和翻译选择被认为是影响密码子使用偏好的主要原因[1,2]。在GC含量极高或AT含量极高的基因组中, 突变压力是主要影响其同义密码子使用的因素[17,18];相反, 在多细胞生物中的果蝇、线虫基因组中, 密码子的使用偏好主要受翻译选择的影响[19,20]。然而, 在单细胞生物中的大肠杆菌、酿酒酵母基因组中, 密码子的使用偏好取决于突变压力和翻译选择的平衡[21,22]。

密码子优化 篇3

DNA计算[1,2,3]是一门近几年才兴起的前沿学科,而密码学则是作为用于保护数据安全的工具从古老的凯撒密码到现代密码学逾期将近两千余年。两个看似没有联系的学科在现代技术下呈现越来越紧密的联系。

密码学技术是信息安全技术的核心,主要由密码编码技术和密码分析技术两个分支组成[4,5]。传统经典密码学和在其基础上发展起来的现代密码学,其加密解密过程,以及安全性都是基于数学难题,除一次一密外其他的密码系统都只具有计算安全性,如果攻击者有足够的计算能力,就可以破译这些密码。但传统密码在算法和理论上都是相当成熟的。

量子密码是一个全新的概念[6],它依赖于物理学的理论基础作为密码的安全模式,简单说就是基于单个光子和它们固有的量子属性来研究开发比较先进安全的全新密码系统[7]。因为量子系统在不干扰系统的情况下是不可能测定该系统的量子状态的,同时由Heisenberg测不准原理几乎可以保证,量子密码学成为不可破译的密码。

DNA密码是近几年伴随着DNA计算的研究而出现的密码学新领域。其特点是以DNA为信息载体,以现代生物技术为实现工具,挖掘DNA固有的高储存密度和高并行性低消耗等优点,有很多人相信其将有可能与传统密码学,量子密码学并列成为密码学的三大分支[8,9,10]。但是要想与发展成熟的传统密码和理论较完善的量子密码并驾齐驱还是要经过长期的理论构架和实践操作,现阶段学术界对DNA密码的研究也在逐渐展开[11,12,13,14,15]。

1 现代密码学和量子密码学

1.1 密码学概念

将一个加密系统采用的基本工作方式叫做密码体制。构成一个密码体制的两个基本要素是密码算法和密钥。一个密码体密码体制通常有五部分组成:明文空间U;密文空间L;密钥空间K,k=<Ke,Kd>(Ke是加密密钥,Kd是解密密钥);加密算法E;解密算法D。

明文m∈U,密钥k=<Ke,Kd>∈K,则加密C=EKe(m)∈K,解密m=EKd(C)∈U。

1.2 现代密码学

现代密码学是在经典密码学或称之为传统密码学的基础上发展起来的。传统密码学基于Non-Polynomial Time Complete(NP-C)问题之类的各种数学困难问题,但无论是经典密码学还是现代密码学,其安全性都依赖于一种“智慧”,即尚未发现其安全缺陷便认为其是安全的。为了打破“构建方案、攻破方案”这一循环,现代密码学基于更严格和更科学的基础。

在现代密码学中发展完善且运用广泛的主要是:对称密码、公钥密码等。

1.3 量子密码学

1.3.1 量子密码学概念

用物理学知识开发出的不能被破获的新密码系统就叫量子密码,由量子为信息载体,经由量子信道传送。不同于基于数学难题的传统密码,量子密码是一个全新的概念,它依赖于物理学的理论,特别是量子物理学作为密码的安全模式,简言之就是基于单个光子和它们固有的量子属性来研究开发的密码系统。

1.3.2 量子密码学的实现过程

量子密码的传送程序大致为:现在地面发射加密的量子数据和信息,再通过大气层发送量子信号,然后由卫星接收信号再并转发到地面的各个接受目标。

1.3.3 量子密码学的优势

量子密码学的安全性建立在量子物理学基础上,即使攻击者拥有强大的计算能力也无法攻破对计算破解方法免疫的量子密码。物理法则保证了这个量子信道的安全性。

量子密码的安全性是基于Heisenberg的测不准原理、量子不可克隆原理和单光子不可分割性,遵从物理学规律,是无条件安全的。在量子密码学中用光量子传递数据和信息,如果被监听者插入或截取信息,攻击者不可能在未被发觉的情况下破译密码,从而保证了密码使用的安全性。

1.3.4 量子密码学的难题

由量子密码学的实现过程可见,量子密码学的研究和使用有一下难题需要解决:

1)低温状态下加密技术;

2)加密速度问题;

3)卫星的吸收问题。

2 DNA密码

2.1 DNA密码学概念

DNA密码是密码学中新生的密码,要了解DNA密码必须先对DNA计算和DNA生物技术有一定的了解。

由Aldeman在1994年首次利用现代分子技术,提出并解决了哈密顿路径问题的DNA计算方法,并成功进行试验后,DNA算法被广泛运用与解决NP问题中。这门学科解决问题的过程可以简化叙述为:

1)对于特定问题,将问题中的相关数据编码为DNA链。

2)在适宜的条件下,将1)中的DNA链的若干拷贝在溶液中混合。根据碱基配对原则,溶液中的短链将自组装结合为长链。

3)反应结束后,通过PCR扩增、磁珠分离等实验技术,筛选出满足一定条件的反应结果,即为所求的问题结果。

DNA密码虽然是在DNA计算基础上诞生的,但二者有明显不同,区别是:DNA计算是用DNA技术解决数学难题,而在DNA密码中,所谓的生物学难题却是用来作为DNA密码系统的安全依据[16,17]。

2.2 DNA密码实现过程

DNA密码系统总体方案如下:

步骤A密钥生成。此步骤中生成由信息的发送者和接收者分别掌握的加密钥和解密钥。一般设计一段DNA序列作为加密和解密信息的引物序列,或将其设计成为由Watson-Crick互补配对的一对探针集合等。

步骤B加密。将要传送的明文信息制作成为密文,1)需将明文信息进行数据预处理:选择编码方式将具体明文转化成为数据信息。本文使用DNA编码方式,将DNA核苷酸看作是四进制编码,用三位核苷酸表示一个字母,如字母A则以CGA表示,字母B则有核苷酸序列CCA表示。2)制作消息序列:将由1)制得的DNA消息序列前后各链接上有20个核苷酸的5′和3′引物。

步骤C信息传送。用超声波把人类基因序列粉碎成为长度为50~100的核苷酸双链,并变性成单链,作为冗余的DNA使用,在将含有信息的DNA序列混杂到其中,喷到传送载体上形成无色的微点,在通过普通的非保密途径传送,由于制作材料普片,可以保证大规模使用,增加了传送的成功率。

步骤D解密。接收方和发送方共享编码方式和引物信息。当接收方接收到含有消息DNA序列的传送载体后,提取微点中的DNA,用已有的引物对DNA微点中的消息序列进行PCR扩增,再通过测序得出消息DNA序列。再根据预先约定的编码方式还原出明文。

2.3 DNA密码当前面临的主要问题

1)缺乏相关理论支持。至今DNA密码还没有建立起相应的理论,DNA密码的实现模型是什么,安全依据在哪里,具体应该如何实现等都尚未解决,也正是因为如此现阶段难以产生适合使用的DNA密码方案。

2)实现困难,代价高昂。在已有的方案中,加密解密阶段往往要人工合成消息DNA序列,进行PCR扩增,对DNA序列经行测序等生物实验。这必然要求在装备精良的生物实验室进行,从而限制了DNA密码在实际操作中的使用。

2.4 DNA密码的优势

DNA密码的继传统密码和量子密码以后诞生,必然要有其独特的区别和优势,如

1)利用DNA所具有的体积小的特征,实现纳米级的存储;

2)利用DNA的超大规模并行特性,实现加密解密的快速化;

3)利用人类还不能破解但是可以使用的生物学难题,作为DNA密码的安全依据[11,12],以实现能够抵抗量子攻击的新型密码系统;

4)在实际运用方面,由于DNA密码对实时性要求不高,但可以大规模进行数据加密、安全数据存储、身份认证、数字签名和信息隐藏等密码学应用中可以有独特的发展;

5)由于DNA微点不易被发现,就算密文被发现截取,也不易对未知的DNA混合物进行测序,所以消息序列不易被发现,从而保证了安全性。

2.5 DNA密码的缺陷

DNA密码的不足可以分为:DNA计算技术的发展不足;DNA密码学运用上的先天缺陷;DNA密码在实现上的困难三个大方面:

1)DNA计算技术的发展不足

首先,目前所建立的每一种DNA计算模型只能解决一类问题(以NP-完全问题为主),而没有像电子计算机那样的统一处理问题的模型,其距离通用性还有很大差距;

其次,在已经建立的DNA计算模型中,大多数问题存在着所谓的“解空间指数爆炸问题”,即随着问题规模的增大,所需要的DNA分子数量成指数阶地剧增。DNA分子虽然体积微小,但是可用的分子毕竟有限。

再次,一些模型中,反应过程中需要人为参与反应步骤过多,削减了DNA计算被大规模应用的可能性;

最后,在目前的DNA计算实现运算模块现有成果中,若想将反应结果投入下一次运算,往往需要人为再处理加工后才能进行下一步,无法自动进行。这是限制目前DNA计算发展的本质困难。

2)DNA密码学运用上的先天缺陷

首先,不能代替传统密码学独立使用。DNA密码的设计不易改变,相当于一次一密,在反复利用上不够灵活。

其次,DNA计算技术的成果不能直接应用到DNA密码学的设计和研发使用中。

最后,DNA编码直接影响到DNA密码的加密解密过程的准确性和破译的难易程度。

3)DNA密码在实现上的困难

由前文介绍可知DNA密码加密和解密的过程,以及密文密钥的设计,可见:

首先,DNA密码从设计到加密解密都需要在在一个设备精良的生物实验室,耗费巨大代价高昂,不易普遍使用。

其次,DNA密码只能用物理方法传送。特别是作为密文的载体、密钥的引物等,而编码方式和生物条件等也可以通过信息传送。但现在使用的主要使用电子计算机而不是DNA计算机,但这又同时保证了在信息屏蔽时密码的使用。

最后,如何保证使用的载体不被破坏污染,从而达到信息传递的准确性。

3 DNA密码对比传统密码和量子密码

DNA密码学、传统密码学、量子密码学这三类密码学建立在不同的学科基础上,从理论到实现方式再到安全依据均不同。由于本文主要探讨DNA密码的优劣,下面就将DNA密码学与后两种一一对比。

3.1 DNA密码与传统密码的区别

1)理论基础方面,传统密码学是基于Non-Polynomia Time Complete(NP-C)问题之类的各种数学困难问题,DNA密码学以DNA为信息载体以现代生物学技术为实现工具;

2)传统密码以计算机芯片为存储媒介,DNA密码以DNA链或DNA芯片为存储媒介;

3)存储能力方面,传统媒介1g硅芯片可存储16MB,而1g DNA可存储108TB;

4)传统密码以串行运算为主,而DNA密码在DNA并发反应下具备并行运算能力;

5)安全性方面,传统密码多基于困难数学问题,而DNA密码的安全性还可以依赖于生物学困难问题。

3.2 DNA密码与量子密码学的区别

1)理论基础方面,量子密码学基于量子物理学,DNA密码基于现代分子生物学;

2)传送方面,量子密码学由量子为信息载体,经由量子信道传送,DNA密码以DNA为载体,经由物理过程传送;

3)安全性方面,量子密码学依据Heisenberg测不准原理成为不可破译的密码,DNA密码主要是以生物学技术的局限性为安全依据。

4 DNA密码实用性

既然DNA密码不能取代传统密码成为现在可以独立的大规模使用的密码学,那么作为完善和补益,DNA密码在现阶段可以有以下尝试:

1)DNA密码可以储存传统密码学中一次一密乱码本;

2)在公钥密码中可以用来构造陷门单向函数;

3)目前已经在隐写术中取得成功的前例;

4)由DNA的生物特性可以制成生物认证码;

5)利用DNA的超高容量的储存密度以及其生物特性,可以尝试解决我国庞大的居民身份管理系统,并运用于身份识别。

5 DNA密码的发展与展望

由上文可见,DNA密码现阶段不适合取代传统密码学独立使用,如何与传统密码系统、量子密码系统结合使用,从而建立成为一种混合的新型密码系统,使得此密码系统具有:

1)传统密码学或量子密码学已经颇为成熟和完善的理论基础;

2)保留DNA密码的优势:超大规模计算并行性,超高容量的存储密度,超低的能量消耗;

3)具有DNA密码或量子密码在安全性上的优势,对计算免疫;

4)具体操作时能保持传统密码易于操作,反复使用的优势。

虽然这种新型密码体系过于理想化,无论是在理论的建立、体系的设计、具体实践中都必将困难重重,甚至由于过于复杂而不适用于现代的信息加密传输,但在对其的研究过程中未必不会触类旁通的产生新的密码体系,或对现有的密码体系做出补益和完善。

摘要:DNA密码是近年来伴随着DNA计算而出现的密码学新领域。本文简要介绍了DNA密码学、传统密码学、量子密码学。从三者的基本概念、理论基础、具体操作过程、安全依据和现阶段的发展成果以及不足着手,通过对比得出DNA密码学相较与传统密码学和量子密码学的优势和不足并分析存在问题的原因。然后给出DNA密码学在实际运用中已经取得的成果和未来可能发展的方向。最后做出展望提出结合三种密码学的优势建立新的混合型密码学体系的构想。

密码子优化 篇4

1材料与方法

1.1材料

丹参、黄芪、黄芩、忍冬、桑树、野甘草、长春花的c4h基因均来自Genbank,各基因的相关信息见表1。本研究中用到的软件有密码子分析软件CodonW、数据分析软件SPSS18.0。

1.2方法

从Genbank各物种c4h基因的序列中去除5’UTR和3’UTR,选择CDS区,输出CDS区序列信息,格式为fasta,导入到CodonW软件包中,对7条c4h基因CDS序列进行 分析,获得相对同义 密码子使 用频率 (RSCU)、有效密码 子数(ENc)、密码子第3位G+C含量(GC3s)以及CDS区GC含量,比对7种药用植物的试验数据,分析试验结果。利用SPSS18.0软件对丹参等药用植物的c4h基因进行聚类分析,以各物种c4h基因密码子的RSCU值为变量,选择分类中的系统聚类,聚类方法为组间联接,输出分析结果。

2结果与分析

2.1c4h基因 GC含量、ENc、GC3s的分析

分析结果表明,7种药用植物的c4h基因GC含量在50%左右,ENc均大于40,接近60,说明密码子偏好性 比较弱[2],丹参密码 子第三位 是GC的比例最高,最低为黄芪,说明丹参c4h基因密码子中的GC主要集中在密码子的第三位,倾向于使用GC结尾的密码子,黄芪c4h基因的密码子第3位主要是AT,倾向AT结尾的密 码子(见表2)。

2.2密码子使用偏好性分析

分析基因的CDS区,发现丹参、忍冬和野甘草的终止密码子是UGA,黄芪和黄芩的终止密码子是UAA,桑树和长 青花的终 止密码子 是UAG。丹参有27个密码子的RSCU值大于1,长春花有25个,野甘草有26个,黄芩有28个,桑树有26个,黄芪有30个,忍冬有27个。在c4h基因同一氨基酸的同义密码子中,也存在偏好一种或数种密 码子的情 况,亮氨酸 (Leu)偏好UUG、CUU、CUC三种密码子,异亮氨酸(Ile)偏好AUU、AUC两种密码 子,组氨酸 (His)偏好CAC,精氨酸(Arg)偏好AGG(见表3)。

“/”前的数字表示各物种c4h基因有效密码子的数量,“/”后的数字表示 RSCU 值,加粗数字表示 RSCU 值大于1。Thenumberbefore“/”meanstheoffectivecodonnumberofc4hgene,thenumberafter“/”meansRSCU,thecoarsenumbermeansRSCUgreaterthan1.

2.3药用植物c4h基因密码子偏好性聚类分析

从SPSS软件分析结果可知,7种药用植物分为两大类,长春花与黄芪为一大类,另一大类中,丹参与黄芩为 一类,野甘草、桑树 和忍冬为 一类(见图1),在植物分类学中,忍冬、丹参、黄芩和长春花均属于合瓣花亚纲,丹参与黄芩又都属于管状花目唇形科。聚类分析与传统分类结果有一定的差距,可能是由于本研究的实验材料或基因样本数量不够大。

3结论与讨论

生物体的20种氨基酸 是由61种密码子 编码,除了甲硫氨酸和色氨酸之外的氨基酸都有2~6种同义密码子,在不同的物种和基因组甚至同一基因组的不同基因间,同义密码子的使用频率并不相同,主要表现为密码子使用的偏好性,ENc被广泛地用来表示密码子的偏好性[3]。密码子的第1、2位大多由自然选择决定,而第3位则受突变压力的影响,病毒等原核生物密码子的第3位偏好A和T,双子叶植物和哺乳动物偏好G和C[4],基因的GC和GC3值越高,突变偏性和翻译选择在密码子偏好性选择上起的作用越大[5],研究表明突变和密码子偏好性决定人致癌基因的表达水平,高表达的致癌基因含有高GC含量和高度密码子偏好性。此外,密码子偏好性也受如基因表达水平、RNA结构、基因长度、进化压力、蛋白质亲水性和蛋白质二级结构等因素的影响[6]。

RSCU值大于1表示对应的密码子使用频率较高,小于1则表示较低。本研究中RSCU值最高的是黄芩亮氨 酸CUC,最低的是 丹参缬氨 酸GUA和亮氨酸UUA。在进行转基因研究时,应结合目的基因密码子偏好程度,选择与表达载体偏好密码子匹配程度最好的密码子。在7种药用植物中,丹参c4h基因的密码子偏好性最强,忍冬最弱。同义密码子使用的选择可以为基因预测、分类、进化和设计高表达的基因及载体提供有价值的参考,本研究首次对丹参等药用植物c4h基因的密码子偏好性进行了分析,获得了c4h基因的ENc、RSCU等试验数值,尝试利用RSCU值构建丹参等的聚类分析图,并结合传统分类学进行有意义的探讨,为试验材料c4h基因在基因工程技术应用研究奠定了基础。

摘要:为了深入研究药用植物基因特性,利用CodonW和SPSS18.0软件对丹参、黄芪、黄芩、忍冬、桑树、野甘草、长春花共7种药用植物c4h基因密码子进行偏好性和聚类分析。结果表明:7种药用植物c4h基因的有效密码子数介于46.1~55.92,密码子使用偏好性弱,5种药用植物倾向于GC结尾的密码子,2种倾向于AT结尾的密码子。7种药用植物经聚类分析分为两大类,长春花与黄芪为一大类,另一大类中,丹参与黄芩为一类,野甘草、桑树和忍冬为一类。

关键词:c4h基因,密码子偏好性,聚类分析

参考文献

[1]王树斌,全雪丽,具红光,等.膜荚黄芪肉桂酸-4-羟化酶(c4h)基因克隆与序列分析[J].延边大学农学学报,2012,34(4):277-281.

[2]Hu C,Chen J,Ye L,et al.Codon usage bias in human cytomegalovirus and its biological implication[J].Gene,2014,545(1):5-14.

[3]Mazumder T H,Chakraborty S,Paul P.A cross talk between codon usage bias in human oncogenes[J].Bioinformation,2014,10(5):256-262.

[4]Chen H,Sun S,Norenburg J L,et al.Mutation and selection cause codon usage and bias in mitochondrial genomes of ribbon worms(Nemertea)[J].PLOS ONE,2014,9(1):e85631.

[5]Mirsafian H,Mat Ripen A,Singh A,et al.A comparative analysis of synonymous codon usage bias pattern in human albumin superfamily[J].The Scientific World Journal,2013,2014:639682.

密码子优化 篇5

终于, 在中国鞋业外部市场的萎靡、出口红利减少的2013年, 中国鞋业的经典专著《鞋密码———鞋业营销实战宝典》诞生了, 它如春风般吹拂“以内为主”的中国皮革行业, 为拓宽鞋业内销渠道、全面提升营销业绩破解了深藏玄机的“鞋密码”。

在新经济时代, 营销书籍随处可见, 但是有关鞋业的并不多见, 其中有关鞋业营销的又是少之又少, 所以, 当《鞋密码》这本书摆到我面前的时候, 我很兴奋很好奇, 并情有独钟。这不仅仅是因为这本书的作者是我的老朋友、非常富有才华的许强先生所写, 也不仅仅因为这本书能够破解营销业绩全面提升之道, 而是因为这本书在鞋业遭遇低迷彷徨的时期, 给了中国鞋业信心和支点。因为这本书至少有以下特质:

利于营销实战

鞋业是特色产业, 关乎人类的生活。改革开放三十年来, 鞋业市场不断扩展。年销售额可达数千亿元, 中国鞋业的出口创汇, 也一直居于轻工行业之首。但是相对于这么大的行业, 相关书籍却寥寥无几, 况且多为理论书籍, 鲜见可操作的指导营销实践的书籍。

进入“新经济”时代, 鞋业营销通过“花拳绣腿”获利的时代已成过去, 一切以实用、有效、做得到为基础的营销方法才是主流。《鞋密码》最显著的作用, 就是指导营销实战, 是鞋业老板、店长及销售人员必备的实战宝典, 甚至是专注于鞋业营销的第一本“现学现用”的最具实的书籍。书中的上篇“开鞋店必须掌握的知识和技巧”, 科学地解决了开鞋店遇到的最常见最普遍的十八个问题;书中的下篇“应对销售现场情景的‘三十六法’”, 用兵法解决了98个经典场景, 这98个现场情景极具代表性, 是鞋店在营销中常常会遇到的难以解决的问题。本书对于每个营销的现场情景都有相应的应对方法, 并剖析了常见的错误应对方法。方法简明易懂, 极利于鞋业营销实战。

具有经典品质

我喜欢《鞋密码》的那份智慧, 那些战略。在看了太多的功利性的营销宝典、枯燥无味的鞋革理论书籍之后, 我对《鞋密码》的谋略智慧格外喜欢。这本书没有拾人牙慧, 把一些大多人都知道的所谓营销技巧充实书中, 也没有深奥难解的理论知识, 更没有无谓的调侃和缺少智慧的所谓诙谐。每个章节都是充满理性和对实用技巧的解读, 每个解读都是对鞋业营销片段进行的富有智慧的梳理。

我喜欢《鞋密码》的那份深刻, 这本书所讲的方法即使是那样的简明易懂, 但每种方法都是古人处事智慧和现代营销策略的结晶, 充满着哲学思想。从“未雨绸缪”到“先谋后战”、“悬权而动”、“践墨逐本”再到“草船借箭”、“树上开花”、“步步为营”、“围魏救赵”, 每一个方法都有一个经典的历史故事, 所以读完这本书, 不仅仅能使读者提高营销技巧, 也能学到中国历史上经典的战略思想。

助你提升销量

“卖出去才是硬道理”。没有销量就没有品牌, 更没有营销天才。这本书的迷人之处还在于它破解了鞋业营销提升销量的“密码”, 为鞋业销售人员提升销量找到了科学、正确的方法。

近年来, 中国鞋企的品牌意识逐渐增强, 想赶超跨国公司, 一些中国鞋品牌虽然崛起, 但是与国际品牌还有一定的距离。那么, 我们如何才能找到一个让中国鞋业品牌光彩熠熠的闪光点呢?实践证明, 我们必须要从提升销量入手, 以销量托起中国鞋业品牌。没有销量的持续、高速增长就没有一切;没有一流的营销天才, 没有一流的营销方法, 提升销量只能是一种幻想。恰恰, 《鞋密码》致力于将鞋业市场一线打拼的销售人员打造成营销天才, 让他们用科学的方法创造非凡的业绩。

可以说《鞋密码》的魅力在于, 读者每天只需花上五分钟, 学会一个招数, 或许每天就能多卖几双鞋子, 一个月内成为销售高手, 业绩飙升。

【密码子优化】推荐阅读:

混沌密码06-05

密码设置07-09

公钥密码07-23

密码分析07-29

密码输入07-29

基因密码08-13

密码算法08-14

课堂密码08-15

传统密码08-24

电子密码08-28

上一篇:科技信用评价下一篇:市政管网工程