基因调控网络模型(精选6篇)
基因调控网络模型 篇1
1990年SRY基因的发现是生命科学史上的一大突破,使性别决定机制的研究步入正轨,在WT1、SF1、SP1等基因产物的作用下,中胚层发育成为具有双向潜能的生殖嵴。雄性胚胎在SRY的作用下启动SOX9、DMRT1、DMRT2等下游基因,促使原始生殖腺分化为睾丸;而雌性胚胎则在双倍DAX1作用下形成卵巢。
1 SRY上游调控因子
1.1 WT1
WT1基因于1989年被克隆,位于染色体11p13。该区带的缺失会引起WAGR综合症(Wilms瘤,无虹膜,尿生殖系畸形,智力发育迟缓);其基因点突变会引起更为严重的DenysDrsh综合症(Wilms瘤,肾小球肾病,性腺发育异常),提示该基因在性腺、肾脏发育及肿瘤抑制中起作用。WT1基因的表达出现在发育第9 d胚胎的中胚层,随后出现在性腺嵴的支持细胞。WT1基因敲除小鼠的性腺在胚胎发育11d之前似乎是正常的,11d后上皮显著变薄,12 d开始凋亡,表明WT1对性腺分化是必需的。WT1基因有10个外显子,通过不同的剪接及翻译方式可得到16种同工蛋白。在涉及胚胎发育的基因调节中起重要作用,WT1的作用方式是作为转录活化剂。WT1基因能活化SF1的表达,间接调节性腺的形成;还能活化内源性的DAX1启动子,WT1-DAX1途径是哺乳动物性别决定过程中的早期事件。
1.2 SF1
SF1是核激素受体超家族成员之一,在肾上腺皮质、性腺等合成甾体激素的组织中均有表达,在肾上腺、性腺的分化中也起着重要的调节作用。其基因Ftz-F1位于9q33。SF1在胚胎期的表达有显著的性别差异,在胚胎12 d之前其表达水平在两性间并无差异,当雄性小鼠的曲细精管开始分化时,即胚胎12.5~15 d,SF1在赛托利细胞中的表达达到高峰,而雌鼠卵巢中的SF1则持续处于低水平,直到出生后才增加。这种时间和性别上的表达差异与MIS基因表达嵴苗勒管的退化一致。Ftz-F1基因敲除雌雄小鼠都缺乏性腺、肾上腺,却有输卵管、子宫、阴道等苗勒管衍化器官,这表明SF1在胚胎早期维持生殖导管的发育,随后调节睾丸MIS的产生。SF1蛋白属于核受体家族,具有该家族的保守功能区,如DNA结合区的两个锌指结构,识别DNA的AGGTCA单元:羧基端配体结合区的AF-2反式激活区和脯氨酸区等。
MIS是SF1的下游靶基因,其启动子-84到-103区域的M2/MISRE1位点含有CCAAGGTCA序列,为SF1结合区。该结合区的突变会导致赛托利细胞系报告基因的表达降低。WT1、SOX9、GATA4等还通过直接的蛋白间相互作用增强SF1对MIS的转录活性。小鼠DAX1表达的启动子上也发现有SF1的反应元件,并发现Ftz-F1基因失活的小鼠其DAX1表达显著降低,表明SF1控制DAX1基因的转录。
除性腺外,在下丘脑内侧核及垂体促性腺细胞中也发现有SF1的表达,其靶基因为糖蛋白激素α亚单位。MFtz-F1基因敲除小鼠的垂体促性腺细胞的功能严重受损,下丘脑腹内侧核出现显著的形态异常,表明SF1在生殖系统发育的多个层次上发挥作用。
1.3 DAX1
DAX1是核激素受体超家族中的一员,DAX1基因数目的变化是人类性反转的一个原因,这种性反转被称为计量敏感型性别反转。其中XY个体之所以发育为雌性是由于X染色体短臂的Xp21出现加倍所造成的。关于DAX1和SRY如何竞争性地控制靶基因活性,已有一些实验证据支持如下的性别决定模型:DAX1可以和核激素受体超家族中的SF1形成杂二聚体。SF1对于早期生殖腺的发育是必需的,睾丸执行各种功能所必需的各种基因的表达也要有SF1的存在,如穆勒氏抑制基因的表达,甾醇类激素基因的表达等。DAX1通过与SF1结合,改变了SF1的性质,使它不能再激活靶基因。除了谢尔托立氏细胞外,DAX1和SF1总是同时表达,而且前者有调节后者活性的功能。所以,在卵巢发育中,DAX1和SF1的二聚体抑制了第二性睾丸决定基因,如SOX9等的表达。在XY个体的生殖腺中,SRY也许通过改变DNA构象而阻止SF1和DAX1杂二聚体的形成,或者阻止杂二聚体与靶基因的装配,同时又保证SF1仍具有激活与转录激活靶基因的活性。可是当DAX1高水平或者对SRY提前表达时,DAX1将优先与SF1结合,或优先与SRY结合,阻碍SF1靶基因的正常表达。因此,SOX9等基因将永远不能达到阀值水平,保证谢尔托立氏细胞的分化,个体发育为雌性,出现性反转现象。
2 SRY下游基因
2.1 SOX9
SRY作为转录因子可调节下游基因,从而启动原始性腺发育成睾丸,SRY表达后即可见到SOX9、FGF9、DHH。SRY在小鼠体内表达后可见到SOX9的表达大量增加,并由细胞质向细胞核内迁移。进一步的研究发现,SOX9转基因XX雌性鼠可产生睾丸并具有正常的Sertoli细胞及Leydig细胞,这提示SOX9可代替SRY基因的功能,或者SRY的作用仅是提高SOX9的表达量。通过SRY-MYC6遗传工程鼠检测SRY和SOX9的表达时序,MYC6作为一个标记。红绿荧光单克隆抗体揭示了两种蛋白不同的表达时序:在早期,SRY首先在生殖嵴中启动表达,此后不久SOX9开始表达;当SOX9继续表达时,SRY的表达关闭。这一研究结果揭示SOX9可能是SRY下游重要的性别决定基因。
2.2 DMRT1
近年来报道了20余例由于9号染色体短臂远端缺失引起的两性畸形,提示在这一区域存在性别决定基因。随后在人类染色体9p24.3发现了DMRT1和DMRT2,以及编码保守的转录调节区DM,以剂量依赖方式决定睾丸分化,而且在男性的表达高于女性。小鼠胚胎11.5 d,DMRT1在两性胚胎均有表达,至14.5 d在雄性睾丸中的表达明显高于雌性卵巢。结合人类DMRT1突变引起的性反转,表明DMRT1是睾丸分化所必需的,可能位于SRY的下游。
3 因子之间的相互作用及关系
上游基因的突变将影响SRY基因的表达水平,从而导致性腺发育不全、畸形或无性腺。SRY在胚胎发育过程中的表达受SF1及SP1的调控,SF1属于核受体家族,C-末端含有与DNA分子结合的锌指结构域;SP1是一种转录因子,可与DNA分子上的GC丰富区结合,对多种基因发生调控作用。在性别发育早期,SF1与SP1可与SRY基因上的启动子相互作用,从而启动SRY基因的表达,SF1基因敲除小鼠可出现性腺发育障碍。
哪些基因参与对SRY进行调控,目前所了解的甚少。美国学者最近的工作表明,SRY基因的正常表达受到胰岛素受体基因家族的调控。
Tevosian等还发现,小鼠SRY的表达需要GATA4和辅助因子FOG2的协同作用。SRY作为雄性发育的总开关基因,其表达将启动下游一系列诱导精巢分化的遗传变化和细胞活动。采用RT-PCR技术比较两种不同性别小鼠在胚胎性别发育过程中的表达谱,发现SRY基因的表达在11.5 dpc中达到高峰,与XX雌性小鼠相比,XY雄性小鼠多种基因在发育12-14 dpc中的表达量明显升高;利用基因芯片技术测定小鼠胚胎发育过程中性别相关基因的表达规律,也得到了类似的结果。
综上所述,哺乳动物的性别决定是一个层次调控过程,SRY基因并非决定性别的唯一基因,但它是睾丸决定因子,在性别决定中起关键作用。它一方面对其他基因表达进行调控,另一方面又受控于其他位于X染色体或常染色体上的基因,通过基因间相互协调作用,实现其在性别分化中的控制作用。目前,SRY的上游控制基因、下游靶基因及其具体的作用机制等诸多方面都需要进一步研究,相信随着对这一基因的深入认识,必将促进家畜性别决定机制的研究进展。
参考文献
[1]Wiener J S,Marcelli M,Lamb D J.Molecular determinants of sexual differentiation[J].Orld J Urol,1996,14(5):278-294.
[2]Morohashi K I,Omura T.Ad4BP/SF-1,a transcription factor essential for the transcription of steroidogenic cytochrome P450genes and for the establishment of the reproductive function[J].FASEB J,1996,(14):1569-1577.
[3]Parker K L.The roles of steroidogenic factor1in endocrine development and function[J].Mol CellEndocrinol,1998,145(1-2):15-20.
[4]Kawabe K,Shikayama T,Tsuboi H,et al.Dax-1as one of the target genes of Ad4BP/SF-1[J].Mol Endocrinol,1999,(8):1267-1284.
[5]Viger R S,Mertineit C,Trasler J M,et al.Transcription factor GATA-4is expressed in a sexually dimorphic pattern during mouse gonadal development and is a potent activator of the Mullerian inhibiting substance promoter[J].Development,1998,(14):2665-2675.
[6]Brennan J,Capel B.One tissue,two fates:molecular genetic events that underlie testis versus ovary development[J].Nat.Rev.Genet,2004,5(7):509-521.
[7]Swain A,Lovell-Badge R.Mammalian sex determination:a molecular drama[J].Genes Dev.,1999,13(7):755-767.
[8]Morais D S S,Hacker A,Harley V,et al.Sox9expression during gonadal development implies a conserved role for the gene in testis differentiation in mammals and birds[J].Natl Genet,1996.
[9]Vidal V P,Chabissier M C,Rooij D G,et al.Sox9induces testis development in XX transgenic mice[J].Natl Genet,2001,28(3):216-217.
[10]Smith C A,McClive P J,Western P S,et al.Conservation of a sex-determining gene[J].Nature.,1999.
基因调控网络模型 篇2
1 材料与方法
1.1药品与试剂
白藜芦醇,由天津市尖峰天然产物研究开发有限公司生产,纯度> 98% ,抗体( SOD一抗,二抗IGG) 由美国B&R公司提供,引物和生物试剂盒( SOD、HO-1) 由南京生物工程有限公司提供,其他化学试剂均为分析纯。
1.2实验动物及造模
SD大鼠24 只,雄性,体重( 220 ± 10) g,由上海斯莱克实验动物有限责任公司提供[许可证号: SCXK( 沪) 2007-0005]。参照文献[2]采用腹主动脉缩窄法制备心脏压力负荷超载心力衰竭模型。2% 戊巴比妥钠按30 mg /kg进行腹腔麻醉,剪毛,开腹并分离暴露腹主动脉,在双侧肾动脉间分离该处腹主动脉,将直径0. 6 mm的针灸针与腹主动脉平行,1 号线结扎固定,拔出针灸针,造成腹主动脉缩窄,依次缝合肌层和皮肤,术后每日腹腔注射0. 1 m L庆大霉素预防感染。
1.3实验分组
假手术组除开腹暴露、分离双侧肾动脉间腹主动脉但不行缩窄处理外,其余步骤与模型组一致。24 只大鼠随机分为模型组、假手术组和RES低剂量组、RES高剂量组,各组6 只,所有动物常规喂养。实验在南京中医药大学实验动物中心进行[许可证号:SYXK( 苏) 2005-0009]。
1.4给药方法
假手术组: 手术分离腹主动脉,不进行缩窄处理,手术4 周后双蒸水灌胃,1 次/日,连续4周。模型组: 造模4 周后,双蒸水灌胃,1 次/日,连续4周。RES低剂量组( 低剂量组) : 造模4 周后,RES10mg / kg,1 次/ 日,用双蒸水稀释后灌胃,连续4 周。RES高剂量组( 高剂量组) : 造模4 周后,RES40 mg /kg,1次/日,用双蒸水稀释后灌胃,连续4 周。
1.5心脏重量指数(HWI)测定
沿主动脉根部游离心脏,剔除大血管残端、筋膜及脂肪组织。测定心脏重量,计算HWI( HWI = 心脏重量/动物体重) 。
1.6 Real-Time PCR定量分析
氧化相关基因超氧化物歧化酶(SOD)、谷胱甘肽过氧化物酶(GPx)、血红素氧合酶(HO-1)表达水平。用Trizol试剂抽提细胞总RNA,取2μg RNA逆转录制备c DNA。Real-Time PCR反应体系包括1μL的c DNA模板(1%的RT产物)、7.5μL SYBR Green Mix(Takara)及10μmol/L终浓度的上、下游引物(SOD的上游引物:5'-CAAGCGGT-GAACCAGTTGTG-3',下游引物:5'-TGAGGTCCTG-CACTGGTAC-3';GPx的上游引物:5'CCTCAAG-TACGTCCGACCAG 3',下游引物:5'TTCCATGCGATGT-CATTGCG3';HO-1的上游引物:5'-GAATTCAGCAT-GCCCCAGGATTTG-3',下游引物:5'-TCTAGACTAGCT-GGATGTTGAGCAGGA-3'),加入H2O补足15μL,扩增条件为95℃5 s总变性以及95℃5 s、60℃31 s循环40次。目的基因的mRNA水平用β-actin(上游引物:5'-ATCATGTTTGAGACCTTCAAC-3'、下游引物:5'-TTCATCTTCATGGTGCTAGGA-3')内参校正,并将假手术组细胞的表达水平设定为1。所有样品每个基因的PCR反应均为3孔,实验重复至少3次。
1.7免疫组织化学法检测SOD
心肌组织常规切片,脱蜡、脱水后,用3% 过氧化氢阻断内源性的过氧化物酶; PBS冲洗,小牛白蛋白封闭; 加入一抗4℃ 过夜;PBS冲洗,加入二抗室温40 min,PBS冲洗,加入DAB显色,苏木素淡染,镜下观察。主要SOD为细胞质呈棕黄色颗粒。
1.8统计学处理
用SSPS16. 0 统计软件分析,计量资数用均数 ± 标准差(±s ) 表示,组间差异采用方差分析,计量资料用t检验。P < 0. 05 为差异有统计学意义。
2 结果
2.1心脏重量指数
模型组与假手术组相比,大鼠心脏重量指数明显增加,RES干预组心脏重量指数低于模型组,且高剂量组对心脏重量指数的改善优于低剂量组。详见图1。
2.2各组大鼠氧化应激指标比较
与假手术组比较,模型组、低剂量组、高剂量组HO-1 及GPx指标均明显降低(P < 0. 05 或P < 0. 01) ,模型组SOD水平明显低于假手术组,而低剂量RES组、高剂量RES组表达较假手术组无明显增减(P > 0. 05) ,高剂量组SOD表达甚至高于假手术高组水平; 与模型组比较,低剂量组、高剂量组各项指标均有所升高,其中SOD、HO-1表达增强(P < 0 . 05 ) ,GPx表达有增强趋势(P >0. 05) 。详图2。
2.3各组大鼠SOD比较
免疫组织化学检测( SP法,× 200 倍) 假手术组心肌细胞质中见一定量的棕黄色颗粒,模型组中棕黄色颗粒明显减少,低剂量组和高剂量组棕黄色染色明显增多,以高剂量组棕黄色颗粒最为明显。
3 讨论
心力衰竭指各种心脏结构和( 或) 功能性疾病导致心室的充盈及( 或) 射血能力受损的一种复杂的临床综合征,是大多数心血管疾病的最终归宿[2]。心脑血管疾病与癌症业已成为我国慢性病病人的两大最主要死亡原因[3]。一个多世纪以来,人们对心衰发病机制的认识经历了体液潴留、血流动力学异常、神经激素异常及心室重塑等不同阶段[4]。目前普遍认为心室重构是心衰发生发展的核心基础,而氧自由基可损伤心肌细胞膜,改变离子通道,促进胶原合成,加剧心肌细胞损伤和心肌纤维化,进而促进心室重构。因此,抑制心室重构、减轻氧化应激反应,理论上可延缓慢性心衰病的发展。
白藜芦醇化学名为3,4,5 三羟基-1,2 二苯乙烯,属于非黄酮类多酚化合物,因具有心血管保护作用而备受关注[5,6,7,8,9]。天然白藜芦醇广泛存在于葡萄、花生等植物中,是植物抗紫外线照射和真菌感染等不利因素产生的一种防御素。并可在虎杖、决明子等中药中提取获得。药理学研究证实虎杖具有扩张血管、改善微循环的扩血管作用; 虎杖水煎液对离体心脏的收缩具有明显的增强作用,可能与Ca2 +、α 受体、β 受体有关。虎杖不仅能提高心肌对缺氧的耐受能力,而且对缺氧心肌有保护作用,究其原因,可能与含有白藜芦醇相关[10]。近年的研究表明,白藜芦醇心血管保护作用是通过多靶点多途径来实现的,如抗细胞凋亡,抗血小板凝集、抗低密度脂蛋白氧化,减少心肌缺血及再灌注损伤等。
心脏压力负荷过重是引起心肌肥厚及最终导致心衰的主要原因之一。腹主动脉血管阻力上升直接导致左心室后负荷增加,进而刺激心肌细胞肥大并伴心肌纤维间质增生,室壁增厚,出现心肌肥厚。本实验通过结扎大鼠腹主动脉造成压力超负荷心肌肥厚模型,结果显示,模型大鼠心重指数高于假手术组,而白藜芦醇干预组可降低心重指数,且高剂量白藜芦醇组改善心重指数的程度优于低剂量组,说明白藜芦醇能有效降低心肌肥厚小鼠的心重指数,对心肌肥厚的发生发展有一定缓解作用。
氧化应激是指体内氧化防御体系受损和活性氧( ROS) 过量生成,从而导致潜在性损伤的病理过程[11]。本研究结果显示,心衰模型大鼠氧自由基清除酶SOD、HO-1、GPX均呈现活性下降,说明充血性心力衰竭时机体的抗氧化能力减弱,机体处于相当强的氧化应激状态。白藜芦醇干预后上述氧自由基清除酶活性提高,且和白藜芦醇剂量呈正比,表明白藜芦醇通过调控氧化应激相关基因,抑制心衰模型的氧化应激状态,改善心功能,可能是白藜芦醇对心血管保护作用的重要机制之一。
现阶段心力衰竭的治疗以抑制神经内分泌的激活为主流,疗效尚不能令人满意。本研究结果提示,抗氧化应激可能成为心衰治疗新的靶点,并为中药干预心衰的机制提供思路和依据。其作用的分子信号通路尚需进一步研究。
摘要:目的 探讨白藜芦醇调控大鼠心力衰竭模型氧化应激相关基因的作用。方法 采用腹主动脉缩窄法制备SD大鼠心力衰竭模型,测定心脏重量指数变化,Real-Time PCR定量分析超氧化物歧化酶(SOD)、血红素氧合酶(HO-1)、谷胱甘肽过氧化物酶(GPx)表达;免疫组织化学法检测SOD。结果 白藜芦醇干预组和模型组比较,心脏重量指数改善,高剂量组更为显著;心衰大鼠SOD、GPx、HO-1表达水平明显降低(P<0.05或P<0.01),白藜芦醇干预后,SOD、GPx、HO-1表达水平均有所升高,其中以SOD改善明显(P<0.0 5),高剂量组SOD表达甚至高过假手术组。结论 白藜芦醇能提高大鼠心力衰竭模型心肌各氧化相关基因的表达,改善心功能。
基因调控网络模型 篇3
基因调控网络是一个复杂的生物学系统, 它由很多相互作用的物质组成, 体现了动态的高度非线性的特征。随着当前高通量功能基因组实验技术, 主要是DNA微阵列 (DNA Microarray) 技术的发展[1,2], 我们已经可以观察基因和蛋白质的表达水平, 这中间产生了大量的时序基因表达数据, 这些数据使得重建复杂的基因调控网络成为可能。一个基因调控网络由一系列的DNA、RNA、蛋白质、其它分子以及这些成员间的调控机制构成。基因在转录过程中, 转录因子 (蛋白质) 与DNA的结合以激活基因的转录, 而基因的表达产物有可能是转录因子, 它又能激活或抑制其它基因的转录, 这样就形成了一个基因调控路径。
目前, 已有若干种模型用于研究基因调控网络。基因调控网络最简单的模型就是布尔网络模型[3], 在这种模型中, 基因被定量为两种状态, “开”和“关”。状态“开”表示一个基因转录表达, 形成基因, 而状态“关”则代表一个基因未转录。基因之间的相互作用关系可由逻辑规则即布尔表达式来表示。虽然布尔网络可以用来探究基因调控系统的动力学, 但它忽视了基因表达的中间水平, 在离散化的过程中难免会丢失信息。另外, 布尔网络假设在“开”状态下基因之间的转录是同步的, 但事实并非如此。加权矩阵模型用一个加权矩阵表示基因彼此之间的相互调控影响[3,4]。含有n个基因的转录调控网络的基因表达状态用n维空间中的向量u (t) 表示, u (t) 的每一个元素代表一个基因在时刻或状态t的表达水平。以一个加权矩阵W表示基因之间的调控关系, W的每一行代表一个基因的所有调控输入。在状态t基因j对基因i的调控效应为j的表达水平uj (t) 乘以j对i的调控影响程度Wij。基因i的总调控输入:
基因最终转录响应还需要经过一次非线性映射:
其中α和β是两个基因特异性常数, 定义了映射函数的位置和曲度。
在这儿, 我们使用稳态系统模型 (S-system) , 根据时序基因表达数据来推导基因调控网络的构成。为了能够快速的估计模型的参数, 我们使用粒子群优化算法 (PSO) 来进行参数估计。粒子群优化算法是基于群体智能理论的优化算法, 通过种群中粒子间的合作与竞争产生的群体智能指导优化搜索。
1稳态系统模型
稳态系统模型是一种具有幂指数律形式的非线性常微分方程系统, 它的结构使得它可以很好地捕获基因的动力学特征[6,7,8]。数学模型如下:
其中Yi是基因调控网络成员的基因表达水平, n是成员的个数, i, j (1≤i, j≤n) 是成员的下标。gij和hij表示第j个成员对第i个成员的影响系数, 右式的前一项表示所有使Yi增加的因素, 后一项表示所有使Yi减少的因素。从生物学的观点出发, 这两项各自表示激励和抑制两类调控方式。稳态系统中的主要参数有:{α, β, g, h}, 共2n (n+1) 个参数。在生物化学工程的背景下, 非负参数αi、βi被称为速度常数, 指数gij和hij被称为动力学特征。虽然我们还不是很清楚基因调控网络中支配交互作用的分子运动的机制, 但这个模型的结构足以捕获实验观察中的必要特征和相关的动力学特性。
这个模型也可以表示成离散的形式:
Yi (t+Δt) =Δt
2使用粒群优化算法优化稳态模型
当我们用等式 (3) 来计算模型中各成员的基因表达水平时, 我们发现模型中的参数不能先后被确定, 因为这些参数表明了模型中各成员间相互的作用, 所以应该同时被确定。另外, 参数个数的复杂度是O (n2) , 使用一般的误差修正方法 (比如梯度下降法) 来优化参数有较高的难度。D. Tominaga等学者使用遗传算法 (GA) 来得到模型参数[11]。
在这里, 我们使用粒子群优化算法 (PSO) 来优化模型得到参数[9,10]。PSO基于一个粒子的种群, 种群中的每一个粒子代表了多维问题空间中的一个候选解。每个粒子在问题空间中都存在于某个位置并具有一定的速度, 所以我们可以理解为这些粒子可以在问题空间里随意飞行。假设每一个粒子i在多维问题空间中的位置是xi, 相应的速度是vi, PSO基本的思想是每一个粒子都在问题空间中任意地叠代搜索自己的最优解 (最佳位置) , 在每一次叠代过程中, 粒子通过跟踪两个极值来更新自己。第一个就是粒子本身所找到的最优解。这个解叫作个体极值Pi。 另一个极值是整个种群目前找到的最优解。这个极值是全局极值Pg。这些最优解都由适应度函数来确定。这些概念可以在图1中得以表示:xi (t) 和vi (t) 分别定义为t时刻粒子在搜索空间中的位置向量和相应的速度向量;向量c1η1 (pi-xi (t) ) 和c2η2 (pg-xi (t) ) 可以分别描述为粒子的自身认知行为和种群行为, 粒子新的速度向量vi (t+1) 是由粒子的动力、自身认知行为、种群行为这三方面决定, 见公式 (5) 。粒子在t+1时刻的位置由xi (t) 和vi (t+1) 更新得到, 见公式 (6) 。
PSO速度和位置公式如下:
vi (t+1) =WI×vi (t) +c1×η1× (Pi-xi (t) ) +c2×η2× (Pg-xi (t) ) (5)
xi (t+1) =xi (t) +vi (t+1) (6)
其中WI是一个惯性权重, c1和c2是加速度常量, η1、η2是介于[0, 1]之间的随机数。
在我们运用PSO优化S-system模型的研究中, 给定种群规模M (种群中粒子的个数为M) , 即X= (x1, x2, …, xM) , 其中第i个粒子 (候选解) 可以用一个D维的向量表示。由于我们要得到S-system模型中的下列参数:{α, β, g , h}, 则这个向量为xi= (gi, 11, …, gi, NN, hi, 11, …hi, NN, αi, 1, …αi, N, βi, 1, …βiN) , 维数D=2N (N+1) 。每个粒子的速度向量为vi= (vi1, vi2, …, viD) 。结合S-system模型, 假设Yi, cal, t是基因Yi在t时刻根据已估计的参数 (由xi向量给出) 通过模型 (5) 计算得到的基因表达水平, 而Yi, exp, t表示通过实验观察得到的基因Yi在t时刻的基因表达水平, 则适应度函数定义如下:
其中N是基因的个数, T是实验中取样点的个数。问题集中在找出一组参数使得模型的输出数据和真实的实验数据之间的差距 (Fitness) 最小, 于是便归结为在粒子种群里使粒子达到最佳位置, 即最优解。使用粒群优化算法来优化稳态系统模型参数的过程如下:
· 随机初始化一群粒子, 使它们具有D维的位置和速度。在随机生成的过程中要把动力学特征系数 (gij和hij) 、速度常数 (αi和βi) 控制在一个特定的范围内[gmin, gmax]、[hmin, hmax]、[αmin, αmax]和[βmin, βmax], 速度也同样被随机初始化在[-Vmax, Vmax]范围内。
· 用每个粒子所代表的参数配置模型, 然后计算出各时间点每个基因的表达水平, 对每个粒子都确定适应度函数值。
· 将每个粒子当前的适应度函数值Fitness (xi) 和个体最优解的适应度函数值Fitness (pi) 进行比较。如果当前的适应度函数值更好, 则更新适应度函数值Fit (pi) 和位置pi为当前的值和位置。
· 将每个粒子的适应度函数值和全局最优解的适应度函数值Fitness (pg) 进行比较, 如果当前的适应度函数值更好, 则更新适应度函数值Fitness (pg) 和位置pg为当前的值和位置。
· 使用等式6和7来更新速度和位置。
· 返回到第二步继续执行, 直到符合一定的结束条件才停止执行。这些结束条件往往是给定的执行次数或者是结果达到了一定的精度。
PSO只有4个需要人为确定的参数。惯性权重WI用来权衡全局搜索和局部搜索。WI越大越侧重于全局搜索, 反之则侧重于局部搜索。WI可以被固定为一个常量, 或者也可以是一个随机数, 例如:
η是一个介于[0, 1]的随机数。c1, c2用来调节粒子追赶pi, pg的速度, 根据以往的经验, 这两个参数一般都被设置为1.5。在进化的过程中, 每个粒子的速度都被限制在Vmax内。如果Vmax太小, 则粒子容易停留在局部最优解上, 而如果Vmax太大, 粒子又会错过一些好的解。所以Vmax一般被设置为以上参数范围的10-20%左右。
3实验及结果
我们用一个人造基因调控网络来检验粒群优化算法进行优化稳态模型的效果。我们使用一个小规模的调控系统作为我们的目标基因网络[8,11], 它的参数见表1。Tominaga首先使用这个网络进行研究, 随后有很多科学家利用这个网络进行实验。因此, 这个典型的包含五个基因相互作用的系统成为评估稳态系统优化算法的基准网络。
这个理想状态下的网络有五个变量[12]:受控基因mRNA (X1) , 酶Enzyme (X2) , 诱导蛋白质Inducer protein (X3) , 调控基因mRNA (X4) 和调控蛋白质Regulator protein (X5) 。在染色质结构改变和基因活化、转录、mRNA加工和转运、翻译和蛋白质修饰、mRNA降解的过程中, 这些变量会由于基因间的互相作用而产生变化, 即基因表达水平的变化。图2简单地表示了这样的过程。一个基因对另外一个基因的作用可以是积极的 (图中表示为+) , 也可以是消极的 (图中表示为-) , 或者是没有任何作用, 一些合成蛋白质和mRNA的前体 (pools) 的基因表达水平在本网络中保持不变。
我们实验使用100个时间点的时序基因表达数据, 如图3所示。横坐标为时间点, 纵坐标为基因表达水平, 图3形象地表明这六个基因在100个时间点上的基因表达水平。
我们借助于matlab这个工具进行了一系列的实验。实验的条件如下:参数αi和βi的查找范围为[0, 15.0];gij和hij的范围是[-3.0, 3.0];PSO的一些参数如粒子群规模n为20, WI为0.726, c1, c2为1.5[13], 叠代次数为2500。我们将图3所示6个基因100个时间点的时序基因表达数据依次输入模型, 由粒群优化算法进行叠代运算, 从而获得模型的各项参数。我们使用该组时序基因表达数据运行算法50次, 得到50组模型参数, 求其平均值, 得到的参数如表2, 表2的参数值在一定程度上反映了基因与基因之间的相互作用。如前文所述, 这种作用可以是积极的 (参数表现为正值) , 也可以是消极的 (参数表现为负值) , 或者没有任何作用 (参数为0) 。使用我们实验所得到的参数值 (表2) 配置模型后进行仿真实验, 输出如图4所示。和图3进行对比我们发现, 在0到60个时间点内利用我们实验得到的参数配置的模型具有非常好的仿真效果, 在60到100个时间点内, 仿真效果有所下降, 但主要的特征也得到捕获。这说明我们的方法可以描述基因表达数据的主要特征, 我们获得的参数也是有意义的。叠代2500次后Fitness平均收敛到0.0024, 收敛速度可以参看图5。图5的横坐标是叠代次数, 纵坐标是适应度函数值 (公式7) , 反映了随着叠代次数的增加模型误差的减小速度。从该图可以看到我们的方法具有快速收敛的特性 (叠代100次已得到较小的误差) 。
为了表明基因间的相互作用, 我们根据算法的运算结果, 用以下的准则将这种作用分为三类[10,14]:
类+表示基因间积极的作用:μij>μ+σ和σij<|μij|;
类-表示基因间消极的作用:μij<μ-σ和σij<|μij|;
类0表示基因间没有作用:不符合上述条件的其它情况。
μij和σij2表示gij和hij每一个参数的期望和方差, μ和σ2表示这50个参数平均值的期望和方差。我们将理想网络参数 (表1) 使用上述的方法分为三类, 得到了对应参数的不同类别, 即表3。我们又将实验得到的网络参数 (表2) 使用上述方法分为三类, 得到了表4。
对比两表我们发现, 实验没有识别g32、h32两个作用, 误识别了g34、h13、h14和h53等四个作用, 其余的基因相互作用均被识别, 识别率达到了88%。分析实验结果, 我们发现该方法能够迅速得到模型参数, 而且能够较为准确地识别基因间的相互作用, 使研究更大的基因调控网络成为可能。
4结论与展望
理解基因调控机制是分子生物学的一个核心课题。研究的主要目的是为了揭示在特定的细胞状态下, 有哪些基因发生了表达, 它们是通过何种方式被调控的, 它们的表达量是多少等问题。我们使用稳态系统模型, 并引入粒子群优化算法对其进行参数优化, 简化了计算的复杂性, 得到了一些预期的效果。但是, 从实验可以看到, 我们对模型参数的优化效果还不是相当的理想, 因此我们下一步要研究的内容是能否结合系统模型改进粒子群优化算法, 在优化的过程中能够动态地确定一些无调控关系的基因对, 从而简化系统参数, 得到更好的优化精度。另外, 在我们的方法中, 由于要确定的模型参数为2N (N+1) 个, 如果基因调控网络中含有大量的基因, 那么确定调控关系将会变得相当复杂。因此, 网络模型是否合适将会对研究结果产生巨大的影响, 这方面也是我们下一步要研究的重要内容。
摘要:基因调控网络模型试图从海量的时序基因表达数据中研究基因的功能, 推断基因之间的调控关系, 从而揭示复杂的病理现象和生命现象。通过利用时序基因表达数据来推断一个基于稳态系统 (S-system) 模型的基因网络, 提出使用粒群优化算法 (PSO) 来优化模型参数, 从而捕捉基因表达数据中的动力学特性。实验结果表明, 该方法能够使模型参数快速得到收敛, 配置参数后模型仿真能力好, 可以较好地识别基因调控关系。
基因调控网络模型 篇4
1 资料与方法
1.1 DFSCs成骨分化中基因表达芯片数据的获取
从GEO Datasets数据库获取DFSCs成骨分化过程中基因表达芯片数据,其方法是:输入网址“http://www.ncbi.nlm.nih.gov/gds”,进入GEO Datasets数据库,在搜索栏输入“dental follicle”,搜索后获得DFSCs成骨分化的基因表达芯片数据集(GEO登记号:GSE18072),该数据集应用表达芯片检测DFSCs体外成骨分化前和成骨分化后差异表达的基因获得,其具体的实验条件在以往的文献中已有叙述[7,8]。本研究中,我们应用GEO Datasets自带分析软件GEO2R对原始数据进行分析,获得DFSCs成骨分化过程中差异表达的基因。
1.2 DFSCs成骨分化中基因表达芯片数据的分析
gene ontology(GO)和KEGG等数据库可对大量基因数据按照一定的共性进行富集和分类。DAVID数据库整合了GO、KEGG等数据库。本研究应用DA-VID数据库对DFSCs成骨分化过程中差异表达的289个基因进行生物信息学分析,其过程如下:输入网址“http://david.abcc.ncifcrf.gov/home.jsp”,进入DA-VID数据库,将DFSCs成骨分化过程中差异表达的289个基因复制到输入框,选择“official gene symbol”作为识别类型,选择“Homo sapiens”和“Mus musculus”作为注释种属,点击“Submit List”提交数据,最后点击“Start Analysis”按钮,应用DAVID的分析模块如Functional Annotation Clustering等对这些基因进行生物信息学分析。
1.3 被富集到“骨骼系统发育”子集基因的网络分析
DAVID数据库可将大量基因中具有共同属性的基因富集到不同的子集。然而,子集内基因的相互关系不能清楚的显示。Gene MANIA数据库可基于共表达(co-expression)、共定位(co-localization)、蛋白和基因的相互作用(protein and gene interactions)等对基因集进行分析和预测,显示这些基因的分子网络图。
DAVID数据库将DFSCs成骨分化中差异表达的12个基因按照Gene Ontology功能分类法富集到“skeletal system development(骨骼系统发育)”子集。应用Gene MANIA数据库分析这12个基因的相互关系,其方法如下:输入网址“http://www.genemania.org”,进入Gene MANIA数据库。选择种属“Homo sapiens”。接着将ALPL、CTSK、TUFT1、TGFBR2、FHL2、ROR2、STC1、POSTN、ZBTB16、FRZB、PRELP和IGFBP5等12个基因输入,点击“GO”进行分析并保存结果。
2 结果
2.1 DFSCs成骨分化中差异表达的基因
应用GEO2R对从GEO Datasets数据库获得的原始数据集(GSE18072)进行分析,获得大量DFSCs成骨分化过程中差异表达的基因,选择表达差异明显(P<0.05)的289个基因用于进一步分析:ADH1B,AP-OD,PIP,GPRC5B,CCND2,SERPING1,TMEM176A,ZBTB16,STC1,ENTPD1,METTL7A,IL7R,GPM6B,MFAP4,SPON1,CYP39A1,SH2D4A,RAB27B,ASPN,TGFBI,SLC39A8,ADH1A,MAOA,FKBP5,SPRY1,ID3,PRELP,MTHFD2,DIO2,ROR2,PTGS1,PLAT,CCDC69,CDC23,EFEMP1,SAA2,FGD4,SULF1,MMP1,VIT,CFH,OLFML1,SGCG,TIMP4,CORIN,ABCA6,PTGFR,SLC7A5,GLUL,SESN3,ADAM12,ISM1,PNMA2,ROBO2,ST8SIA1,LYPD6B,FMOD,SEPP1,RFTN2,FRZB,ARRDC2,FMO3,INMT,GLUL,CD14,BIRC3,ADH1C,FNDC1,SHC3,DLL1,SLC40A1,PRUNE2,COL14A1,TNFSF15,SAMHD1,AKAP12,FAM43A,PSG1,PROS1,NRG1,DIO3,SLC9A9,TM4SF20,CFHR1,IGFBP2,SHCBP1,NAP1L2,NR4A3,PRC1,PROS1,KIF14,ADAM19,PRUNE2,SH3PXD2B,KCNH1,TSC22D3,LIF,ITGB8,GPT2,FAM20A,SYTL2,TMTC1,TOP2A,CHAC1,SLC8A1,HMGN2,LR-RN3,CA5B,NRG1,HSPA2,CTSK,EDNRB,ABHD2,KIT,PBK,C1QTNF1,SAT1,ASPM,RARRES2,HMGN2,FMO4,CYP7B1,CEP55,IGFBP5,LAMP5,FAXDC2,CA12,DEPDC1,ALPL,SERAC1,PLA2R1,EZR,TXNIP,MUC15,TACC3,UGCG,TJP2,GPR39,BDNF,PCDH18,LRRN4CL,KIF23,SH3BGRL2,NUDT6,SULT1B1,NRP2,KIAA0101,PGM2L1,USP53,LAMA2,RNF157,GPX3,PHKA1,AJUBA,ID1,KRE-MEN1,IRAK3,ABCA8,MARS,BUB1,LRCH2,SI-PA1L2,IL12RB2,EPHA4,JUP,MTHFD1L,ARHGAP24,NEK10,ADRA1D,MKI67,PDGFD,ZNF594,DLGAP5,HIST1H1B,TMEM176B,POSTN,LOXL2,BDKRB1,NME2,NME1,MEGF9,LOC100506242,HIST1H2BM,HMCN1,ANTXR1,COLEC12,EFHD1,ZNF608,PTCHD4,FLVCR2,GFRA1,KRT7,SPON2,FBLN1,HJURP,ASNS,SLC38A5,FHL2,SEL1L3,ADAMTS6,CENPF,NPTX1,NUF2,SLC35E3,CASC5,THRB,RASL11A,KCND3,CHRNA1,SPC25,SLC17A7,MTH-FD2,CNTN3,TUFT1,TNFRSF12A,SNORD75,ARRB1,ACTG2,UBE2T,IQGAP3,SNED1,ETV1,TTK,NCAPH,CRABP2,CD302,SLC44A1,SERPINF1,MME,EBF1,CTPS1,LAMA3,MRVI1,FBXO32,EIF1AY,FAM105A,MAGED4,MAGED4B,APBB1IP,STON1-GTF2A1L,PRR5L,LRRK2,RDH10,SHMT2,STAC,LINC00341,ITGA10,RRM2,PCK2,DSE,SLC6A6,TPM1,CDK1,TGFBR2,IL1R1,KRTAP1-1,KRTAP1-3,TYMS,KI-AA1524,SLC25A27,OBFC1,KCNJ6,P4HA3,STXBP4,C7orf69,BCL6,DIAPH3,PTK2B,TBX18,OLAH,HIST1H3B,RNF152,LOC100131826,SLC31A2,PTTG3P,PTTG1,CTSB,ACKR4,PAMR1,C5AR2,TBC1D8,MFSD6,KIAA0355,BIRC5,DPT,LGMN,CMTM4,PDE1A,ELN,SGOL1。
2.2 DFSCs成骨分化中差异表达的基因被富集在不同的信号通路与生物学过程
应用DAVID数据库对此289个基因进行生物信息学分析,结果显示这些基因可以富集到不同的信号通路、生物学过程等子集。
基于KEGG信号通路,EDNRB、SLC8A1、PTK2B、PDE1A、PHKA1、BDKRB1、PTGFR和ADRA1D等8个基因被富集到与成骨分化密切相关的“Calcium signaling pathway(钙信号通路)”,这些基因在该信号通路所处的位置及与其它信号通路的关系见图1。
基于GO数据库的“Biological process(生物学过程)”分析,将此289个基因富集到多个子集,其中与间充质干细胞增殖、成骨分化密切相关的一些子集见表1。ALPL、CTSK、TUFT1、TGFBR2、FHL2、ROR2、STC1、POSTN,ZBTB16、FRZB、PRELP、IGFBP5等12个基因富集到了“骨骼系统发育”生物学过程子集。
2.3“骨骼系统发育”子集中基因的相互作用关系
应用Gene MANIA数据库对富集到“骨骼系统发育”子集的12个基因进行分析,结果显示这12个基因及一些相关基因通过共表达、共定位、物理相互作用、蛋白相互作用等发生关联,建立了这些基因的调控网络(图2)。
网络图显示成骨分化标记基因COL1A1与CTSK存在共同表达的时空关系,后者与牙齿的发育和矿化密切相关[9]。COL1A1同时与PRELP存在物理相互作用,后者对骨改建也有重要的作用[10]。网络图也显示成骨分化标记基因ALPL与FZD5及ROR2存在共同表达的时空关系,后两者是WNT信号通路的成员,在骨发育和改建中发挥着重要作用[11]。此外,与间充质干细胞成骨分化密切相关的基因TGFBR2、IGFBP5等也彼此存在广泛联系。这些结果提示“骨骼系统发育”这一子集的基因在DFSCs成骨分化过程中发挥了重要作用且相互关联。
图1“钙信号通路”网络图(★:在DFSCs的成骨分化中差异表达的基因)Fig 1 Network view of calcium signaling pathway(★:differentially expressed genes during the osteogenic differentiation process of DFSCs)
3 讨论
牙囊由颅神经嵴细胞迁移、增殖和分化形成,可形成牙骨质和牙周膜。以往研究表明,牙囊组织中包含一类具有多向分化潜能的牙囊干细胞,在一定条件下可分化形成脂肪细胞、软骨细胞、成肌细胞、神经细胞和成骨细胞[6],是一种具有潜在应用价值的成骨、成牙种子细胞。
以往研究表明,BMP2、BMP7、BMP9可促进DFSCs的成骨分化,而Wnt5a、p38 MAPK、ALP、DLX3、DLX5、MSX2、ZBTB16等参与了DFSCs成骨分化[3,4,5,6,12]。本研究通过对DFSCs成骨分化中差异表达的基因进行分析,发现ALPL等12个基因表达发生改变并且富集到“骨骼系统发育”基因子集,进一步支持这些基因对DFSCs成骨分化具有重要的调控作用[13]。Gene MA-NIA分析结果还显示,这些基因之间及与其他一些WNT信号通路分子如ROR2等存在共表达、共定位等联系。而富集在KEGG“钙信号通路”的一些在DFSCs成骨分化中表达发生改变的基因也与MAPK及TGF-beta等信号途径存在关联。提示WNT、MAPK、TGFbeta等信号通路在DFSCs成骨分化过程中可能存在对话,进而调控成骨分化标记基因如ALPL、COL1A1的表达。此外,生物信息学分析结果还显示,许多差异表达的基因对细胞增殖、分化具有重要的调控作用,这些基因也被富集到“细胞周期”和“细胞增殖”等不同子集,提示在DFSCs成骨分化过程中,细胞周期和增殖信号也发生了改变,以适应成骨分化这一生物学过程。
通过分子、细胞和动物等方法可确切的研究基因功能[14]。然而,基因靶标的研究往往范围较大,直接进行功能实验要耗费大量的时间和精力,而多个基因间内在关系的研究则更为复杂。生物信息学的发展帮助我们实现了靶标基因的预测及研究多个基因间的复杂关系。本研究从GEO Datasets数据库获取了DFSCs成骨分化中差异表达的基因数据,节约了研究成本。然后通过DAVID及Gene MANIA等数据库对这些基因分析后把功能属性相似的基因进行了富集,建立了部分基因的调控网络,为从整体上认识DFSCs成骨分化提供了思路。
基因调控网络模型 篇5
这两个基因群分别包含数以百计的基因, 它们很可能受主调控开关的控制。目前该研究尚处于早期阶段, 但研究人员将深入研究这一基因网络, 以期最终能够通过调控这些基因来提高人的认知功能。
据物理学家组织网报道, 研究人员研究了大量接受过手术治疗的癫痫患者的脑组织标本。他们对人脑中数千个基因表达进行了仔细分析, 然后将分析结果分别与智力正常人群的遗传信息和患有神经系统疾病的人群的遗传信息结合进行研究。通过各种计算分析后, 他们发现, 正常人群大脑中一些与智力相关的基因突变, 同样也可导致认知能力受损和癫痫。
该研究论文的首席作者、帝国理工学院医学系博士约翰逊·米迦勒说:“令人兴奋的是, 这些基因很可能有一个共同的控制机制, 这意味着我们可以操纵一整套与人类智力有关的基因的活动。研究表明, 或许可以通过调控这些基因来提升智力。尽管目前这只是一种理论上的可能, 但我们已经迈出了第一步。”
基因调控网络模型 篇6
大肠杆菌直接发酵法合成L-Phe, 主要依赖细胞以葡萄糖为起始物, 利用五碳糖途径的中间产物4-磷酸-赤藓糖 (erythrose-4-phosphate, E-4-P) 和糖酵解过程的中间产物磷酸烯醇式丙酮酸 (Phophoenol pyruvate, PEP) 为前体物, 二者缩合形成一个七碳酮糖磷酸化合物3-脱氧-α-阿拉伯庚酮糖酸-7-磷酸 (3-deoxy-α-arobinoheptu1osonate-7-phosphate, DAHP) , 经过一个共同的莽草酸途径, 到达分支酸阶段, 最后合成相应的芳香族氨基酸。可见, PEP和E-4-P是合成关键性的的前体物, 而且也是中间产物DAHP的限制性底物, 是整个芳香族氨基酸产物合成的关键之一[4,5]。
细胞合成PEP和E-4-P的过程主要涉及的是碳的中心代谢过程, 而细胞内的中心碳代谢途径是互相关联的, 许多代谢反应都可能影响它们的生成。大肠杆菌csrA基因 (carbon storage regulator A) 调控整个代谢网络, 协调多个酶的活性和代谢途径的代谢流如图1, 可以通过敲除csrA基因实现芳香族合成过程中碳中心途径的负调控的解除或阻遏, 同时加强正调控, 这既增强了理想代谢途径又抑制了竞争代谢途径成为可能[6~8]。
本文在本研究小组构建的工程质粒的基础上, 利用Red重组敲除系统对工程宿主进行csrA基因的缺失, 降低细胞碳中心代谢芳香族氨基酸途径的负调控, 降低细胞糖源摄取速率, 减少细胞乙酸的生成, 进一步提高L-Phe的发酵量水平。
1 材料和方法
1.1 材料
1.1.1 菌株及质粒
菌株:工程宿主菌:Escherichia coli K12, 本研究中心自行改造构建;载体克隆受体菌:Escherichia coli JM109, 购自TAKARA;
质粒:苯丙氨酸基因工程质粒:pMDphe, 为本研究中心自行构建;Red系列敲除质粒:pKD46、pKD13、pCP20, 本室保存;pMD18T克隆载体, 购自于TAKARA。
1.1.2 酶、试剂及引物
内切酶、末端修饰酶、T4DNA连接酶等均购自TAKARA;PCR产物回收试剂盒, 胶回收试剂盒等均购自上海生工。其它药品均为国产分析纯。
敲除组件引物:
敲除验证引物:
1.1.3 培养基
LB培养基:配方参阅分子克隆实验指南 (第三版) [9]。
工程菌种子为本公司保存, 发酵培养基为企业内部资料, 为本公司自行配制。
1.2 方法
1.2.1 csrA基因的敲除组件的构建
以pKD13质粒为模板, 敲除组件引物P13csrA-F/R进行PCR扩增。PCR反应结束后, 冰上放置15min, 然后加入DpnⅠ对PCR产物进行37℃处理1h, 再于冰上放置5min, 电泳回收目的片段。然后将回收片段进行T-A克隆并转化大肠杆菌JM109, 送交上海生工进行测序验证。
1.2.2 Red重组酶的诱导和高效率的电转化感受
态细胞的制备
终浓度为10mmol/L的L-阿拉伯糖诱导含有pKD46质粒的工程宿主表达重组酶, 并进行感受态细胞的制备, 电转感受态细胞的制备方法, 参阅分子克隆实验指南 (第三版) [9]。
由于菌株为改造菌株, 制备的感受态细胞, 最好现制现用。
1.2.3 csrA基因敲除组件的导入及重组质粒pKD46的诱导丢失
将回收的基因敲除组件电转化至上述的感受态细胞中。由于pKD46质粒含有温度敏感型的复制起点oriR101, 在30℃培养时可以正常复制, 而高于37℃时会自动丢失。所以电转后进行37℃复苏培养, 一方面有利于大肠杆菌的繁殖, 另一方面进行pKD46质粒的诱导丢失, 可相对提高后续实验的效率[10]。
1.2.4 抗性基因替换的筛选和验证
采用菌落PCR的方法, 利用验证引物对抗性平板克隆进行验证, 确认抗性片段是否替换目的基因, 同时确认目标基因已经缺失[10]。
1.2.5 宿主抗性基因的消除及消除质粒的丢失
由于宿主带有的抗性基因片段对与质粒的筛选存在干扰, 而且外源片段的存在对工程宿主也有一定影响, 所以有必要对染色体基因中敲入的抗性片段进行消除。
电转pCP20质粒至抗性替换宿主, 并诱导表达FLP重组酶, 定点消除FRT之间的抗性片段, 最后利用高温 (42℃) 热激及抗性负筛进行pCP20质粒的丢失。
1.2.6 摇瓶发酵培养
将工程质粒pMDphe分别电转csrA缺失及对照菌株, 进行摇瓶的二级发酵:37℃, 250r/min培养。发酵40h后测定菌体密度及苯丙氨酸的量。
2 结果与分析
2.1 csrA基因敲除组件的扩增
PCR扩增带有FRT位点及抗性基因的短的侧翼同源敲除组件, 电泳结果如见图2。片段长约为1 300bp, 同时测序结果显示:扩增的确为含有39bp同源序列的敲除组件。
2.2 抗性基因替换csrA基因的验证
为验证csrA基因的已被替换, 采用菌落PCR的方法进行验证, 根据基因组序列, 分别选Kan抗性片段内部引物以及csrA与抗性片段组成的交叉引物对。同时设立阴性对照组为未缺失csrA基因的宿主菌落。结果如图3, kan-f与kan-r引物验证, 阳性克隆确有约为850bp的条带 (2号泳道) , 阴性对照因为无替换所以无条带 (1号泳道) ;同时, 交叉引物 (kan-f与csrA-r引物) 阳性克隆克隆为约1 900bp的片段 (3号泳道) , 阴性对照约为1 100bp (0号泳道) , 证实敲除组件成功进行了Kan抗性基因片段对csrA基因的替换。
图3 csrA基因敲除的菌落PCR验证M:200bp DNA leader marker;0, 1:阴性对照;2, 3实验组
2.3 csrA基因缺失对苯丙氨酸发酵的影响
按方法1.2.6进行摇瓶发酵苯丙氨酸的实验, 分别测定发酵结束的菌体密度及产酸量, 实验重复
3 次, 每次取平行样均值。结果如下表1。
结果表明, csrA基因的缺失不仅对细胞的生长带来益处, 同时产酸也提高近13%。
3 讨 论
通过在染色体上定点破坏整体调控基因csrA编码的碳贮存调控因子A, 来加强中心代谢途径, 使中心代谢流更多的流向苯丙氨酸生物合成的前体PEP[7,11]。据研究表明:网络代谢调控基因csrA突变株可以比野生菌株在细胞内多聚集20倍的糖原浓度[6,11]。同时, csrA也调控直接参与PEP代谢的多个相关酶的活性水平, 因此csrA的敲除可以使细胞内苯丙氨酸的前体物之一的PEP的量增加, 提高细胞的糖原利用效率, 相应提高工程菌株的葡萄糖对苯丙氨酸的转化率。从本研究的结果来看, csrA基因的缺失菌株, 其发酵液的苯丙氨酸量比野生型有了明显提高, 达到了将中心代谢流引向PEP的合成以提高苯丙氨酸的产量的目的。
参考文献
[1]Grinter N J.Developing an L-phenylalanine process[J].ChemTech, 1998, 7:33-37.
[2]JoséLuis B V, NoemíF, Guillermo G, et al.Metabolictranscription analysis of engineered Escherichia colistrains that overproduce L-phenylalanine[J].MicrobialCell Factories, 2007, 6:30.
[3]Johannes B, Leon R, Marcel W.Metabolic engineeringfor microbial production of aromatic amino acids andderived compounds[J].Metabolic Engineering, 2001, 3:289-300.
[4]Keasling J D.Gene-expressing tools for the metabolicengineering of bacteria[J].Trends Biotechnol, 1999, 17 (11) :45-60.
[5]Patnaik R, Spitzer R G, Liao J C.Pathway engineeringfor production of aromatic in Escherichia coli:Confor-mation of stoichiometric analysis by independent modu-lation of aroG, TktA and Pps activities[J].BiotechBioeng, 1995, 46:361-370.
[6]Sabis N, Yang H, Romeo T.Pleiotropic regulation ofcentral carbohydrate metabolism in Escherichia coli viathe gene csrA[J]J Biol Chem, 1995, 270:29096-29104.
[7]Yang H, Liu M Y, Romeo T.Coordinate genetic regu-lation of glycogen catabolism and biosynthesis in Esch-erichia coli via the csrA gene product[J].J Bacteriol, 1996, 178:1012-1017.
[8]Matthew T, Tony R.Disruption of a global regulatorygene to enhance central carbon flux into phenylalaninebiosynthesis in Escherichia coli[J].Current Microbi-ology, 2001, 43:26-32.
[9]萨姆布鲁克J, 拉塞尔D W.分子克隆实验指南[M].第三版.北京:科学出版社, 2002.
[10]Datsenko K A, Wanner B L.One-step inactivation ofchromosomal genes in Escherichia coli K12using PCRproducts[J].Proc Natl Acad Sci USA, 2000, 97 (12) :6640-6645.