肿瘤表达谱(精选4篇)
肿瘤表达谱 篇1
摘要:提出了一种基于遗传算法 (GA) 优化支持向量机 (SVM) 分类决策树的用于肿瘤基因分类的新方法。该方法针对基因表达数据样本少维数高的特点, 采用了支持向量机分类间隔作为遗传算法适应度函数。利用遗传算法在每一决策树结点自动选择最优或近优的分类决策, 实现了对决策树的优化。试验结果表明, 在样本有限的情况下, 与传统的方法相比, 该方法比单个决策树算法具有更高的分类精度。
关键词:遗传算法,基因表达谱,决策树,支持向量机
0、引言
随着基因芯片技术的发展,采用数据挖掘技术对基因表达谱数据进行分析,挖掘和发现其中蕴含的信息和知识,是当前生物信息学研究的重点课题。肿瘤基因表达谱数据具有样本少,维数过高的特点,每个样本都记录了组织细胞中所有可测基因的表达水平,但实际上只有少数基因真正同样本类别相关,包含了样本分类信息,这类基因称为特征基因。目前人们对该问题已进行了一定程度上的探索,然而,如何在成千上万个基因表达谱中有效选出样本的分类特征基因,一直是肿瘤基因表达谱分析中的难点所在,仍有待深入研究。
决策树是数据挖掘中一种常用的分类方法,虽有些学者对决策树算法应用到基因表达谱分类进行了初步研究,但其仅将决策树之间的节点进行交叉,整个搜索空间是固定在有限的范围内,而这个范围又是由初始样本集确定的。另外有些实验中虽然产生变异节点,但是搜索的空间太大,不易产生局部最优解。因此,考虑到有限的样本会导致决策树算法无法很好的区分整个数据集,本文尝试引入遗传算法(GA),结合决策树(SVM)和遗传算法(GA)的优势,利用遗传算法的全局搜索能力优化决策树,获取最优的参数组合,并利用决策树算法在处理连续属性时的优势来改进遗传算法中变异算子,减少搜索时间,提高分类精度。
1、问题描述
基于肿瘤基因表达谱数据的分类问题,就是根据已知的肿瘤基因样本数据,划分为训练集和测试集。利用遗传算法优化支持向量机决策树算法构建分类器,对测试集数据进行分类分析,确定肿瘤的类型。基本步骤如下图1所示。
2、遗传算法优化决策树的原理
遗传算法 (Genetic Algorithm,简称GA) 是近几年发展起来的一种崭新的全局优化算法,它借用了生物遗传学的观点,通过自然选择、遗传、变异等作用机制,实现各个个体的适应性的提高。由于仅采用单个决策树算法对基因表达数据进行分类时,不能有效的对全部数据进行分类,分类精度较低。而遗传算法由于具有强大的全局优化搜索功能,能使个体之间的信息进行交换,对决策树进行调整和重新组合,进而出现更优的决策树。
2.1 遗传算法的设计
1)初始种群的产生:由于种群数目过大增加遗传算法的运算时间,同时会使种群形态过于分散,使算法收敛困难,所以我们选择种群规模的大小为训练样本的30%。
2)编码:本文采用二进制编码的策略来实现原始训练样本集类别的编码。把所有的染色体表示成一个长度为K (K由初始种群数目决定)的二进制字符串,每一个二进制位是0或者1。1表示基因在特征基因子集中,而0表示不在其中。
3)适应度函数的确定:染色体的适应度函数由基因子集的分类精度和基因子集大小决定。采用精英机制,将适应度最高的15%挑选出来,作为新一代种群。
4)遗传算子:遗传算法是根据优胜劣汰的原则选择种群中的优秀个体。为了使染色体完整地包含当前决策节点训练样本所属的类别种类,又避免染色体基因出现重复,本算法只采用了选择操作算子和变异操作算子。
1) 选择算子。如果还没有满足遗传算法终止的条件,根据"适者生存"的原理,从上一代种群的遗传结果中繁殖适应度较大的染色体个体进入下一代种群的继续进行遗传操作。显然适应度高的个体,繁殖的下一代染色体数目较多;而适应度较小的染色体个体,繁殖的数目较小,甚至被淘汰。
2) 变异算子。变异算子即在染色体中引入新基因以促进种群的进化。根据选择概率和适应度高的原则从父代子群中选择染色体。一旦选中某个染色体进行遗传操作,, 则随机选择其中1个或者多个基因进行变异。单个基因变异概率较高,而多个基因变异一般赋予较低的概率。此外,为了防止同一条染色体中出现重复基因,染色体中某一比特位上的基因发生变异时,变异后的基因编码对应的比特位的基因应相应地变换为变异比特位的原基因编码。
2.2 遗传算法优化决策树生成算法
将遗传算法(GA)应用到支持向量机(SVM)优化中时,决策树生成算法的基本步骤如下:
SETP 1:将全部训练样本集所属类别按实值编码策略进行编码,并在根节点调用GA将原始训练样本所属类别划分为两类。
SETP 2:判断各子节点是否只包含一类样本,若是,则转向步骤4,反之转向步骤3。
SETP 3:若结点包含两类以上样本,剔除其父节点染色体中本子节点不包含的类别对应的基因,形成新的染色体,并调用遗传算法(GA)将本节点的样本所属类别划分为两类。转向步骤2。SETP 4:循环结束,生成最优决策树。
3、实验结果及说明
本实验中所有的数据均采用Singh D等人公布的前列腺癌基因表达谱数据集,做为实验样本集。前列腺癌基因表达谱数据集共有102个样本,其中50个正常样本,52个患病样本,每个样本均含12700个基因的表达数据。将这个数据集划分为训练样本集和测试样本集,50个正常样本中,28个作为训练样本,21个作为测试样本。52个患病样本中,31个为训练样本,21个为测试样本。如图2所示。
本文是基于训练集而不是全部的数据集的数据来挑选特征基因,然后用GA/SVM算法设计的分类模型对测试集的样本进行测试,从而保证了实验的客观性。由于遗传算法是随机方法,不能确保每次运行的结果都能得到相同的特征子集。因此,本文求取15次运行结果的均值和标准差来评价GA/SVM方法的性能。对前列腺癌基因表达谱数据集的测试集运行GA/SVM方法15次,选出了15个基因子集,并统计这15个子集的平均性能指标。实验中的算法均采用VC++编程实现。从结果中很明显可以看到(如表1所示),对于不同的样本抽样和种群大小,通过遗传算法优化后的精度要比普通的单个决策树算法的精度高。对于单个决策树生成算法,每个子集包含特征基因为64个,平均分类精度仅为81.39%,而优化后的决策树精度为95.35%,高于单个决策树生成的精度。
实验证明,通过遗传算法对决策树进行优化,能得到更高的精度。尤其是待分类数目较多,在样本有限的情况下,通过对决策树的优化得到更加满意的结果。
3、结束语
本文提出的遗传算法(GA)优化支持向量机(SVM)决策树算法参数,获取了最优的参数组合,改进遗传算法的变异算子,减少了搜索时间。把该方法应用到前列腺癌基因表达谱数据集的分类中,实验结果表明了其有效性和可行性,对肿瘤的临床诊断和生物医学研究起到一定的参考作用。
参考文献
[1]Singh D, Febbo P, RossK, et al.Gene expression correlates of clinicalprostate cancer behavior[J].Cancer Cell, 2002, 1 (2) :203-209.
[2]Golub R R, Slonim D K, Tamayo P, et al.Molecular classification ofcancer:class discovery and class prediction by gene expression monitoring[J].Science, 1999, 289:531-537.
[3]Alon U, Barkai N, Notterman D A, et al.Broad patterns of geneexpression revealed by clustering analysis of tumor and normal colon tissuesprobed by oligonucleotide arrays[J].Proc Natl AcadSci Usa, 1999, 96:6745-6750.
[4]Takahashi F, Abe S.Decision-tree-based multiclass support vectormachines[C].Proc of the 9th Int Conf on Neural Information Processing.Singapore, 2002, (3) :1418-1422.
[5]何爱香, 朱云华, 安凯.基于遗传算法和支持向量机的肿瘤分子分类[J].数据采集与处理, 2007, 22 (1) :84-89.
[6]连可, 陈世杰, 周建明.基于遗传算法的SVM多分类决策树优化算法研究[J].控制与决策, 2009, 24 (1) :7-12.
基因表达谱数据分析技术 篇2
微阵列技术[1,2,3]的到来对生物学和医学来说是一场革命,通过它可以同时观测成千上万个基因的表达水平,从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。还可以根据基因在不同条件下表达的差异性来进行复杂疾病诊断、药物筛选、个性化治疗、基因功能发现、农作物优育和优选、环境检测和防治、食品卫生监督及司法鉴定等,因此对基因表达谱的研究具有重要的理论价值和应用意义。微阵列基因表达数据具有维数高、样本小、非线性的特点,这对一些传统的机器学习方法提出了新的挑战,对其数据的分析已成为生物信息学研究的焦点。
1 基因表达数据采集
基因表达数据采集可分为三个步骤:微阵列设计、图像分析和数据获取、过滤、标准化。基因芯片(gene chip),简称为微阵列,就是指固着在载体上的高密度DNA微点阵,具体地说就是将靶基因或寡核苷酸片段有序地、高密度排列在玻璃、硅等载体上。m RNA(信使核糖核酸)的表达水平的获得是通过选取来自不同状态的样本(如正常组织与肿瘤组织、不同发育阶段组织,或用药之前与用药之后组织等,一种称为实验样本,另外一种称为参考样本),在逆转录过程中,实验样本和参考样本RNA(核糖核酸)分别用不同的红、绿荧光染料去标记,并将它们混合,与微阵列上的探针序列进行杂交,经适当的洗脱步骤与激光扫描仪对芯片进行扫描,获得对应于每种荧光的荧光强度图像,通过专用的图像分析软件,可获得微阵列上每个点的红、绿荧光强度(Cy5和Cy3),其比值(Cy5/Cy3)表示该基因在实验样本中的表达水平。在通常情况下,考虑Cy5和Cy3的数值时,还应考虑相应的背景数值,如果微阵列上某个基因的Cy5或Cy3数值比相应的背景数值低,则该基因的表达水平无法确定。为了方便数据处理,常以数值1表示该基因的表达水平,或直接以Null(即缺省值)表示。在做具体数据分析时,可通过降低维数办法来处理缺省值。另外,为了反映某个基因表达水平在实验样本和参考样本中的倍数关系,通常对上述比值进行以2为底的对数变换即以log2(Cy5/Cy3)表示该基因的表达水平。通过基因芯片所获得的多个基因在不同生理过程中的一组表达数据,即为基因表达谱,通常表达数据用矩阵形式保存。
2 基因表达数据分析
总的来说,基因表达数据分析可分三个层次[4]:单基因分析,找出差异基因表达;多基因分析,按基因的共同功能、相互作用等进行分析;系统水平分析,建立基因调控网来分析和理解生命现象。研究方法有两种类型:一种是以聚类分析为代表的无监督的方法,不需要附加的类别信息,从距离矩阵出发将相似的模式聚为同类,从而实现对原始数据结构的概括和提炼;另一种是有监督的方法,除了基因表达谱数据之外,还需要知道研究对象的类别信息,如基因的功能分类或样品的病理分类。有监督方法将基因表达数据视作对象的特征观察值通过构建分类器来预测由这些特征决定的类别标签。图1是基因芯片数据分析处理过程。
2.1 无监督分析方法
聚类分析是一种典型的无监督学习方法[5,6],在基因表达谱研究中,常用的数据聚类方法有分层聚类、K均值聚类、自组织图、主成份分析等。
分层聚类[7]是应用最多的非监督基因表达谱聚类分析方法之一。分层聚类方法是将基因表达谱矩阵的每一列或者每一行看作一个向量(高维空间的一个点),根据这些向量之间的距离或者某种相关性度量进行聚类。
K均值聚类[8]是一种传统的统计聚类方法。该算法的基本思想是首先任意设定K个类中心的初始值,然后分别计算每个样本与各个类中心的欧氏距离,并将它归到距离最近的类中心代表的那一个类,再计算每个类中样本点的平均点,并以此取代原来的类中心,依次下去,直到类中心都不再变化,算法终止,并得到了分类结果。
自组织图分析[9]是人工神经网络应用于聚类分析中的例子。实际上,非监督聚类方法远非这3种方法,许多非监督聚类方法都被应用到基因表达谱数据的分析上,例如基于密度的DBSCAN算法、OPTICS算法、DENCLUE算法等,基于网格的STING算法、CLIQUE算法、WAVE-CLUSTER算法。尽管在对疾病或生物特性方面已经取得了许多有意义的结果,但传统的非监督聚类方法在基因表达谱分析中却存在着下述3点不足:
(1)当对不同样本进行实验获得基因表达谱时,存在着噪声的干扰,但现在对于噪声还没有很好的处理方法,仅能做的就是对每个样本的基因表达谱进行归一化处理。
(2)在对基因表达谱数据进行聚类时,不管对基因还是对样本,所考虑向量的维数都相当高,而样本个数却相对较少,对于这种情况,很多方法是无法使用的,而且即使能够直接使用,其效果也很不稳定,并且分类的性能也很难评价。
(3)传统的非监督聚类都需要给定数据中的类别个数,否则聚类是无意义的。而实际中会出现数据中的类别数是隐含的,很难明确知道这一信息,这种情况下的聚类就变得相当困难。
这3点是目前非监督聚类方法无法或难于克服的问题。因此基因表达谱的分析迫切要求建立新的更有效的有监督分析方法。
2.2 有监督的分析方法
有监督的表达谱分析方法[10,11]的任务是构建一个分类器来预测表达谱数据的类别,具体方法有线性判别、决策树、神经网络和支持向量机(SVM)[12]等。例如对于两种不同类型的肿瘤,常规的形态学分型方法无法区别,但是利用有监督的方法可以按照他们的表达谱数据构建一个有较好区分度的分类器,这对于肿瘤的诊断是非常有意义的。一般来讲,分类器的构建过程是首先设计一个机器学习算法的模型,用类别已知的训练数据集来训练这个模型的参数,使训练好的分类器对训练数据集具有较低的回代错误率,对未知样本有较好的推广性。训练成熟的分类器对于输入的未知类别的样本,可以根据样本的基因表达水平模式预测它的类别标签。
支持向量机是数据挖掘中的一个新方法。支持向量机能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,它通过训练一种“分类器”来辨识与已知的共调控基因表达类型相似的新基因。
人工神经网络法是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型.在这一模型中,大量的节点(或称“神经元”,或“单元”)之间相互联接构成网络,即“神经网络”,以达到处理信息的目的。其优势是运行分析时无需在心目中有任何特定模型,而且,神经网络可以发现交互作用效果。
2.3 基因调控网模型
聚类方法有助于提取共同表达的基因簇,想进一步了解它们之间的调控关系,需要建立调控网络模型,目前构建基因调控网络的算法主要是贝叶斯网络[13,14,15,16]。贝叶斯网络是描述数据变量之间依赖关系的一种图形模式,是一种用来进行推理的模型。贝叶斯网络为人们提供了一种方便的框架结构来表示因果关系,这使得不确定性推理在逻辑上更为清晰、更好理解。
3 基因表达谱分析软件及其资源
用于基因表达谱分析软件有:用于聚类分析的Cluster和Treeview分析软件、BRB阵列分析软件,表1列出了常见基因分析软件的基本情况,很多公司都正在进一步开发功能强大的软件。
4 分类方法性能和评价
对通过基因芯片数据建立的聚类或判别模型,常进行预测准确度、计算复杂度和模型描述的简洁度3个方面的性能评价。
肿瘤表达谱 篇3
关键词:磁共振,单体素波谱成像,脑肿瘤
脑肿瘤占全身肿瘤发生率的20%左右, 是临床当中常见的多发性疾病。该病由于发生部位较特殊, 对患者的生存造成了极大的影响。脑肿瘤的及时诊断对治疗手段的选择和预后起到了重要的作用。磁共振技术对于脑肿瘤的诊断已在临床实践中得到公认, 但其对于早期诊断和术前分化程度的判断具有局限性。随着磁共振诊断仪的不断升级以及应用软件的开发, 出现了许多新技术。其中1H-MRS对脑肿瘤治疗的疗效评价有着重要的临床意义。本文选取了30例脑肿瘤患者, 用Simens Verio3.0T扫描仪进行单体素1H-MRS扫描分析, 旨在为术后检查和治疗提供参考依据。报告如下。
1 资料与方法
1.1 一般资料
选择我院2010年10月~2012年10月30例脑肿瘤手术患者, 其中男20例, 女10例;年龄18~56 (33±3.2) 岁。其中胶质母细胞肿瘤7例, 髓母细胞肿瘤5例, 脑膜肿瘤5例, 脑转移肿瘤4例, 室管膜肿瘤2例, 中枢神经细胞肿瘤2例, Ⅰ级-Ⅱ级星形细胞肿瘤5例。30例患者均进行手术切除脑肿瘤, 并且所有患者均在术后0.5~2年行MRS和MRI复查。
1.2 仪器设备及相关参数
MR扫描仪采用Simens Verio3.0T, 序列扫描包括FLAIR, T2WI, 轴位T1WI以及矢状位T1WI。采用二乙三胺五乙酸钆 (Gd-DTPA) 对比剂。扫描参数:4200TR/90TE ms (T2WI) , 690 TR/15 TE ms (T1WI) , 11000TR/TE135ms或者TI1800ms (FLAIR) , 激励次数为1次, 矩阵256×256。SVC (单体素) 采集成像参数, TR1500ms, TE144ms, 激励次数为1次, 体素大小20mm×20mm×20mm, 292s成像时间[1]。
1.3 方法
打开仪器, 预热准备序列扫描, 注射对比剂 (0.1mmol/kg) , T1WI增强扫描 (轴位, 冠状位, 矢状位) 。扫描层厚度5毫米, 扫描间隔1mm。视野范围, 20mm×20mm×20mm。MRS是2D CSI PRESS (点分辨波谱序列) 检查技术, 压水压脂是化学位移选择饱和法。SVC (单体素) 采集是激励法。选择ROI (兴趣区) 依据病变部位, 病变大小, 常规扫描确定。对于病变强化区包括水肿区及对照区 (正常脑实质) 要选择最大区域MRS扫描, 注意含脑脊液结构和骨胳结构要尽量避开。
1.4 肿瘤复发诊断标准
脑组织活检见肿瘤细胞或者二次手术的组织学检查见肿瘤细胞, 另外, 手术后0.5~2年复查时强化病灶呈增大趋势, 周围水肿加剧, 占位效应加重, 临床症状恶化。
1.4 统计学处理
数据采用SPSS 17.0统计学软件进行处理。计数资料采用±s表示, 行t检验, P<0.05为差异有统计学意义。
2 结果
2.1 术后残留复发及损伤结果
肿瘤残瘤残留复发共22例, 损伤8例。在术后复查原术区时见有不规则的软组织肿块。磁共振波谱MRS显示, 胆碱 (Cho) 峰升高, 肌酸 (Cr) 峰和门冬氨酸 (NAA) 峰降低。Cho/Cr比值, NAA/Cr比值及Cho/NAA比值比正常对侧高。复发中MRI常规表现, 术区残腔异常信号, T2WI稍高, T1WI等信号或稍低。手术后反应性损伤的8例中有4例良性脑膜瘤 (包括有1例髓母细胞瘤和1例Ⅰ级星形细胞瘤) 。磁共振波谱MRS显示, 胆碱 (Cho) 峰不高, Cho/Cr比值, NAA/Cr比值及Cho/NAA比值不高。
2.2 治疗前后1H-MRS结果比较
Cho/Cr比值, NAA/Cr比值及Cho/NAA比值, 治疗后未复发区下降, 治疗后复发区升高。详见附表。
3 讨论
传统的CT和MRI影像检查脑肿瘤术后残留复发及损伤较困难, 而采用1H-MRS (氢质子MR波谱) 可以定量的分析活体组织的代谢变化, 不仅能把肿瘤代谢物的分布情况反映出来, 还能把浓度的变化、不同阶段的急性期及晚期坏死肿瘤的表现以及观测水肿的边界反映出来, 是反映肿瘤生长情况的可靠指标[2]。近些年, 脑肿瘤患者的数量越来越多, 虽然检测及手术技术有了一定的进步, 但是对于部位深在的重要神经血管边界难以看清楚的肿瘤仍难以切除彻底, 导致术后扩散及复发的概率仍很高[3,4]。脑肿瘤术后常显示脑实质非肿瘤性, 强化的表现近似于强化残余的脑肿瘤组织, 随访复查时残腔缩小并无壁结节。在MRS表现为胆碱 (Cho) 峰不高, Cho/Cr比值, NAA/Cr比值及Cho/NAA比值不高。注意在术后半年内复查时, 见有环状强化且Cho峰升高但并未见壁结节, 这有可能是手术后胶质增生所导致, 在以后的随访中要注意残腔的缩小及Cho峰的降低。1H-MRS检测胆碱 (Cho) 的含量可以有效的反映出肿瘤细胞增殖活性。复发的脑肿瘤血管生成给肿瘤的生长提供充足的营养, 肿瘤组织疯狂生长的同时肿瘤细胞密度增加, 合成速度加快, 转换细胞膜加速, 此时胆碱 (Cho) 含量明显升高。虽然1H-MRS可以给脑肿瘤提供活检仿真的技术, 可以无创伤的评估肿瘤组织的代谢以及提供病灶组织的成分信息, 但是磁共振单体素波谱成像准确性较低, 对于准确定位有较大的误差存在, 在手术后增生的反应性胶质会短暂的使胆碱 (Cho) 峰升高, 检测时出现假阳性。MRS只能作补充却不能替代CT和MRI传统的影像手段。MRS和MRI联合应用, 不仅提高了诊断的准确性, 同时又为检测结果评估预后。综上所述, 氢质子MR波谱 (1H-MRS) 与增强MRI结合可以在放疗后残留复发和术后反应性损伤方面提高诊断准确性, 给患者的治疗提供参考。
参考文献
[1]金晓, 朱君明, 陈书达, 等.3T多体素MRS在放射性脑损伤和胶质瘤复发鉴别诊断中的应用[J].中华神经外科杂志, 2007, 23 (10) :210-213.
[2]Demir MK, Iplikcio AC, Dincer A, et al.Single voxel proton MR spectroscopy findings of typical and atypical intracranial meningiomas[J].Eur J Radiol, 2006, 60 (1) :48-55.
[3]谭国强, 马雁秀, 谭洁媚, 等.磁共振单体素波谱成像对脑肿瘤治疗后反应的评价[J].中国CT和MRI杂志, 2012, 10 (6) :14-16.
小鼠肝腹水细胞膜表面糖表达谱 篇4
1 材料与方法
1.1 材料与试剂
凝集素购自美国Vector公司;牛血清白蛋白(BSA)和戊二醛均购自Sigma公司;红细胞裂解液(erythrocyte lysing solution,ELS)、瑞士吉姆萨染色液和吖啶橙购自北京赛驰生物科技公司;醛基载片(基因公司);C57小鼠购自中国医科大学实验动物部;H22细胞株由中国医科大学肿瘤研究所提供。
1.2 仪器与设备
生物芯片点样仪(MGⅡ600),英国Bio Robiotics Ltd;激光共聚焦扫描仪,美国Gene TACTMLS IV;低温离心机,美国Sigma公司;尼康激光共聚焦显微镜(ECLIPSE 80i),日本。
1.3 试验方法
1.3.1 凝集素芯片的制备
按照文献[6]的方法制备凝集素芯片,将凝集素溶于5%甘油的PB缓冲液(0.01 M,p H=7.2)配制点样液,浓度为1 mg/m L,Micro GridⅡ芯片点样仪在醛基修饰的芯片载片上制备凝集素点阵,37℃湿盒内水化2 h,放入4℃冰箱备用。
1.3.2 肝癌腹水制备
实验动物随机分为正常对照组(6只)和肝癌腹水组(20只),两组间暴露因素差异无显著性(P<0.05),肝癌腹水组每只小鼠腹腔皮下接种肝癌H22细胞7×106(0.2 m L),制备小鼠肝腹水模型。
1.3.3 细胞收集及其标记
小鼠正常肝组织:取正常组的小鼠肝组织用肝素D-hank’s液清洗后剪碎,0.25%胶原酶Ⅳ(D-hank’s液)37℃消化1 h,1 000r/min离心8 min,按1∶3的比例向细胞沉淀中加入ELS裂解液去除红细胞,轻轻吹打混匀;1 000 r/min离心5 min,D-hank’s液重悬细胞,加入吖啶橙染色(100 mg/L,PBS)5 min,1 000 r/min离心5 min,D-hank’s液洗涤细胞去除多余的吖啶橙,D-hank’s液重悬细胞,调整细胞浓度为105个/m L,用于后续实验。小鼠肝腹水细胞:取小鼠肝腹水1、2 m L,按上述方法去除红细胞,D-hank’s液重悬细胞,吖啶橙染色,D-hank’s洗涤,调制细胞浓度为105个/m L备用。
1.3.4 凝集素芯片检测
将已经制备好的凝集素芯片放入湿盒内,37℃水化20 min,1.0%BSA(PB,0.01 M,p H7.2)封闭10 min,PB缓冲液(0.01 mol/L,p H=7.2)洗涤5 min,将准备好的细胞悬液滴加到芯片上,37℃孵育40 min,PBS(p H 7.2)缓冲液洗涤5min,3%戊二醛(PBS,p H7.2)固定10 min。
1.4 数据分析及其细胞形态观察
1.4.1 凝集素芯片捕获细胞检测
应用Gene TACTMLS IV激光扫描仪扫描检测芯片上各凝集素位点捕获细胞荧光信号强度,光电倍增管设为60%,用扫描仪分析软件从扫描结果中获取荧光信号强度值和背景值分析结果,正常组和肝癌腹水组凝集素位点捕获细胞的荧光信号用均数±标准差表示。用常规HE染色法对芯片上捕获到的细胞进行染色,光学显微镜下观察各个位点捕获到细胞的数目和形态。
1.4.2 细胞膜表面的糖谱分析
对照芯片上捕获到细胞的凝集素的糖链亲和特异性确定细胞膜表面糖谱,两样本均数差异用t检验,应用SPSS10.0分析数据,检验水准为α=0.05。
1.4.3 芯片结果的细胞化学验证
为了验证凝集素芯片检测的准确性,采用芯片ELISA方法,按1.3.3方法提取小鼠肝腹水细胞,不经过吖啶橙标记直接滴加到入凝集素芯片孵育40 min,PBS缓冲液洗涤5 min,分别将浓度为0.4 mg/m L FITC标记的PSA和DBA滴加到已经捕获到细胞的芯片上,37℃反应40 min,PBS缓冲液洗涤5 min,激光扫描仪扫描检测。
2 结果
2.1 凝集素芯片捕获细胞的结果
本实验所用的23种凝集素及其糖链亲和特异性和对小鼠肝腹水细胞、小鼠正常组肝细胞膜表面糖链检测结果详见附表。腹水组只有LTL、DBA和ACA凝集素位点没有捕获到细胞,正常组只有PSA、DSL、STL和NPL 4种凝集素位点捕获到细胞,且捕获细胞数很少,见附图。
2.2 细胞膜糖链表达的差异
参照附表凝集素糖链亲和特异性进行分析,正常小鼠肝组织细胞呈现阳性的DSL、STL、NPL都具poly Lac NAc、Lac/Lac NAc亲和特异性,这些多聚乳糖胺是基质蛋白(如黏连蛋白)的主要成分。肝腹水细胞膜上糖链类型和糖链数量显著增加,根据凝集素的特异性可以看出:细胞膜上增加了唾液酸、乙酰葡萄糖、乙酰半乳糖、甘露糖和半乳糖糖链。
左:芯片上凝集素点阵,中:正常小鼠肝组织细胞检测结果,右:小鼠肝腹水检测结果
2.3 芯片结果的细胞化学验证
选择小鼠肝腹水细胞检测结果为阳性的凝集素PSA和阴性的凝集素DBA作为探针,用FITC荧光标记,腹水细胞提取后不进行吖啶橙荧光标记直接与芯片孵育,洗涤后分别向芯片上滴加FITC-PSA和FITC-DBA,30 min后洗涤、扫描,结果显示,FITC-PSA孵育后芯片上捕获到细胞的各点都有荧光信号,而FITC-DBA孵育后的芯片没有荧光信号,说明芯片上凝集素捕获到的细胞膜上有与PSA结合的糖链而没有与DBA结合的糖链,这与芯片检测结果一致。
3 讨论
继基因组和蛋白质组之后,以糖复合物上聚糖的结构和功能为主要内容的糖组学,正受到越来越多的关注[7],糖复合物在细胞信号传导、免疫识别、细胞分化、细胞间黏着、蛋白质正确折叠与定位等一系列生命过程中发挥着重要的作用。肝癌发生发展是一个复杂的过程,其过程中细胞膜糖蛋白在其免疫、信号传导、细胞迁移等方面的作用尚不清楚,由于缺乏合适的技术手段,目前还没有系统的检测肝细胞癌变过程中细胞膜表面糖复合物的变化。凝集素(lectin)是一类糖类结合蛋白质,能够可逆地与单糖、寡糖等结合,且不具备酶的催化活性以及抗体的免疫属性,因为凝集素具有特异性识别聚糖的能力,常被作为“译码器”来阐释糖复合物上的糖链结构,通过凝集素与聚糖之间的相互作用来推测糖复合物上聚糖糖链的核心信息[8]。2005年,凝集素芯片作为一种新型的聚糖表达谱分析方法发展起来[9],它能对复杂的聚糖结构进行快速、高通量、高灵敏度的分析。其基本原理是将一系列已知聚糖结合特异性的凝集素分子固定于芯片表面,然后把标记过的生物样品与此芯片杂交,将监测得到的点阵数据与已知凝集素的寡糖结合特异性进行比较分析,获得生物样品的聚糖结构信息。凝集素芯片的发展为研究细胞分化、细胞鉴定、以及生物医药工业各种背景下的糖组学提供了强有力的工具[10,11]。
细胞的恶性转化常常伴随一些功能性蛋白糖基化结构的改变,与肝细胞癌相关的糖组学研究中,糖基转移酶研究最为广泛。肝癌组织或HCC患者的血清中N-乙酰葡糖胺基转移酶III(Gn T-III)/α1-6岩藻糖转移酶(α1-6FT)、N-乙酰葡糖胺基转移酶V(Gn T-V)的活性发生了明显的变化并显示出了聚糖结构的改变[12]。一些迹象也证明唾液酸转移酶(ST6Gal I)的表达与人HCC与转基因小鼠的HCC正相关[13]。N-乙酰葡糖氨基转移酶III能将N-乙酰葡糖胺的β1,4键加到与天门冬酰胺通过β连接的甘露糖的核心结构上。在人和小鼠的肝瘤细胞中,肿瘤上的Gn T-III的活性与其周围和对照正常的肝组织相比含量显著增多。N-乙酰葡糖胺基转移酶V(Gn T-V)引起的β1-6-Glc NAc分支化直接与HCC患者的肿瘤转移相关,Gn T-V由通过Ras信号通路调节的基因Mgat5编码。众所周知,蛋白质翻译后的磷酸化在胞内或胞外都发挥着重要的作用,人们推测糖基化作用可能起到相似的信号作用。