快速提取(共8篇)
快速提取 篇1
人脸识别技术以其非接触采集特性和良好的用户体验成为生物识别领域一个重要分支。尤其自上世纪90年代以来,研究该领域的各国学者针对不同的用户环境开发出很多识别技术[1],如基于几何特征的方法,基于模板匹配的方法,基于代数特征的方法,基于神经网络的方法,基于支持向量机的方法等等。这些方法中采用频率较高的特征提取技术有主成分分析(PCA)[2]、小波分析(Gabor变换、Mallat算法)、线性判别分析(LDA)[3]等,在这些基础方法上还发展出来了KPCA[4]、二维Gabor小波变换、FSLDA以及多种技术的组合等众多方法,近几年还出现了三维人脸建模技术[5]。无论哪种方法都需要高效的计算和存储平台作硬件支撑。
如果能够在保证识别效果的基础上有效降低存储和计算量,使这一技术推广到常见的便携移动设备上,如利用智能手机进行银行转帐时,使用SIM+人脸鉴定的双重保险,将会给人们带来更加安全便捷的数字化服务。为与人脸识别过程相结合,在分析了遗传算法的基本过程和要素后,给出遗传算法在应用于人脸识别时的一种适应度评价方式和三个重要算子,通过实验分析,证实此方法效果明显。
1 基于遗传算法(GA)的人脸特征提取
遗传算法是Holland教授[6]于1975年提出的一种模拟生物体进化的抽象算法,具有“生成+检测”的特性。它利用编码空间代替问题参数空间,以适应函数作为评价依据,以编码群体为进化基础,并对群体中的个体进行遗传操作来实现选择和遗传机制,形成循环迭代,由群体中个体的不断进化逐渐接近问题的最优解。遗传算法的整个进化过程操作是随机的,但它所显现的特性并非完全随机,它在搜索过程中它能有效利用历史信息推测下一代,得到期望性能有所提高的寻优点集。
一般的遗传算法包含五大要素[7]:
1)参数编码(二进制编码、序列编码、树编码、自适应编码、大字符集等);
2)初始群体的敲定;
3)适应度函数的设计;
4)遗传操作的设计(遗传算子:选择、交叉、变异);
5)控制参数的设定。
其中遗传算子的作用就是模拟生物系统中“适者生存”,淘汰不能适应的染色体,把更有益的信息遗传到子代。
在生物模拟系统中,DNA由遗传的染色体构成,染色体在遗传算法中表示为比特序列。其中每个染色体用n位来表示。在执行遗传算法的第一步就是对各类中的每个个体进行编码,即编排单个个体的比特序列。在这里,对染色体的编码是通过获取个体的十进制值后转化为二进制编码来实现的,它是由0和1组成的序列。例如,对于已知的单个个体由8位(n=8)来表示时,则它的染色体为:X=x8,x7,x6,x5,x4,x3,x2,x1。
对群体中个体的染色体进行操作的三个算子:选择、交叉、变异。
选择算子,作用就是选择适应值较好的个体以生成交配池。这里采用轮盘赌(roulette whell)的方法来实现,以保证每个父代都有同等的概率Ps被选择。
交叉算子,在GA中模仿了自然界有性繁殖的基因重组过程,目的是将原有的优良基因遗传给子代。交叉操作一般分为三步:
从交配池中随机抽取出一对要交配的个体。
根据位串长度L,对要交配的一对个体进行长度[1,L-1]的位置交叉;
根据设定的交叉概率Pc(0
设在交配池中随机抽取一对个体:S1=a1,a2,a3,...,aL,S2=b1,b2,b3,...,bL,随机抽取交叉位x∈{1,2,...,L-1},此处以L=5,X=3为例对两个个体右侧部分染色体位串进行交换,得到两个新个体S1’=a1,a2,b3,b4,b5,S2’=b1,b2,a3,a4,a5。
变异算子,模拟的是自然界生物体进化中染色体某位基因发生突变的现象。在GA中,通过设定变异概率Pm随机反转某位的二进制字符值来实现。即,产生一个随机数P,若P
GA(后面提及的GA都是限定遗传算法在人脸识别中的应用)工作流程如下:
2 应用示例
设有L类样本,定义:
训练集X={X1,X2,X3,...XL}
第i个类的子集Xi={x1(i),x2(i),...,xNi(i)}
其中x1(i),x2(i)为i类的第1和第2个训练样本个体(图像),Ni为第i类样本的训练样本总数。所有图像训练样本的总数量N=N1+N2+...NL
1)对所有图像转换为列矢量,即,把每个位置的染色体变为向量。每个向量代表一个个体,位数取决于染色体所代表图像的灰度级,即图像像素的编码。假设一个灰度级为256的图像,其染色体应为8位(28=256),如图1,为一个m×n像素的图像。
2)每个类的初始种群从Ni中产生。因为交叉操作需成对进行,所以当Ni为奇数时,需要取一个测试图像进行配对交叉(仅对属于同一类的所有个体设置进行交叉操作,产生的新个体仍属于此类中)。
3)对每个类中的所有个体设置一个适应度函数,这里采用欧氏距离来衡量。设测试用例为q,与xij(第i类中的第j个个体)的适应度函数为:
4)新生成的类中的每个个体Ni都将符合最低适应度函数。
5)迭代递增+1。
6)如果算法执行超过最大迭代数T,或者群体产生的个体已达到最高适应度值,则认为此测试用例属于该类。否则,转到步骤3。
为说明交叉操作,设有某类中一对将要配对的个体a和b,在第4比特位进行切割交叉,将产生两个新个体c和d,如图2:
3 实验分析
实验使用了剑桥ORL库(共有40人,每人10幅,每幅92×112像素的256灰度级图片),实验机器平台为清华同方X46H型号,使用[8]的方法与遗传算法进行比较,先后进行了10次实验,取平均值得到结果如表1和表2:
从实验结果看,两种方法的识别率比较接近。首先,对比所用时间,两种方法在训练和识别同一组人脸时,在L=40,T<10,Pm<0.01,Pc=0.6的情况下,使用PCA方法的总耗时是GA的十倍。其次,对比存储空间,PCA方法在前期的预处理过程中,占用资源要比GA方法大很多。例如一幅92×112的图像,产生的协方差矩阵大小为10304×10304,如果协方差矩阵所表示的基本像素单元为8字节,那么6幅图像需要占用存储量6×10304^2×8b,相当于4.7GB的存储空间,要比普通的电脑全部内存还大;而GA即使在256灰度级图片上进行编码,存储6幅图像所占用空间为:92×112×6×8×2约966Kb,远远小于PCA。
4 总结
利用遗传算法良好的“生成+检测”特性来寻找优化问题的最优解,并在人脸识别中进行一次有效尝试,实验结果表明在不降低识别率的情况下,无论是计算时间还是所占在存储容量GA都要明显少于PCA。但本方法只适合在非固定用户群使用,这里使用单一的PCA降维方式进行实验对比只是为了更明显分析遗传算法的特点,并非反映PCA方法低效,相反,在固定用户群体的情况下,PCA只需进行一次前期训练即可完成以后的快速识别,这是GA所不能及的。相信在其他优化问题求解上,遗传算法会有更好的拓展空间。
参考文献
[1]王映辉.人脸识别:原理、方法与技术[M].北京:科学出版社,2010.
[2]Turk M,Pentland A.Eigenfaces for Recognition,Journal of Cognitive Neurosicence,1991,3(1):71-86.
[3]Zhao W,Krishnaswamy A,Chellappa R,et al.Discriminant Analysis of Principal Components for Face Recognition,Face Recognition:From Theory to Applications,H.Wechsler,P.J.Phillips,V.Bruce,F.F.Soulie,and T.S.Huang,eds.,Springer-Verlag,Berlin,1998:73-85.
[4]Yang M Q,Ahuja N,Kriegman D.Face recognition using kernel eigenfaces.Proc.ICIP,1:37-40.
[5]Lee J,Moghaddam B,Pfister H,et al.Finding Optimal Views for 3D Face Shape Modeling,Proc.of the International Conference onAutomatic Face and Gesture Recognition,FGR2004,17-19 May 2004,Seoul,Korea,pp.31-36.
[6]Holland J H.Outline for a logical theory of adaptive systems.Journal of the Association fo Computing Machinery,1962,9(3):297-314.
[7]李敏强,寇纪淞,林丹,等.遗传算法的基本理论与应用[M].北京:科学出版社,2002.
[8]Moon H,Phillips P J.Computational and Performance aspects of PCA-based Face Recognition Algorithms,Perception,2001(30):303-321.
快速提取 篇2
个考点的一个综合。
一、两压缩,两提取
由于“提取关键词”是“压缩语段”的变体,所以在答题思路上要借助“压缩语段”的解题思想。“提取关键词”正确的方法是:先整体把握材料,用压缩语段的方法对材料进行压缩,提取出一句话;然后再对这句话进行压缩,提取关键词。即:两压缩,两提取。
【例1】提取下面一段话的主要信息,在方框内写出四个关键词。(全国卷Ⅰ)
据报道,我国国家图书馆浩瀚的馆藏古籍中,仅1.6万卷“敦煌遗书”就有5000余米长卷需要修复,而国图从事古籍修复的专业人员不过10人;各地图书馆、博物馆收藏的古籍文献共计3000万册,残损情况也相当严重,亟待抢救性修复,但全国的古籍修复人才总共还不足百人。以这样少的人数去完成如此浩大的修复工程,即使夜以继日地工作也需要近千年。
(1)第一步:对材料进行压缩和提取。
解答时,先通读全段,然后压缩语段,将原文压缩成一句话。
这是一段记叙性的文字,全文两句话,其中第一句话由两个分句构成。第一句话,第一层从国家图书馆的角度,以修复任务的巨大(5000余米)与修复人员稀缺(不过10人)之间的反差,表明古籍修复的专业人才极其缺乏;第二层,从全国的角度,说明古籍修复的专业人才短缺非个别现象(全国范围内都存在)。第二句话,以一种假设的结果强调古籍修复人才的不足。
所以,这段文字可以压缩为:我国古籍修复的专业人才极为不足。(15字)
(2)第二步:对第一步压缩后的话进行提取:
有了这句话作基础,提取关键词就有了明确的范围,确定的指向。以第一次压缩的文字为蓝本,最后提取的关键词是:古籍、修复、人才、不足。
二、分层寻找法
一段文字有时是由几层意思构成的,而一些关键词往往就散落在这几层意思中。所以,分层进行寻找,是一种比较实用的方法。例如:
【例2】下面是一篇科技论文的摘要,根据其信息内容提取4个关键词。(2009四川卷)
本文针对直接法和二步法合成聚乳酸的共性,从单体纯度、催化剂选择到共沸脱水、微波辅助、超临界流体介质,以及到固相聚合、反应挤出、扩链等各个方面,对近年来聚乳酸合成研究的新进展进行了综述;指出各种新方法、新技术的复合应用是提高聚乳酸分子量、降低其成本的关键。
这段文字可分成两层:(1)本文„„进行了综述;(2)指出„„关键。第一层次,句子的主干是:本文“进行了综述”。“综述”了什么?答案是:聚乳酸合成研究的新进展。第二层次,句子的主干是:指出了“关键”。这“关键”就是:各种新方法新技术的复合应用。这样思考以后,关键词基本上就呼之欲出了:聚乳酸合成、研究、新进展、复合应用。
注意段落的特点。每个语段的构成都有自身的特点,有的是总分结构,也有的是分总结构,还有的是并列结构,偏正结构,等等。不同结构的段落构成,就意味着关键词出现的位置不同。比如,并列语段的关键词就常常分布在并列的各个层次中,而偏正语段的关键词一般是在正句之中,即“但”等转折连词所领取的后半部分。如:
【例3】北欧从气候来讲,每年有半年是冰天雪地的冬季;从地理位臵看,僻处于欧洲一角。但经济发展水平在欧洲乃至全球却名列前茅。
【例4】请根据下列文段,用四个关键词概括其中缘由。作为高水平教育和研发的有效补充和配套措施,北欧五国的科技和产业界一直重视并积极推动国内外同行的交流与协作,力争在创意设计以及科技、艺术与市场的结合方面走在世界前列。成立于1845年的瑞典工业设计协会,是全球最早的手工艺行业和创意交流组织;成立于1875年的芬兰手工艺和设计协会,在促进国内外工程师、设计师与制造商之间的交流与合作中,一直扮演重要的角色。在挪威,许多半官方或民间组织致力于形成全国范围的信息和创新服务网络。有的行业组织还同政府驻外机构合作,将行业信息和科技创新的服务网络延伸到世界各地。北欧国家还着力发展国际贸易和跨国公司,这成为其取得竞争优势的突破口。北欧的进出口贸易依存度一直明显高于英美和欧盟的平均水平。北欧国家特别重视培育具有全球经营能力和竞争力的大型跨国公司,从而在一些产业领域形成了显著而持久的竞争优势。
答:____________________________________
从上面这段话我们可以看出这是个偏正结构的段落,第一句话是这段的中心内容,下面的几个句子是对第一个句子的详细陈述。因此,这四个关键词我们就可以在第一个句子里小心寻找。纵观第一个句子,前者在讲做法,后面在讲目的或者意图,因此,重点信息还要在前面的句子里寻找。第一个句子的中心意思落在了第二个小句子上,即“北欧五国的科技和产业界一直重视并积极推动国内外同行的交流与协作”,主干应是“科技和产业界重视并推动交流与协作”,由于是找关键词,主要信息应落在了宾语上“交流与协作”,我们可以去掉“与”字,就找到了两个关键词“交流”“协作”。同理,我们还可以找到另外两个关键词“教育”和“研发”。答案为:教育——研发——交流——协作
关注段落里标点的变化。有的语段,层次的变化不太明显。碰到这种情况时,我们可以看看每个句子的主语有没有变化,整个语段有几个句末标点等。也许从标点中我们可以捕捉到一些变化的情形。如:
【例5】阅读下面一则材料,根据要求回答问题。
他们应该具有强烈的社会责任感,在履行自己职责和义务的过程中,总是以自己的行为在实践着共同富裕的理想。他们的创新力是多方面的,从农村改革到土壤改良,无论是机制变革还是技术创新。他们的影响力来自他们的行为,更来自这种行为所凝聚起来的社会的力量,引起了全社会对中国农民命运的关注,对中国农业战略转变的思考。他们的推动力是具体的、全方位的,他们推动了一个村庄、一个乡镇乃至更广大地域乡村经济的兴旺和农民的富裕。(CCTV三农人物推介标准)
请用文中四个关键词语概括推介标准,每个词语不超过四个字,这四个词语是:
①_________②_________③_________④_________
这段话每个句子都以“他们”开头,用了四个句号,一共四个句子,而这道题正好要求写出4个关键词,找出这四个句子里的关键词就等于找到了这道题的答案。第一句话先讲“他们应该具有强烈的社会责任感”,然后具体讲解在生活中是怎样“履行”自己的职责和义务的。可见,主要信息在前半句,后半句是次要信息,删除次要信息,保留主要信息,先保留前半句,然后再加以压缩,关键词应该落在“强烈的社会责任感”上,但还不合乎题干上的字数要求,于是,再删除 “强烈的”和“社会”连个修饰语,就剩下了“责任感”三个字,就是我们要找的答案了。以此类推,答案不言自明。答案:①责任感②创新力③影响力④推动力
三、抓中心句法
有的语段有比较明显的中心句,这个中心句,或是总结上文,或是开启下文。找到它,就一定能提取到关键词。例如:
提取下面一段话的主要信息,写出四个关键词语。(广东卷)
【例6】从甲骨文到草书、行书的各种书法艺术,间接地反映了现实某些方面的属性,将具体的形式集中概括为抽象的意象,通过视觉来启发人们的想象力,调动人们的情感,使人们从意象中体味到其间所蕴含的美。这也就是一些讲书法的文章里常说的“舍貌取神”——舍弃客观事物的具体现象特征,而摄取其神髓。
这段话的中心句是最后一句,其核心是“舍貌取神”。而“貌”、“取”、“神”又分别所指的是3个关键词——“意象”、“体味”、“神髓”。这样就找到了3个,还剩一个,再用话题法去寻找,即可找到是“书法”了。
【例7】下面是一则新闻报道,请你从中筛选出能够体现我国免疫学研究已达到较高水平的四个关键词语。
日前,刚刚出版的新一期国际免疫学领域顶级学术杂志《自然免疫学》以封面标题的形式,用4页篇幅刊登了由第二军医大学免疫学研究所所长暨医学免疫学国家重点实验室主任曹雪涛院士撰写的专题述评——《中国免疫学研究的历史、现状与未来》。文章报道了我国免疫学研究整体现状与发展趋势,介绍了我国十余家实验室各自具有创新特色的免疫学研究工作,以及我国目前基金资助体系和免疫学领域研究机构与科研队伍、运行管理机制等内容。据悉,这是我国科学家首次在国际免疫学领域顶级学术杂志,发表介绍中国免疫学研究的专题述评。
这一段话只有三个句子,中心句应该是第一句,紧紧围绕第一个句子我们去寻找关键词。题干要求找出“能够体现我国免疫学研究已达到较高水平”的关键词,我们就不要脱离这个主题,而第一个句子里能体现这个水平的词语应该是“国际、顶级、封面标题”。还差一个关键词语怎么办?我们再去阅读这个语段,会发现,结尾段也有总结上文的作用。我们再把眼光瞄准最后一句话,会发现一个和前面不重复的一个能体现出“免疫学研究已达到较高水平”的另外一个词语“首次”,至此,四个关键词就找出来了,他们分别是:国际、顶级、封面标题、首次。
做这道题首先要明确这几段文字讲述了什么主要事件。主要事件是科学家前往调查大西洋深处地壳失踪之谜,第一段就是中心段,下面的段落都是对这个事件的具体陈述。因此,关键词就可以第一个段落着手。第一句话说“美国卡地失大学的科学家近日起程”,讲的是什么人(美国卡地失大学的科学家)什么时间(近日)做什么(起程),但没有涉及到具体内容,可见,中心词语应在第二个小句子里。第二个句子里交代了科学家起程后具体做的事,即:前往调查大西注深处地壳失踪之谜。这个句子里必不可少的信息因该是:地壳、失踪、调查。选定后,可将几个词语稍稍连缀,如能大体表达出文段的主要内容,即可敲定。
四、其他技巧
(一)抓对象法
请从下面论文简介中提取3个反应其主要信息的关键词语。(2009年天津卷)
【例9】这篇文章对中国文明进程中具有重要意义的“士”在先秦时期的演进做了全景式的追寻,有助于人们对“士”的源起及早期衍变形成一个完整而清晰的印象。
这段文字阐述的对象是“士”。这样就找到了其中的一个关键词。
(二)寻找主话题法
任何一个语段,都是围绕着一个主话题来展开的,只要我们找到那些体现主话题的词语,就找到了其关键词。例如:
【例10】(材料见【例1】)
很显然,这个语段的话题是古籍修复的处境问题。所以,“古籍”、“修复”这两个词就是我们在答题时首先要考虑的。文段通过一系列的数据告诉我们古籍修复的处境不妙,具体表现是事多人少,这样,我们就又可找出另外两个关键词——“人才”、“不足”。
(三)抓重复词法
一个语段中,有些词语会多次出现、反复出现,而这多次出现、反复出现的词语,往往就是这个语段的关键词语之一。例如:
读这几段文字,有几个词语是反复地、多次地出现,如“地壳”、“考察(调查)”、“失踪”,找到了这几个词语,答案就自然有了。这种题目说难也难,说容易也容易。
通过以上分析,我们需要遵循的四个原则:第一、整体性原则。要选择反映核心意义的词语,不要随意降低门槛;其次要选择表意相对精练、概括的词语,舍弃意义宽泛、结构松散的词语。第二、代入反馈原则。是指把选出的关键词带入原文段,看是否与题干要求相符合,要点是否齐全,是否字数超限等。第三、数量达标原则。试题所限定的词语数量通常是参照最佳答案设定的,对答题应有一定的暗示作用,一定要按要求提取规定数量的关键词与。第四、次序固定原则。即是考生所选择的关键词在填入答案栏时,位置和次序不能颠倒混乱。次序错了,也是要扣分的。
快速提取 篇3
基于语义化的人脸检索是目前图像检索领域的热点问题。其基本思想是,先为人脸图像附加上包括语义在内的各种内容信息,再进行图像检索。基于内容图像检索的语义可以分为三层,由下至上:底层特征层、对象层和语义概念层。如今人们基于语义的人脸检索研究主要针对底层特征,它的基本思想就是抽取图像的颜色、纹理和形状等底层特征进行相似性匹配。但该层视觉特征事实上并不能很好地表达图像的语义,因此本系统选择基于语义概念层的人眼特征提取方法,将人眼描述成人们所熟悉的人眼类型,再转换成相应的数字编码,将图像数据库中的每幅图像赋予数字标签,并建立语义代码数据库。检索时通过语义将相同语义描述的人眼类型所对应的人脸图像快速检索出来便于人工辨认。
1 人眼模型的改进
描述人眼特征几何模型对于人脸图像检索尤为关键。仔细观察人的眼睛,不难发现一些能够明显反映不同人眼的特征。例如,眼睛有丹凤眼、杏眼等形状各异的眼型,眼珠或内眼角之间距离长短不一。因此,人眼几何模型[1]的建立尤为关键,针对人眼的几何描述提出改进模型如图1所示,并定义了四个特征参数。
其中,m1是两外眼角距离与两眼球中心距离的比值,用于近似表示两眼心距大小;m2是两外眼角距离与两内眼角距离之比,用于表示两眼之间距离长短;m3、m4分别是左右眼睛的水平与垂直方向上两个直径之比,用于表示左右眼椭圆化的程度。虽然当人脸图像尺寸发生变化时,图1中的每一个参数值也会随之变化,但是它们都是同比例缩放。因此,这些形状参数不会随图像尺寸和变化而改变,同时又能在一定程度上反应出眼睛的基本特征。这个模型与文献1中模型相比多了瞳孔中心这个特征值,人眼瞳孔是眼睛的中心最能定位人眼,所以这个特征值十分重要。
2 人眼图像特征的自动提取
人眼特征提取的主要步骤包括分割、建模、特征提取。传统的人脸分割方法主要有眼间带状区域分割法、DCT系数投影法、聚类分析法、小波变化法,这些常用方法大多基于区域图像分割或基于纹理分割即根据人脸五官在积分投影图上灰度值所反映出的波峰与波谷位置来定位五官,这种方法特点是运算量大且对电脑性能要求高[2]。鉴于上述特点,本系统选用基于三庭五眼的人脸分割方法。所谓三庭指将人面部正面纵向分为上中下三个等分,即上中下三庭;五眼指将面部正面横向分为五等分,以一个眼长为一单位,整个面部正面横向分为五个眼之距离。图2为人脸三庭五眼结构图,从中可以看出眼睛主要分布在中庭的上半部分,研究表明人眼的纵向距离大约占人脸纵向的1/3~4/9之间,横向距离大约占人脸横向宽度1/5~4/5之间。据此应用MATLAB平台通过编程对人脸图像进行自动分割以确定人眼位置如图3所示。
在一幅二值图像中,由于梯度的近似值都和相邻像素值的灰度值成正比[3],边缘区梯度值较大,平滑区梯度值较小,对于灰度级为常数的区域梯度值为零。针对分割出的人眼图像进行二值化处理[4]如图4所示,可以看出眼睛的轮廓已经非常清楚。在此基础上对梯度二值图像进行水平积分投影[5]如图5所示,垂直积分投影如图6所示。从图5中可以看出两侧最外端的宽度为眼睛垂直方向直径d1。从图6中可以看出外部两侧最小灰度值间的像素宽度即为外眼角间距离x1;左右两大波峰中每一个都又有三个小峰值,其中中间的峰值点间距离为眼珠中心点的间距x2;中间最小灰度值的像素宽度即为两内眼角间的距离x3;而每一大峰值的宽分别为左右眼宽度d2、d3。研究结果表明:每一张照片水平投影与垂直投影都有特定的图谱。因此,我们探索出了一个有效途径,即通过计算机自动在人眼积分投影图谱中提取特征数据并对每幅照片贴附带语义的数据标签,从而通过语义比对的方式实现快速检索。针对垂直积分投影图进行算法设计,其简化图如图7所示。针对图谱分析设定灰度阈值h1、h2并按着检测算法求出a1~a4及b1~b4这8个值,再由此求出x1、x2、x3、d2、d3五个特征值,最后算出特征参数m1、m2、m3、m4。
3 实验仿真与结果分析
本文使用自建人脸图像库进行了人眼自动分割、特征提取实验。首先随机选取100张照片,在MATLAB平台上计算机对于原始图像样本逐个按照三庭五眼进行分割,同时按着先后顺序确定一个自然编号;然后再对这100张照片用上面的方法提取出人眼特征值m1-m4以实现人眼分割数字化标签处理,最终自动绘制出各特征参数值的概率统计图如图8所示。通过设定算法将各特征参数在误差允许范围内进行自动均衡分类处理,主要是将每一特征值都近似平均地分成四段,对每一段用一个两位二进制数表示。接下来用一个含有1 000张人脸照片图库进行基于100张图片分类区间的编码实验,分割后进行特征提取,然后对每一张人眼图片进行语义化编码,通过算法计算出每幅图片的人眼的各特征值在哪一区间,对其进行编码赋值,最终将图像库中每个人的眼部特征转化为8位二值代码,用其中1、2位来表示眼距,3、4位表示两眼球中心间的距离,5、6和7、8位分别来表示左右眼睛形状即对应图像的数字化标签。譬如10110101代表偏短眼距、近眼心距、左眼偏圆形、右眼偏圆形。按照这种分类方法共定义有256种人眼类型,按照该算法进行检索时,理论上在1 000张人眼图中最多有4‰的重复率,即对于一张人脸图像经过编码匹配后理论上将能从这1 000张人脸图中至少筛选掉996张,仅在剩下4张以内图像进行区分比对,这样人们可以用人眼快速、轻松地确定出哪一张就是目标人脸图像。我们通过上述过程最终调出运行结果,如图9所示列出3类特征编码及其对应的人眼图。
在1 000张图片的编码库反馈回的结果中最高重复率为0.8%,而理论上最高重复率应为0.4%,出现这种情况有以下原因:第一,实验中仅采用了100张图片进行特征分类,边界不可能十分清楚,在实际应用中图片库中的图像越多,经计算分得的区间则越准确,实际应用性越强;第二,人体坐姿的端正与否会影响眼睛的积分投影曲线是否正确;照片亮度会影响梯度图进行二值化的效果。
从仿真结果中可以看出:应用100张图片所做的实验,分类区间已基本正确,图8(c)、(d)中,分类区间有所不同,说明左眼与右眼的椭圆程度是有一些不同的,这也正与生活中人们所发现的人的左右眼有差异的事实相符合。尽管采用的是自建1 000张非标准的证件照为实验样本,实验结果却能说明本文人眼特征快速自动提取方法应用于语义化快速人脸检索是完全可行的。
摘要:针对基于语义的人眼特征自动提取技术进行研究并探索出一条新的路径。首先,在人眼特征研究的基础上,自行建立了描述人眼特征的几何模型并定义了四个眼部特征参量。其次,采用三庭五眼规则分割出人眼区域。然后,利用梯度二值化及积分投影技术对人眼特征进行提取。最后,对人眼特征进行语义化并建立数字化标签。通过自建图库中1 000幅彩色免冠照片的实验测试表明。计算机能够通过语义比对的方式实现快速人脸检索,最高重复率为0.8%。
关键词:人眼特征提取,人脸检索,语义化
参考文献
[1] Samai A,Iyengar P A.Automatic recognition and analysis for humanfaces and facial expressions:a survey.Pattem Recognition,1992;25(1):65—77
[2]刘祥楼,张明,邓艳茹.一种人脸对象的区域分割方法.科学技术与工程,2011;12(4):2686—2690
[3]朱秋煜,黄素娟,王朔中.证件照片的特征提取与检索.模式识别与人工智能,2007;20(4):545—550
[4]孔海东,于明,韩立法.基于边缘与灰度梯度的人眼特征定位分析.河北工业大学学报,2008
[5]朱长仁,王润生.人脸特征自适应选取技术.计算机辅助设计与图形学学报,2002;14(1):26—30
[6] Grassi M,Faundez-Zanuy M,Piazza F.Face localization in 2D face ima-ges using luminosity profiles analysis,2009:340—346
滤波器腔间耦合系数快速提取方法 篇4
1 理论基础
1.1 N阶耦合谐振器模型
图1所示的是N阶耦合谐振器模型,该模型中第N个谐振器在参考面TT处被短路。应用基尔霍夫环路电流定理,得到回路i的输入阻抗表示如下
其中,Pi(ω2)和Qi(ω2)分别为(n-i+1)和(n-i)阶多项式;Z0i和ω0i分别为谐振器i的特征阻抗和谐振频率。
通过式(2)的低通域与带通域的频率频率变换关系
式(1)可写成式(3)的形式
其中,Pi(λ)和Qi(λ)分别为(n-i+1)和(n-i)阶归一化多项式,这两个公式表示为
其中,λ(i)zt(t=1,2,…,n-i+1)和λ(i)pq(q=1,2,…,n-i)分别是Pi(λ)和Qi(λ)的零点,且分别对应为单端口网络回路i的输入阻抗的零点频率和极点频率。根据散射参数与特征多项式关系,可得
由于另外一个端口短路,则S21(λ)=P(λ)/E(λ)=0,则P(λ)=0。至此滤波器特征多项式信息E、F、P信息已经全部获得,应用经典的矩阵综合理论可求出初始耦合矩阵M。由于此时的初始耦合矩阵与实际的滤波器拓扑结构并不对应,需要对初始耦合矩阵进行拓扑优化。
1.2 耦合矩阵拓扑优化
应用经典耦合矩阵综合理论得出的耦合矩阵形式如式(5)所示
其中,;R1和R2是终端阻抗;Ji和Jj表示主对角线上矩阵元素;整个矩阵阶数为(N+2)×(N+2)阶,N表示滤波器的阶数。
拓扑优化的目标函数,如式(6)所示
其中,。λ表示原耦合矩阵本征值向量;表示待优化耦合矩阵本征值向量;λp表示完整耦合矩阵的本征值;表示删掉第一行和第一列后形成的下三角矩阵的本征值;表示删掉最后一行和最后一列后形成的上三角矩阵的本征值;表示待优化耦合矩阵相应的本征值,含义类似。为加快目标函数收敛,采用数值梯度就能得到良好的收敛效果。
2 仿真算例
算例1滤波器的谐振频率10.5 GHz,相对带宽0.1,回损耗20 d B。根据矩阵综合法[6]得到滤波器的理论耦合系数k12=k34=0.091 1,k23=0.07,外部Q值为9.332,4个谐振腔都谐振于10.5 GHz。在AWR软件中建立电路仿真模型,无载Q值设为1 000可较好的模拟大损耗情况。图1所示的是终端短路后的反射系数相位曲线。
算例2为了对比严重失谐状态对提取效果的影响,电路参数改为k12=0.132 5、k23=0.095 7、k34=0.034 8,外部Q值改为3.425 3,谐振腔的频率也依次改为[9.847 210.234 510.876 311.032 1]GHz。图2所示为严重失谐情况下终端短路后的反射系数相位曲线。
表1是应用本文方法提取数据与理论数据的对比结果。在大损耗假设情况下,对比了正常谐振和严重失谐振两种情况下的提取精度,从对比数据中可看出提取数据最大误差不超过0.15%,本文算法精度稳定,满足工程设计需求。
3 结束语
本文详细地推导滤波器的特征多项式与谐振频率以及零极点的函数关系,编程实现了提取算法,并将该算法成功应用到滤波器的参数提取中。分析结果表明,对大损耗和严重失谐的滤波器,该算法依然有效。此外,该技术还可推广应用到滤波器的工程辅助设计和加工调试中,为工程设计提供了参考。
摘要:传统基于优化理论的耦合系数提取方法依赖于繁琐的优化程序,耗时长且收敛效果无法保证。对此,提出一种快速的耦合系数提取方法。该方法从单端输入阻抗的零极点角度进行分析,推导出滤波器的特征多项式与谐振频率与零极点的函数关系,并采用Matlab语言编程实现了耦合系数提取算法。应用该算法对4阶切比雪夫滤波器的耦合系数进行了提取分析,提取结果与理论结果吻合良好,证明了该方法的正确性和有效性。
关键词:散射参数,滤波器,耦合系数,阻抗匹配,无源器件
参考文献
[1]Li G,Dai X W,Liang C H.Fast synthesis of coupled resonator filters[J].Journal of Electromagnetic Waves and Applications,2008,22(5):705-714.
[2]Meng W,Wu K L.Analytical diagnosis and tuning of narrowband multipled resonator filters[J].IEEE Transactions on Microwave Theory and Techniques,2006,54(10):3765-3771.
[3]Meng W,Wu K L.An analytical approach to computer-aided diagnosis and tuning of lossy microwave coupled resonator filters[J].IEEE Transactions on Microwave Theory and Techniques,2009,57(12):3188-3195.
[4]Giuseppe M.Extraction of unloaded Q and coupling matrix from measurements on filters with large losses[J].IEEE Microwave and Wireless Components Letters,2010,20(6):307-309.
[5]胡旭,李刚.基于单端输入阻抗零极点的耦合系数提取方法[J].湖北文理学院学报,2015,36(8):19-22.
[6]李刚.基于Y参数的快速滤波器设计方法[J].电子科技,2014,27(11):113-116.
[7]李刚.等效电路模型方法在滤波器设计中的应用[J].电子科技,2014,27(10):185-188.
[8]Cameron R J.Advanced coupling matrix synthesis techniques for microwave filters[J].IEEE Transactions on Microwave Theory and Techniques,2003,51(1):1-10.
[9]Koziel S,Bandler J W.Space mapping with multiple coarse models for optimization of microwave components[J].IEEE Transactions on Microwave Theory Technology,2008,18(1):1-3.
快速提取 篇5
关键词:无源雷达,调频广播,变步长最小均方,直达波抑制,快速傅里叶变换
0 引言
近年来, 国内外正在进行无源雷达的研制, 这种雷达系统利用调频广播、电视等民用信号作为非合作照射源[1], “静默”接收飞机、导弹等飞行器目标的微弱反射信号, 再进行直达波干扰抑制及目标特征参数估计, 以完成目标定位及跟踪。由于民用辐射源具有工作频率低、频率覆盖广、发射功率大等特点, 大大提高了无源雷达在抗干扰、抗低空突防、抗反辐射导弹和反隐身等方面的性能[2]。
为了加快收敛速度, 本文提出了新的变步长公式, 并设计了基于变步长最小均方 (Least Mean Square, LMS) 算法[3⁃4]的自适应直达波干扰 (Direct Path Interference, DPI) 抑制[5⁃6]系统。为了提高雷达系统实时性能, 采用快速傅里叶变换 (Fast Fourier Transform, FFT) [7]方法计算互模糊函数, 以快速准确进行目标特征参数提取。
1 基于变步长LMS算法的自适应直达波干扰抑制系统
相对于直达波干扰来说, 目标回波具有因目标运动引起的较小的多普勒频移。因为调频广播是带宽信号, 目标回波与直达波干扰频谱混叠严重。另外, 由于传输距离较远及目标散射等原因, 目标回波强度一般比直达波信号强度小很多。使用经典滤波器很难有效滤除直达波干扰, 所以本文设计了基于变步长LMS算法的自适应直达波干扰抑制系统。
系统包括两个通道:目标通道和参考通道, 如图1所示[8]。目标通道接收受到直达波干扰污染的目标回波:d (n) =s (n) +u0 (n) , 其中s (n) 为目标回波, u0 (n) 为直达波干扰;参考通道接收信号为x (n) =u (n) , 其中u (n) 是与u0 (n) 同源的直达波信号。
自适应滤波器输出信号为:y (n) =xT (n) W (n) , 其中, W (n) 是自适应滤波器权系数向量。
系统输出误差为:e (n) =d (n) -y (n) 。
自适应滤波器权系数迭代公式为:
W (n+1) =W (n) +2μ (n) e (n) x (n) (1)
式中μ (n) 为收敛因子。系统在开始收敛或受到干扰时误差较大, 需要有较大的收敛因子以加快收敛速度;趋近稳定时, 需要有较小的收敛因子以保证较小的稳态误差[9]。所以本文引入了变步长公式:
LMS算法的收敛条件是:0<μ (n) <1λmax, 其中λmax为x (n) 自相关矩阵的最大特征值。
因为s (n) 与u0 (n) -y (n) 不相关, 系统输出均方误差为:
若系统收敛到最小均方误差ξmin, 则E[u]0 (n) -y (n) 2最小, 也即y (n) 是噪声u0 (n) 的最佳估计, e (n) 是目标回波s (n) 的最佳估计。
2 基于变步长LMS算法的自适应直达波干扰抑制系统仿真
调频广播选用载频为107.4 MHz峰峰值为1 V的余弦波, 调制信号采用频率为15 k Hz峰峰值为1 V的余弦波, 调制度为5, 则带宽为180 k Hz, 所以调频广播属于典型的高载频窄带宽信号。若直接进行乃奎斯特采样, 则采样频率至少为200 MHz, 将会对实时信号处理带来很大困难。为降低采样频率, 采用窄带采样定理[10]:对于载波频率为f0, 双边带宽为2B的窄带信号而言, 若存在x≥B, 满足 (f0+x) 2x=2k+1, k为非负整数, 那么存在欠采样频率fs=4x, 用采样频率fs对载频为f0的信号采样, 等价于把载频为f0的信号混频到中频x上。根据窄带采样定理, 选用欠采样频率最小值0.8 MHz, 等价于把载频为107.4 MHz的调频信号混频至中频0.2 MHz处。
若参考天线接收的直达波记为u (t) , 则理想目标回波s (t) 可以表示为[11]:
式中:k1为衰减系数, 取值;τd为目标回波相对直达波的时延, 取值0.000 04 s, fd为多普勒频移, 取值1 k Hz。自适应滤波器阶数取值M=2, 初始步长为0.001 2, 收敛因子μ (n) 参数取值为a=0.25, b=0.004, c=0.02。仿真结果如图2所示。
图2 (a) 为受到直达波干扰污染的目标回波频谱图, 直达波中频出现在0.2 MHz, 验证了窄带采样定理。幅值较小的目标回波仅具有1 k Hz的多谱勒频移, 与直达波干扰频谱混叠严重。图2 (b) 为重建后的目标回波频谱图, 与图2 (a) 比较可知, 幅值较大的直达波干扰得到有效滤除, 目标回波得到较好重建。为了便于比较, 图2只画出中频附近频谱, 其他位置频谱情况与此外类似, 不再累述。
图3为直达波干扰抑制后的目标回波与理想目标回波时域差值图, 其中上方蓝线为定步长收敛过程, 在800点左右趋于稳定;下方红线为变步长收敛过程, 初始收敛因子与定步长收敛因子相同, 在300点左右已趋于稳定。可见在稳态误差相同的前提下, 变步长LMS算法具有更快的收敛速度。
综上, 基于变步长LMS算法的自适应直达波抑制系统能够快速有效滤除直达波干扰, 工作性能良好。
3 基于互模糊函数的FFT计算方法的联合时频估计
无源雷达目标定位需要估算目标回波的时延及多普勒频移等参数。目前, 常用互模糊函数进行时延和多普勒频移的联合估计, 互模糊函数定义为[12]:
式中:u (t) 为直达波;s (t) 为目标回波;Ta为积分总时间。显然, 在式 (5) 中, 当τ=τd且f=fd时, 互模糊函数将出现最大值:
即可以通过计算互模糊函数最大值来估计时延τd和多普勒频移fd。设采样点数为N, 采样周期为T, 积分总时间为Ta=NT, 则式 (5) 可以离散化为:
然而, 若直接计算式 (7) , 运算量很大, 难以满足雷达系统的实时性要求。为降低运算量, 以提高系统实时性能, 式 (7) 可以应用FFT方法进行计算:
若取Nf=N, 按式 (7) 直接计算, 需要的复数乘次数为:
若应用FFT方法, 按式 (8) 进行运算, 需要的复数乘次数为:
设时延取值点数为Nτ=64, 为便于FFT计算, 采样点数取值为N=216, 217, ⋯, 225, 则互模糊函数的两种算法的复数乘次数比较结果如图4所示。
图4中, 上方红色圆圈画线为直接计算所需的复数乘次数;下方蓝色三角画线为利用FFT算法所需的复数乘次数, 与直接计算相比, 复数乘次数降低了4个数量级左右。显然, 采用FFT算法大大降低了运算量, 提高了系统的实时性能。
然后, 设采样点数为N=218, 利用FFT方法计算互模糊函数最大值, 以估计时延及多谱勒频移, 仿真结果如图5所示。
图5 (a) 是互模糊函数图对应的时间轴剖面图, 可见互模糊函数最大值对应的时间为0.000 04 s, 与时延参数仿真设置值一致。图5 (b) 是互模糊函数图对应的频率轴剖面图, 可见互模糊函数最大值对应的频率为1 k Hz, 与多谱勒频移参数仿真设置值一致。说明通过互模糊函数的FFT计算方法能够快速准确进行时延及多谱勒频移估计。
4 结论
本文选用载频为107.4 MHz, 带宽为180 k Hz的调频广播作为无源雷达非合作照射源, 属于典型的高载频窄带宽信号, 采用窄带采样定理, 使无失真采样频率降为0.8 MHz, 给实时信号处理带来了便利。针对较强的直达波干扰, 设计了基于变步长LMS算法的自适应直达波干扰抑制系统。仿真表明, 与定步长800点收敛位置相比, 系统能以300点收敛位置更加快速有效滤除直达波干扰。针对直接计算互模糊函数计算量太大问题, 本文采用FFT方法, 与直接计算相比, 复数乘次数降低了4个数量级左右, 大大提高了雷达系统的实时性能。最后, 利用FFT方法计算互模糊函数最大值, 多普勒频移及时延均估算正确, 为目标定位及跟踪奠定了良好的数据基础。
参考文献
[1]宋杰, 何友, 蔡复青, 等.基于非合作雷达辐射源的无源雷达技术综述[J].系统工程与电子技术, 2009, 31 (9) :2151-2156.
[2]范梅梅, 廖东平, 丁小峰.基于北斗卫星信号的无源雷达可行性研究[J].信号处理, 2010, 26 (4) :631-636.
[3]彭秀艳, 门志国, 王冠, 等.变步长LMS算法相空间重构的AR模型预报仿真[J].计算机仿真, 2013, 30 (1) :28-31.
[4]张晓娟, 吴长奇.使用变步长频域LMS算法的自适应Volterra均衡器[J].电路与系统学报, 2012, 17 (4) :99-102.
[5]李辉, 何友, 周洪庆, 等.外辐射源雷达系统中直达波干扰抑制技术[J].火力与指挥控制, 2013, 38 (2) :145-149.
[6]王卫国, 董绪荣.一种基于多路径对消的直达波干扰抑制算法研究[J].装备指挥技术学院学报, 2011, 22 (3) :90-94.
[7]胡广书.数字信号处理理论、算法与实现[M].3版.北京:清华大学出版社, 2012.
[8]HOWLAND P E, MAKSIMIUK D, REITSMA G.FM radio based bistatic radar[J].IEE Proceedings Radar, Sonar and Navigation, 2005, 152 (3) :107-115.
[9]沈磊, 姚善化.改进变步长LMS算法及在自适应噪声抵消中的应用[J].噪声与振动控制, 2010, 30 (5) :60-63.
[10]宋勇辉.基于调频广播信号的无源雷达[D].南京:南京理工大学, 2003.
[11]ZOELLER Christopher Lee.A passive, coherent radar using commercial FM broadcast signals[D].Huntsville, USA:The University of Alabama in Huntsville, 2002.
快速提取 篇6
图像的骨架指的是图像中央的骨骼部分,由于骨架能够保持物体本身的拓扑结构信息,因此骨架一般被用于图形的匹配和相似性度量,尤其是线条类骨架的提取在当代精准农业中起着至关重要的作用。作物行骨架提取是线条类骨架提取的一种,是农业机械实现精准施药的基础。本文采用的形态学细化算法的基本思想是在给定具有一定形状的形态学算子模板( 结构区域) 后,依次删除二值图像中的边缘像素,最后仅提取一个像素宽度的过程。
随着时代的不断发展,关于骨架提取算法的研究越来越多,理想细化后的骨架应位于原始纹线的中间位置,且能保持该骨架的连通性和拓扑结构。1967年,Blum[1]提出了关于骨架中轴的概念,通过寻找形状轮廓的对称轴来获得形状骨架。赵春江等[2]提出了一种具有鲁棒性的骨架提取方法。万雅娟等[3]利用改进的骨架点判断算法迭代生长出完整的三维模型骨架,算法复杂度低、计算效率高。以上算法虽然都能提取出目标骨架,但这些理论上可行的算法在应用于实际农田作物行时其适应性和精准度都不能满足精准施药系统的要求。而本文提出的算法弥补了传统算法中背景单一、对噪声的敏感性差等缺点,保证了骨架线的连续性和单一性。实验结果表明: 该算法不仅能保持自身良好的拓扑性和稳定性,而且还具有较强的抗干扰能力和适应性。
1 骨架提取算法
1. 1 算法流程框图
利用数学形态学进行骨架提取主要源于形态学运算中的击中/击不中数学变换,即给定具有一定形状的结构元素后,顺序循环地删除满足击中变换的像素[4,5,6]。本文提出的作物行骨架提取算法以形态学细化算法为基础,通过引入邻接像素概念及识别伪分支骨架的方法消除了冗余像素,得到了圆滑、单一、无毛刺的作物行骨架,提高了精准施药机械导航线识别的精准度。提取骨架线的流程如图1 所示。
1. 2 改进的形态学细化算法
为后续方便解释,本文预先给出几个概念,并进行说明。
1) 目标像素和背景像素: 目标像素是指图像二值化后对应的像素值为1 的点; 背景像素则相反,是指图像二值化后像素值为0 的点。
2) 8 邻域像素: 是指与图像中任一目标像素周围相邻的8 个像素,如图2 所示; 目标像素O的8 邻域像素为Oj( 1≤j≤8) 。
3) 邻接像素数: 目标像素O的邻接像素数可用以下公式表示
其中,O9= O1; 当像素Oj= 1 时,Nj= 0,否则,Nj=1。
细化处理是指把具有一定面积区域的图像二值化以后,在不影响骨架线连通性和拓扑结构的基础上,依次删除边界像素,直至骨架线为单像素宽度为止[7,8,9]。本文改进后可以描述为: 在一幅图像中的3× 3 的区域中,目标像素O位于中心位置,若目标像素O的值为1 ( 即黑点) ,当目标像素O满足以下条件:①; ② N = 1; ③O1O3O5= 0 或邻域像素中O3的邻接像素数不为1; ④O3O5O7= 0 或邻域像素中O5的邻接像素数不为1。
这时删除目标像素O( 即O = 0) ,依次对图像中的每一点都进行扫描,删除满足以上4 个条件的像素,直到图像中的点都不可删除为止; 这时保留的骨架线宽度为一个像素。但与此同时,细化后的骨架线也会保留一些冗余分支,因此还需要相应的处理。
1. 3 伪分枝剔除
伪分枝骨架是指作物行细化处理后不在主干线上的骨架,一般细化后的骨架都会存在冗余小分枝( 即伪分枝骨架) ,进一步消除细小毛刺及伪分枝骨架是提高细化和自动导航准确率的关键。要想去除伪分支首先要识别伪分支骨架,本文采用通过识别端点和节点的方法找分支骨架,然后通过端点与节点合并删除从端点到节点所经过的像素,这样很容易就得到了无毛刺、圆滑的作物行骨架线。步骤如下:
1) 识别细化后的作物行骨架线的端点和节点。判断邻接像素数N,当N = 1 时表示该像素点为端点,当N≥3 时,该像素点为节点。从细化后的作物行图像左下角开始扫描作物行骨架线,检测每个像素点的邻接数,寻找符合邻接像素数N = 1 和N≥3 的像素点。
2) 从任一个端点的位置出发,逆时针扫描该端点的8 邻域像素,当该端点的8 邻域像素只有1 个值为1 的像素时,继续追踪该值为1 的像素并逆时针扫描其8 邻域像素,判断该像素点值为1 的个数( 即该像素点N的个数) 。如果N≥3 停止追踪,其所经过的像素点为该条追踪线的伪分枝骨架; 如果N = 2,则继续追踪,直到遇到下一个端点或节点结束这条线的追踪。结束追踪后其相应节点的N值减1 并将追踪过的像素点都置为背景色( 即将其值置为0) 。
3) 遍历整个作物行骨架线,逐次删除伪分支骨架,直至所有骨架点的邻接像素数N = 2 结束操作,剔除完成。
2 算法详细步骤
2. 1 作物行图像的预处理( 步骤1)
1) 图像的灰度化处理。从大田环境下采集到的作物行图像是彩色RGB图像,如图3 所示。为了更好地让作物行从背景中突显出来,依据作物行本身具有的特点,本文采用常用的过绿灰度化处理方法[10,11,12]对其进行灰度化处理。由于传统的过绿特征算法处理的图像带有很大的背景噪声( 见图4) ,干扰对目标点的处理。因此,本文在此基础上对该方法进行了改进,改进后的算法为
其处理结果如图5 所示。比较发现,采用改进的算法其噪声明显减少且作物行与背景有了明显的区分,对后续进行滤波操作节省了不必要的麻烦。
2) 中值滤波处理。由于灰度化处理后的图像仍然存在背景噪声的干扰,所以本文采用3 × 3 的滤波窗口对其进行中值滤波操作。经实验发现,当滤波次数设定为2 次时滤波效果最好,如图6 所示。
3) 二值化处理。由于本文采用的形态学细化方法只能处理二值化图像,因此在提取作物行的骨架前将滤波处理后的灰度图转化为二值化图像是形态学骨架算法能够顺利进行的基础。结合常用的阈值分割算法的优缺点,本文选取能自动设定阈值的OTSU算法对其进行二值化处理,减少了传统算法中凭经验设定阈值带来的麻烦。经二值化后的作物行图像仅含有黑白两种颜色。
2. 2 作物行轮廓提取( 步骤2)
在农田采集到的玉米作物行图像经滤波处理后虽然噪声大大减少,但行间还存在着少许相对于作物行面积较小噪声,影响对目标点的处理,所以在对作物行进行骨架提取操作前先提取作物行的轮廓图像。本文结合形态学中的腐蚀和膨胀两种运算对二值图像进一步处理。其中,选用3 × 3 的模板结构元素对其进行腐蚀、膨胀运算,膨胀操作可以增加作物行的有用面积,而腐蚀操作则可以使作物行向其中心靠拢,处理后的结果如图7 所示。从图7 中可以看出: 作物行的行线已经基本能显示其走向。
2. 3 作物行骨架提取( 步骤3)
1) 利用形态学细化算法对作物行轮廓图像进行细化处理。
2) 采用上述伪分枝骨架剔除方法从端点开始追踪寻找冗余伪分枝像素,进一步消除细小毛刺及伪分枝骨架。
经过上述3 个步骤最终可以提取出光滑、无毛刺的作物行骨架。
3 骨架提取算法的实现
3. 1 实验结果
本研究采用维视数字图像技术有限公司生产的型号为MV - VD030SM /SC的USB2. 0 接口的CCD工业数字相机及艾菲特光电技术有限公司生产的型号为AFT - 0641MP的工业镜头对田间自然环境下的作物行图像进行采集,用于图像处理的设备是一台配置为Intel( R) Core( TM) i3,3. 1GHz,2G内存的计算机,并以WIIN7 系统下Microsoft Visual C + + 6. 0 为试验平台,基于MFC应用程序框架对作物行骨架提取算法进行研究和开发。图片输出为8 位RGB彩色图像,相机离地面的拍摄高度为1. 5m,且与水平面成30°夹角。
下面以田间自然环境下采集到的4 幅数字图像为例对本文提出的算法进行效果验证,其各自的仿真结果如图3 ~ 图10 所示。其中,图3 中( a) ( b) ( c) ( d)分别为韭菜、玉米、小麦、蒜苗的作物行原图像,图4 ~图8 分别是与( a) ( b) ( c) ( d) 相对应的处理结果图像。图9 和图10 分别为采用拓扑细化法和最大圆盘骨架提取法提取出的作物行骨架图。经仿真结果比较,本文算法提取的骨架线圆滑、单一,且该算法受冗余分枝骨架的影响较小,实验结果与算法分析一致。
3. 2 误差分析
为了更好地体现作物行的走向,本文采用Hough变换[13,14,15,16]将其骨架线拟合成直线,并对其进行偏差分析和计算。实验所得的误差分析数据如表1 所示。表2 是本文算法与拓扑细化算法和最大圆盘骨架提取算法的比较表。
从表2 中可以看出: 拓扑细化法得到的骨架对边界噪声非常敏感,容易产生较多的冗余分支,且骨架的位置不是准确地靠近物体的中心,产生的误差也最大; 而最大圆盘骨架提取不能很好地保持作物行骨架的连续性,本文提出的算法克服了两者的缺点,算法能够保证所抽取出的骨架具有连通性以及良好的拓扑不变性,且误差也较小。
cm
4 结论
快速提取 篇7
种子DNA的提取通常采用CTAB法与SDS法, CTAB和SDS都是一类离子去污剂, 能够裂解细胞释放DNA, 并与提取液中的EDTA共同保护DNA免受内源核酸酶的降解[7]。Yoshihashi等[8]用磨碎的谷粒提取了水稻基因组DNA。田苗苗等[9]将SDS与CTAB法相结合提取了单粒大豆种子基因组DNA。郭景伦等[10]探索了从玉米单粒种子提取DNA的新方法。该文采用砂生槐单粒种子为试验材料, 并针对砂生槐种子富含蛋白质成分这一特性, 得出一种快速有效的DNA提取方法, 为后续更进一步的研究提供基础。
1 材料与方法
1.1 材料
该试验在西藏自治区高等学校重点实验室生物技术实验室中进行。砂生槐种子采于西藏自治区拉萨市, 置于-80℃保存。所用试剂有琼脂糖、CTAB、SDS、DTT、PVP、苯酚、Tris、10×Taq酶配套缓冲液、dNTP、MgCl2、Taq酶、引物等购自上海生工生物有限公司, 其余试剂为国产分析纯。仪器有凝胶成像系统 (北京六一仪器) 、核酸蛋白测定仪 (Eppendorf BioPhotometer plus) 、移液器 (Eppendorf) 、电泳仪 (Bio-Rad) 、琼脂糖水平电泳槽 (北京六一仪器) 、超速冷冻离心机 (Eppendorf) 和PCR仪 (Bio-Rad) 等。
1.2 方法
1.2.1 基因组DNA提取
(1) 传统方法提取砂生槐种子DNA:取一粒砂生槐种子, 用镊子剥去种皮后置于干净的研钵中, 加入500μL 65℃预热的提取缓冲液[11] (0.1 mol·L-1 Tris-HCl, 0.025mol·L-1 EDTA, 1 mol·L-1 NaCl, 2%CTAB, 3%PVP, 2%DTT) 进行研磨, 转移至1.5mL离心管中65℃水浴40 min, 期间不时颠倒混匀;稍冷却后, 加入500μL氯仿/异戊醇 (24∶1) , 震荡混匀, 于4℃环境12 000r·min-1离心10min;取上清, 加等体积-20℃预冷的异丙醇, 于-20℃静置30min;4℃, 14 000r·min-1离心20min, 倒掉上清, 用70%乙醇洗涤2次, 风干后溶于50μL TE (0.01 mol·L-1 Tris-HCl, pH8.0, 0.01mol·L-1 EDTA, pH8.0) 。平行提取3次。
(2) 快速提取砂生槐单粒种子DNA:取一粒砂生槐种子, 用镊子剥去种皮后置于干净的研钵中, 加入250μL氯仿快速研磨, 转移至1.5 mL离心管中, 加750μL 65℃预热的提取缓冲液 (0.1mol·L-1 Tris-HCl, 0.1 mol·L-1 EDTA, 0.5mol·L-1 NaCl, 1.5%SDS, 3%PVP, 2%DTT) , 颠倒混匀后65℃水浴5 min, 稍冷却后, 12 000r·min-1, 4℃离心2min;取上清, 加等体积的无水乙醇 (-20℃预冷) , 轻轻颠倒混匀, 12 000r·min-1, 4℃离心5 min后, 弃上清, 沉淀用70%乙醇洗涤, 风干后溶于50μL TE。平行提取3次。
1.2.2 基因组DNA提取结果检测
(1) 紫外分光光度法检测:取2μL DNA提取液稀释100倍, 以TE作为空白对照, 利用核酸蛋白测定仪测得DNA样品的浓度, 以及在波长260和280nm处的吸光值, 通过其比率可以判断DNA的纯度及提取效果, 同时可根据浓度计算出DNA提取的得率。 (2) 琼脂糖凝胶电泳检测:配制0.8%的琼脂糖凝胶, 在TBE缓冲液中以80V的电压电泳1.5h, 并用凝胶成像系统进行拍照。 (3) RAPD-PCR扩增检测:10×Taq Buffer、2mmol·L-1Mg2+、0.2 mmol·L-1 dNTPs、1.0 U Taq酶、30ng快速方法提取的砂生槐种子DNA模板、0.2μmol·L-1 RAPD随机引物 (引物序列见表1) 的25μL反应体系, 进行3次平行PCR扩增。扩增程序为:94℃预变性5 min;94℃变性1min, 36.9℃/41℃退火45s, 72℃延伸1 min, 35个循环;72℃延伸10min。扩增结果用1.6%的琼脂糖凝胶在TBE缓冲液中以110 V的电压电泳45min, 并用凝胶成像系统进行拍照。
2 结果与分析
2.1 DNA浓度和纯度
从表2及图1均可以看出, 用传统方法提取得到的种子DNA浓度及得率普遍大于快速提取法, 但是纯度相对较低, OD260/OD280为1.04~1.17。而用改进方法提取得到的DNA质量得到提高, OD260/OD280为1.34~1.56。同时, 从图1也能得知, 传统方法由于耗时长、提取液中成分单一, 使得一些糖类等物质仍有大量残留, 部分DNA因粘连而滞留在点样孔, 同时提取所得DNA有部分降解, 呈现弥散条带;而快速提取法由于提取液的配方有所改进, 并且各个步骤操作快捷, 即使DNA浓度略低于传统方法, 但降解少, 能够完整地保存DNA样品。
M:λMarker;泳道1, 2, 3:传统方法提取所得砂生槐种子DNA;泳道4, 5, 6:快速提取法所得砂生槐种子DNAM:λMarker;1, 2, 3:DNA extracted by traditional method from single seed of Sophora moorcroftiana;4, 5, 6:DNA extracted by rapid method from single seed of Sophora moorcroftiana
2.2 快速法提取DNA的RAPD检测结果
从图2看出, 快速法提取的砂生槐种子DNA使用3种RAPD引物均可进行PCR扩增, 且每个引物进行3次平行扩增的电泳图谱基本一致, 条带清晰明亮。此外, 每粒砂生槐种子的质量只有25~30mg, 就可以得到明显的检测结果, 说明改进方法具有高效的优点, 并且所得DNA浓度适中, 质量可靠, 具有较高的重复性, 适于后续操作。
M:λMarker;泳道1, 2, 3:使用引物RAPD1得到的3次平行扩增结果;泳道4, 5, 6:使用引物RAPD2得到的3次平行扩增结果;泳道7, 8, 9:使用引物RAPD3得到的3次平行扩增结果M:λMarker;1, 2, 3:RAPD-PCR amplification of DNA with primer RAPD1;4, 5, 6:RAPD-PCR amplification of DNA with primer RAPD2;7, 8, 9:RAPD-PCRamplification of DNA with primer RAPD3.
2.3 提取时间
表3列出了两种不同的提取方法在各阶段所用的时间, 能够很明显地看出, 改进的快速提取方法不仅在耗时最多的水浴保温过程中省去了大量的时间, 并且操作便捷, 在各个操作过程中都较传统方法省时, 节约大量时间。虽然各个反应步骤的简化使得DNA的浓度及得率略低, 但仍能满足需要, 并且在短时间内提取到更加纯净的DNA。就实际操作而言, 传统方法提取DNA需要近2h, 而用快速提取方法得到DNA在20min内即可完成, 大大提高了DNA的提取效率。该方法便于操作, 适用于大量材料的提取。
3 结论与讨论
试验证明, 改进方法较传统提取方法更加快捷, 且能得到更加纯净的DNA, 便于进行大量砂生槐种子DNA的同时提取。
改进的提取方法法中, 在研磨种子时提前加入了氯仿, 使得蛋白质和DNA酶在加入提取液之前就变性失活, 尽可能地减少DNA降解, 同时增加提取缓冲液的用量及EDTA的浓度, 可以大量地螯合Ca2+和Mg2+, 使残余的DNA酶失活。此时, 即使减少与缓冲液混合的保温时间和后续的离心时间, 也可以尽快地使DNA解离出来而不被降解, 这也是改进后的提取方法与传统方法相比最大的优势。该提取方法操作简便, 节约时间, 并且可以得到高质量的DNA, 可做为大量提取砂生槐种子DNA非常实用的方法。
有研究表明, 砂生槐种子蛋白质含量高达30.06%[12], 针对这种蛋白质含量较高的实验材料, 改进方法中提前加入了氯仿, 所以在提取缓冲液保温后没有再次使用氯仿/异戊醇进行抽提, 若要更加彻底地除去蛋白质类杂质, 可在提取缓冲液保温后进行一个等体积氯仿/异戊醇 (24∶1) 的抽提处理, 这样, 残留的蛋白质也会更彻底地除去, 可为后续试验提供更优质的DNA模板。
快速提取 篇8
1 材料和方法
1.1 主要仪器
可见紫外分光光度计(UV-2501日本岛津)、凝胶图像分析系统(SensiAnsys上海培清科技有限公司)、电泳仪(北京六一仪器厂)、扩增仪(little genius杭州大和热磁电子有限公司)。
1.2 试剂
1.2.1 来源
Tris-cl、冰醋酸、乙酸钾、异丙醇、75%酒精和EDTA等试剂由北京鼎国生物技术有限责任公司提供,试剂纯度为AR级。β-globin内参试剂盒由上海吉玛制药技术有限公司提供。
1.2.2 配制
红细胞裂解液:20 mmol/L tris-cl(pH7.6);白细胞裂解液:10 mmol/L tris-cl(pH8.0)、1 mmol/L EDTA(p H8.0)、0.1%(m/v)SDS;乙酸钾溶液:溶液中钾离子浓度3 mol/L、乙酸根浓度为5mol/L。上述溶液经双蒸水分别配制。
1.3 方法
1.3.1 白细胞收集
向1.5 m L的离心管中分别加入900μL红细胞裂解液和300μL EDTA抗凝血,混匀,室温孵育5 min,在此期间颠倒离心管10次。13 000 r/min离心30 s,弃上清液,留可见白细胞沉淀层和10~20μL的残液,震荡混匀,制成白细胞悬液。
1.3.2 白细胞裂解及DNA收集
加入300 uL白细胞裂解液至悬液中,快速震荡25 s,裂解白细胞。加入100μL乙酸钾溶液,震荡30 s,13 000 r/min离心5 min。将上清液转移至装有300μL异丙醇的离心管中,颠倒离心管约50次,13 000 r/min离心2 min,弃上清液。加入700μL 75%乙醇,颠倒数次,13 000r/min离心1 min,弃净上清液。空气中敞口挥发5min左右,待残液完全挥发,加入50μL双蒸水溶解,即可用于分子生物学实验。
1.4 基因组DNA的鉴定
1.4.1 琼脂糖凝胶电泳
取上述溶解好的基因组DNA 2μL,加8μL电泳缓冲液,于1.5%琼脂糖凝胶120 V电压下电泳1 h,在凝胶图像分析仪下观察。
1.4.2 纯度、产量计算
用可见紫外分光光度计测定DNA样本的OD260、OD280值,纯度以A260 nm/A280 nm为依据,产量计算公式DNA(μg/m L)=OD260值×50×N(N为稀释倍数)。
1.4.3 DNA体外扩增
以本法提取的4个临床样本基因组DNA进行管家基因(β-globin)体外扩增,引物序列为:G1:5'-CAACTTCATCCACGTTCACC-3';G2:5'-GAAGAGCCAAGGACAGGTC-3'),扩增片段大小为268 bp。总反应体系25μL,其中模板2μL,设阴、阳性对照。扩增程序为:94℃、2 min;94℃、30s,54℃、60 s,72℃、60 s,35个循环;72℃、5 min。
2 结果
2.1 基因组DNA琼脂糖凝胶电泳
可见条带位置一致、较亮、无拖尾现象,条带大小10~13 kb,结果如图1示。DNA纯度和产量如附表示。
2.2 DNA体外扩增
临床样本、阳性对照扩增电泳图清晰,位置一致,阴性无条带,如图2示。
M:13 kb DNA分子量标准带;1~4:提取的基因组DNA
1~4:提取的基因组DNA体外扩增电泳条带;-、+:阴、阳性对照。M:2 000 bp DNA分子量标准带
注:经可见紫外分光光度计分别测定样品在260 nm、280 nm处吸光度值,其比值在1.82左右,根据OD260值,计算产量在19.0~37.0μg/m L之间。
3 讨论
基因组DNA传统提取方法一直是耗时和繁杂的过程,且大量使用有机溶剂。现在虽有很多快速提取方法,但大多使用新型材料,如用玻璃粉吸附法,成本高昂,难以满足临床批量需求,其他一些非有机溶剂法,如加热法和碘化钠法,效果也不是非常理想[3]。本法所用试剂常见,操作简便,整个过程在1h内完成。收集到的DNA产量、纯度经电泳观察条带清晰、无拖尾现象,与标准酚-氯仿法[纯度在(1.98±0.2)、产量在(22.6±0.3)][4]比较结果理想。扩增位于11号染色体上的管家基因(β-globin)显示提取的基因组DNA模板具有代表性,且模板中无抑制物存在,适合PCR扩增实验。β-globin表达于所有有核细胞,该方法经适当调整可用于分泌物标本模板的制备。
本法可通过溶液是否澄清判断细胞消化效果,通过加入乙酸钾后是否出现褐色块状沉淀及离心后溶液颜色判断蛋白去除程度,所以易于质量控制。值得注意的是在室温比较低时,应适当延长细胞消化时间以提高DNA产量。此外,由于提取对象为高分子量基因组DNA,易受机械损伤,故在DNA收集过程要避免剧烈震荡。
摘要:目的 建立一种快速的从少量全血中高效提取基因组DNA的实验方法。方法 首先低渗处理红细胞,收集白细胞,然后裂解白细胞释放核蛋白,在去污剂及乙酸钾的作用下使核酸与蛋白分离,最后沉淀、纯化DNA。扩增管家基因(β-globin)观察提取效果。结果 该法收集的DNA纯度(OD260/OD280)为(1.82±0.4);每毫升外周血可得DNA19.0~37.0μg,片段大小10~13kb;β-globin基因扩增电泳带清晰。结论 该法提取DNA简便、高效和经济,易于各级分子生物学实验室使用。
关键词:基因组DNA,提取,PCR
参考文献
[1]王龙武,石柯,彭爱红,等.一种快速微量外周血基因组DNA的提取方法[J].中国现代医学杂志,2004,14(2):70-72.[1]WANG LW,SHI K,PENG AH.A rapid and simple method for extracting human genomic DNA from peripheral blood[J].China Journal of Modern Medicine,2004,14(2):70-72.Chinese
[2]DAVID CLARK,著.胡珏,刘文颖,译.分子生物学[M].第2版.北京:科学出版社,2007:568-570.[2]DAVID CLARK,HU J,LIU WY.Molecular Biology[M].2nd ed.Beijing:Science Press,2007:568-570.Chinese
[3]闾宏伟,胡靖,袁洪,等.四种微量全血DNA提取方法的比较[J].中国医学工程,2004,12(5):43-45.[3]LU HW,HU J,YUAN H,et al.Comparing the four kinds of method to extract human genomic DNA from microsamples of whole blood[J].China Medical Engineering,2004,12(5):43-45.Chinese