非结构化问题

2024-07-17

非结构化问题(共8篇)

非结构化问题 篇1

0 引言

非结构化对等网 (peer to peer简称P2P) 是指网络上的计算机自主联接, 无需通过中心服务器, 点到点地相互提供资源与服务。P2P网络节点可以动态地加入与撤离网络, 而且每个节点共享的资源质量又可能有较大的差异, 节点的稳定性、计算能力等都应该纳入考量。早期非结构化的P2P网络搜索常采用洪泛法, 如著名的Gnutella网络。

Gnutella网络中的节点可以向它的所有邻居节点发出搜索请求 (query) , 这些邻居节点又向它的所有邻居节点传递搜索请求 (Query Hits) 。每个搜索包都有个TTL (Time to Live) 值, 搜索包每被转发一次, 其TTL值减1, 搜索包不断被转发, 找到指定资源或TTL=0。Gnutella网络中有两种节点, 普通节点与超级节点。超级节点用来发送消息广播, 并接受与其他超级节点交换信息。网络服务原语包括Ping (主动连接) 、Pong (响应连接) 、Query (搜索请求) 、Query Hit (传递搜索请求) 等。可以看到, 洪泛法没有用节点本身的信息来指导搜索, 带有很大的盲目性。网络负载大, 搜索效率不高。

本文将主要研究基于节点服务质量 (包括节点资源信誉度和节点能力信誉度) 的搜索算法, 该类路由问题可以归结为, 满足节点能力信誉度要求同时又满足查询资源相似度阙值的路径寻优。此类问题是一类NP-C问题, 本文将讨论上述约束条件下的P2P路由选择策略。

1 非结构化对等网络优化模型

目前相关研究较多地集中在P2P网络的资源搜索优化方面。如文献1在讨论蚁群算法在资源搜索方面的应用基础上, 提出一种“信息推荐”机制[1]。资源持有者定期地向其邻居节点 (或其他曾向该节点发出搜索请求的节点) 推荐其共享的资源信息。该方法在一定程度上减少了资源搜索的盲目性, 但这种“兴趣推荐”的机制势必增加网络负载。文献2在研究蚁群算法在P2P网络资源搜索方面的应用的基础上, 提出了信息素多样化的思想。为了防止不准确信息的误导, 该文中算法将搜索资源信息分类, 根据接受到的数据包在上一条中的文件类型选择本节点与其相似度最大的资源类型, 在根据“同类最优路径信息素在节点路由表里选择下一跳[2]。文献3提出建立共享资源与拓扑之间的统计关联, 在此基础建立一种新的基于层次化兴趣的拓扑形成模型, 研究的是应用蚁群算法解决P2P网络上的Qo S路由问题[3]。文献4从网络节点的可靠性 (“诚信度”) 来研究路由巡优问题。主要思想是通过交互节点的局部评价加权其推荐可信度来计算节点的全局信誉度值, 采用基于时间帧的方法更新节点的全局信誉度值和推荐可信度[4]。文献5从网络节点的“活跃程度”与“资源命中数”来估算下一个节点选择的概率, 一定程度上减少了冗余查询, 节省了网络带宽[5]。但单纯地考虑“活跃程度”有可能把查询包转到与查询资源请求不一致的节点上;另外笼统地用“资源命中数”也不足以表示与查询意图的一致性。

1.1 Gnutella模型

早期的非结构化P2P网络以Gnutella模型为代表。采用的就是洪泛协议。其路由算法简单有效, 基本思想是每个节点在第一次收到数据报文时, 都将其转发收到邻居节点上。若收到重复分组则直接丢弃。为了避免转发的报文占用过多的网络资源, 需要给每个报文设定合适的TTL值, 保证数据分组只经过有限次数转发。如图1所示, 其中A是源节点, G为目的节点, 现在节点A发出搜索请求q, 数据包分别发到其邻居节点B、C、D。当三个邻居节点收到该路由请求后, 同样将数据包转发给其所有的邻居节点, 此时D节点均收到分别来自于节点A、E和H发送过来的同一数据包, D将转发先到的数据包给其所有的邻居节点, 后到的数据相同的数据包将被丢弃, 如果在节点F、G、H都同由A点发出的查询请求中相近的共享资源, 但这三个节点的处理能力, 共享资源的“好”“坏”程度和源节点的查询要求都要在选择路由时加以考虑。

1.2 节点能力信誉度 (Node Credit)

在非结构化对等网中, 节点不受拓扑结构和中心服务器的限制, 可以自主地加入与撤离网络。有些节点稳定, 可以提供较好的服务质量, 有些节点计算性能较差或缺乏优质共享资源甚至传播恶意数据。因此可以用节点的能力信誉度来评价节点的“好”与“坏”。信誉度是某一节点依据与邻居节点的数据交换历史, 对其信任程度所做出的一种主观评判。比如节点v对节点u的评价可以定义如下:

其中Ei (v, u) 是节点v对节点u的第i次交互的评价满意度。n为交换次数。这样节点u的信誉值可以通过直接与其交互的节点对其的局部评价加权获得。

节点信誉度是一个评估时间的函数。设评估周期为T, 节点信誉度更新公式构造如下:

动态的更新节点信誉度可以更真实地模拟实际P2P网络中节点的动态变化情况。

1.3 资源信誉度

节点的资源信誉度取决于其共享资源的质量。而资源的质量又与搜索请求的关键字与资源相似度有关。一般资源的相似度可以如下定义。在P2P网络节点上提供优质资源的节点可能有多个。因此结合其他约束条件路由方案可以有不同的选择。

查询q的向量空间模型可以表示为 (w1, q, w2, q, …, wi, q, …, wt, q) , 其中wi, q表示关键字keyi在q中的权重。资源r可以表示为 (w1, r, w2, r, …, wi, r, …, wt, r) , 此时r与q的余弦相似度可以定义为:

相似度值为0~1之间的一个数。如果某个资源相似度大于设定的阈值, 可以认为r满足q。因此对于不同的请求q, 节点可以有不同的资源信誉度。笼统地考虑该节点的下载总量来度量节点的信誉度是没有意义的。对于请求q, 节点N的资源信誉度可取sim (r, q) 中的最大值。

2 算法讨论

2.1 节点能力信誉度

本文讨论的P2P网络不像Gnutella那样采用超级节点。这样网络环境更贴近真实的互联网环境。在各节点上, 本地资源信誉度可以在共享时指定有个[0 1]之间的一个初值。该值的更新可以定时进行或者由事件驱动进行评价更新。直接相邻的节点的信誉度采用事件驱动机制进行。当有节点加入网络时, 向其相邻节点发生共享资源的信誉度, 或者在节点之间互访时有Query Hit包反馈时, 更新邻居节点的某种资源信誉度。

2.2 资源搜索

用户搜索包Query中的关键字反映了用户的“兴趣”。兴趣向量 (w1, q, w2, q, …, wi, q, …, wt, q) 。可以构造兴趣搜索表来指定搜索, 如表1所示。

下面以图1为例, 说明本文算法。

搜索步骤如下:

步骤1:节点加入网络, 初始化信誉度表, 并与邻居节点交换数据。

步骤2:节点A发出搜索请求q, 设置TTL=3。首先根据其关键字key在本地资源列表中搜索, 如果没找到, 则根据该节点信誉度表, 依次向邻居节点B、C、D发出搜索请求。这里又分下面几种情况:

(1) 在缓冲区中没有某查询数据包, 并且收到的数据包TTL值不为0, 则向邻居节点转发数据包。

(2) 对于再次收到的相同的查询数据包, 直接丢弃。如果节点上邻居信誉度表里没有比本节点更好的节点, 则本节点作为待选节点, 与源节点建立下载链接。否则继续转发查询数据包。

(3) 对于TTL=0的查询数据包如节点H上收到来自源节点A的查询包, 直接丢弃。

步骤3:源节点在得到的三个资源节点F、G、H上根据查询约束条件择优选择路由。

各节点在时间周期驱动下, 动态更新邻居信誉度表。

3 结束语

本文提出一种基于节点服务质量的非结构化P2P网络的搜索算法。该算法由于采用动态的节点指标来指定路由选优, 减少了洪泛法的盲目性, 降低了网络流量负载。如果对资源进行“兴趣”分类与挖掘, 将可以更有效地指导路由优化, 这正是课题要继续研究的目标。

摘要:在非结构化对等网络资源搜索算法中, 多数着眼于网络负载和搜索效率方面, 节点本身的稳定性、计算能力、资源的优劣也应该是在搜索路由寻优中要考虑的重要因素。构造新的搜索算法, 通过量化节点的服务质量用于指导路由, 该算法简单易于实现。

关键词:非结构化对等网,节点服务质量,路由

参考文献

[1]李绍滋, 曹阳, 周昌乐.基于非结构化的P2P信息检索关键计算研究[J].智能系统学报, 2006 (2) .

[2]赵宏, 谢伟志, 张晨曦.基于蚁群算法的非结构化P2P搜索研究[J].计算机技术与发展, 2009 (2) .

[3]周晓波等.一种基于层次化兴趣的非结构化P2P拓扑形成模型[J].Journal of Software, 2007 (12) .

[4]陈作汉.直接评价节点诚信度的P2P动态信任模型[J].计算机工程与设计, 2011 (7) .

[5]李春秀等.一种有效的非结构化P2P网络资源搜索策略[J].计算机技术与发展, 2010 (11) .

非结构化问题 篇2

1、案例分析 案例分析就是让在有限的时间内模拟分析真实的案例问题。

案例分析与其他面试形式的最大区别就是它的实践性。

主试官向你提供有关一个特定问题的信息,由应聘者进行分析并给出结论。

应聘者的工作是基于提供给信息进行合理的假设,之后向主试官提出一连串逻辑性良好的问题,进一步收集信息,最后做出总结并提出建议。

大多数的`案例分析并没有某个特定的正确答案。

主试官希望通过观察分析案例的过程,测试应聘者的反应能力和创新能力。

如能想到主试官都想不到的解决方案,即使这个方案并不成熟,那么应聘者的表现也将属于最出色的。

为什么进行案例分析?近年来,招聘单位越来越重视面试过程的实践性,且希望在面试过程中实际模拟日常工作中的重要环节,以测试应试者的实际能力。

这种趋势迫使应试者在尽快时间内提高自己的全面素质。

举例来说,民生银行的招聘原则是“重文凭,不唯文凭”。

因为在他们看来,学历可以反映一个人知识的结构,但却无从考察他的实际工作能力。

民生银行在人行招聘考试中发现有这样一种倾向,往往考试成绩好的人,在实际工作中处理问题比较局限。

当然这未必是普遍规律,但这样的问题确实存在。

而有些人可能基础学历相对较低,但应变能力,开拓业务能力却很强。

基于此,民生银行非常看重应试者的悟性。

这主要是通过面试中的谈话,特别是会设置一些案例,让应试者给出解决方案。

他们说通过案例分析能真实准确地看出应试者的反应能力和潜质。

2、脑筋急转弯 脑筋急转弯主要是考察应试者的逻辑思维能力。

随着社会的发展,面试结构的不断完善,脑筋急转弯将被越来越多的用到面试中。

应试者是否具备快速的反应能力和逻辑思维能力,通过脑筋急转弯可以很快地检测出来。

3、情境模拟 情境模拟测试方法是一种非常有效的选择方法。

它是将应聘者放在一个模拟的真实环境中,让应聘者解决某方面的一个“现实”问题或达成一个“现实”目标。

面试人员通过观察应聘者的行为过程和达成的行为结果来鉴别应聘者的处理工作能力、人际交往能力、语言表达能力、组织协调能力、考察事务能力等综合素质能力。

如何才能有效地避免问题的发生/非结构化面试 编辑(一)掌握非结构化面试的技巧

由于非结构化面试内容的不固定性及主试官与应试者双向沟通的特点,决定了面试质量的高低在很大程度上取决于主试官的经验以及提问技巧等。

在面试过程中,除了需要注意不同面试阶段的特点外,还需要注意面试的提问方式。

在大多数情况下,面试提问的指导思想,不是要难倒应试者,而是通过应试者回答问题来充分展现其个性优势,测试其素质能力的差异。

因此,提问方式必须有利于应试者充分展示其才华,另外还要有利于对各位应试者的真实水平进行横向比较。

在提问时,应尽量让应试者“开口”,通过把问题用通俗的语言来陈述,让应试者理解问题的含义,并要把握面试的节奏和时间。

(二)建立科学的非结构化面试成绩的评价系统

非结构化面试成绩的评价,是面试过程的最后一道程序,也是最为关键和易产生不同结果的阶段。

它是主试官根据面试过程中的观察与言辞答问所收集到的信息,对应试者的素质特征及工作动机,工作经验等进行判断的过程。

在这一过程中,主试官必须作出对应试者特定方面的判断,比如他们的能力,个性品质,工作经验或工作动机,然后作出他们录用建议。

在这里对应试者特定方面的判断将直接影响随后的录用建议和决策。

作为主试官,应认真研究和掌握面试成绩评定中的各种技术及相关评价手段。

在非结构化面试评价中,运用比较多的是面试成绩评价量表。

它是一种比较客观的评价表,常用的如行为定位评价量表,它具有很高的信度和效度。

虽然结构化面试有量化的评价标准,很容易被掌握,能使面试评分具有客观性,但是参照结构化面试,非结构化也可以制定一定的评价标准。

非结构化问题 篇3

1 外墙砌体结构非荷载裂缝的类型

根据外墙砌体结构产生裂缝的影响因素, 外墙非荷载裂缝分为干缩裂缝、温度裂缝、应力集中裂缝、冻融裂缝、两种结构体系变形不协调裂缝、其它裂缝等。

2 外墙砌体结构非荷载裂缝的特点

干缩裂缝有两种类型, 一种裂缝多发生在抹灰层内, 少数延伸到砌体内部, 一般沿墙面长度方向每隔一段距离形成一条裂缝;另一种则呈不规则的龟裂或放射状开裂, 宽度较小, 仅发生在抹灰层内。

温度裂缝通常具有顶层重下层轻、两端重中间轻、向阳重背阴轻且随温度变化而变化的特点。应力集中裂缝多在砌体结构相对薄弱部位出现, 多为斜向, 少部分为竖向和水平方向裂缝。

冻融裂缝多发生在寒冷地区房屋的檐口、女儿墙或经常受潮湿的厨房、盥洗室、卫生间等的外墙, 有时室外踏步也发生此类裂缝, 特点是在裂缝附近砌体酥松剥落, 且随时间推移有逐渐恶化的趋势。

3 外墙砌体结构非荷载裂缝的防治措施

3.1 控制裂缝的设计措施

1) 严格按照规范设计伸缩缝。2) 顶层墙体砂浆强度等级宜为M7.5, 顶层山墙、端部两个开间内外墙处设置构造柱, 并沿内外墙高度每隔500m m在灰缝中设置2Ф6 (240m m墙厚) 或3Ф6 (360m m墙厚) 通长加强拉接筋;顶层窗台下, 宜设置一皮砖厚的钢筋混凝土带。3) 当门窗洞口宽度不小于1800mm时, 应在易产生收缩和温度应力集中的部位增设加强钢筋或钢丝网分散收缩和温度应力, 在门窗洞口两侧增设构造柱或钢筋混凝土门窗框;对混凝土小型空心砌块结构宜在门窗洞口两侧加混凝土芯柱;当洞口不小于2100mm时, 还应在窗台板下增设配筋带。4) 支承在砌体结构上跨度大于4.8m的混凝土梁, 不得直接搁置在混凝土构造柱上, 应在梁下设置梁垫, 当墙中设有圈梁, 梁垫与圈梁应浇成整体。5) 墙面抹灰的砂浆强度等级应与填充墙材料强度相匹配, 砂浆强度过高、水泥用量过大, 容易产生收缩裂缝, 有条件时宜采用纤维砂浆。6) 将钢筋混凝土构造柱伸至女儿墙内, 并在女儿墙上增设钢筋混凝土压顶, 且沿长度方向每隔10~20m设一控制逢。

3.2 控制砌体结构裂缝的施工措施

1) 上房砌筑的砌块材料的生产龄期不应少于28天。

2) 在下列墙体中不得设置脚手眼:a.过梁上与过梁成60°的三角形范围及过梁净跨1/2的高度范围内;b.宽度小于1m的窗间墙;c.砖砌体门窗洞口两侧200mm和转角处450mm的范围内;d.梁或梁垫下及其左右各500mm范围内。

3) 相邻工作段的砌筑高度差不得超过一层楼的高度, 也不宜大于

4 m;

砌体间临时间断处的高差, 不得超过一步脚手架的高度;构造柱或密柱之间的墙体, 当墙长小于1.2m、墙高大于3m时, 在未浇注混凝土之前, 宜进行临时支撑。

4) 砌体施工时, 楼面和屋面堆载不得超过楼、屋面板的允许荷载值, 施工层进料口楼板下, 宜采取临时加撑措施。

5) 蒸压灰砂砖、粉煤灰砖及混凝土小型空心砌块不宜在雨天施工。

6) ±0.000以上应采用水泥混合砂浆, 混凝土小型空心砌块宜采用专用砂浆。

7) 砌体结构的转角处和交接处应同时砌筑, 严禁无可靠措施的内外墙分砌施工, 对不能同时砌筑而又必须留置临时断面处, 应砌成斜槎, 施工中不能留成斜槎时, 除转角处外, 可留凸直槎并应加设拉接钢筋, 抗震设防为8度和9度的地区不得留直槎。

8) 控制小型混凝土空心砌块裂缝的施工措施:a.砌块在施工现场应有集中存放地点, 不允许把砌块直接放在地面上, 应存放在拖板上, 并应用防雨、防雪的苫布盖好, 在夏季宜储存在阴凉处, 其现场周围应有较好的排水措施;b.小型空心砌块上墙砌筑之前不宜浇水, 只有在天气特别干燥时, 才可用少量喷雾状水喷在砌块上, 使之稍加润湿;c.小型混凝土砌块的砌筑要砌块底面朝上, 水平灰缝厚度和竖向灰缝的宽度应控制在15mm左右, 竖向灰缝可用夹板夹住两侧后灌缝, 严禁用水冲浆灌缝;d.小型混凝土砌块墙体的砌筑高度, 每日一般不宜超过1.5m, 冬期施工时, 每日不超过1.2m;e.小型混凝土砌块砌筑过程中应有防湿措施, 并控制施工用水;f.小型砌块的雨期施工, 应用防雨罩膜遮盖;g.外墙内侧设有暗线时, 应使用同种材料带纵槽的异性辅助砌块, 施工时要密切和水电施工人员配合, 禁止在外墙砌好后凿槽、凿孔等。

9) 控制砌体结构温度、收缩裂缝的施工措施:a.主体结构封顶后, 应尽早进行屋面保温层和防水层的施工, 在安排施工进度时, 如有可能, 尽量避开在严寒和酷暑期施工。b.在进行框架填充墙施工时, 应严格按设计规定设置墙柱拉接筋, 并确保与柱交接处的砂浆饱满、密实;填充墙框架梁底的空隙, 应预停一段时间, 待填充墙体沉缩基本完成后, 再用斜砖填实顶紧并确保砂浆饱满密实。c.在进行框架填充墙抹灰时, 如填充墙厚度小于梁、柱厚度时, 应先抹墙面灰再抹梁面和柱面灰, 以使交接面的可能出现的裂缝, 隐藏在梁柱抹灰层的内部;当填充墙与梁、柱同厚度时, 则可在填充墙与梁、柱交接处, 用专用工具抹出凹槽, 并嵌填柔性好的密封膏, 使可能出现的裂缝控制在凹槽内, 或在上述部位设置钢丝网, 防止交接处抹灰层开裂。d.砌体结构抹灰层干缩裂缝的控制措施:墙体砌筑完成后宜在60天后再进行抹灰, 最短不应小于30天;抹灰层应按三遍抹至设计厚度并进行喷水养护, 外墙抹灰应分格留缝, 以减少收缩裂缝;外保温饰面层抹灰, 还宜增加适量的聚丙烯纤维。e.砌体填充墙中的蒸压加气混凝土砌块、轻骨料混凝土小型空心砌块不应与其他砌块混砌。

4 裂缝的处理方法

控制的总体准则:在对裂缝进行处理之前, 应先进行观察、检测、分析, 确定裂缝的性质及裂缝产生的原因, 然后再采取针对性的措施进行处理。对结构中有一定深度的裂缝, 可采用凿槽嵌补的方法修补。对深度较大的裂缝, 可采用水泥浆、环氧树脂或其他修补胶进行压力灌浆或负压吸入的方法进行修补。

5 结语

非结构化问题 篇4

非结构集成材 (以下简称集成材) 是将除去缺陷后的小规格木材或短料接长, 再横向拼宽、拼厚胶合而成的一种材料。由于它既保留了天然木材自然美观、低碳环保的特性, 同时兼具抗压、抗拉、稳定性高等强于天然木材的优势, 近年来被广泛应用于木制门窗、家具、楼梯扶手等家居装饰的多个领域, 相应的, 客户在订购和使用过程中也对该材料的质量提出了更高的要求。如何避免集成材成品出现干缩、翘曲、变形、色差大等现象需要生产者在生产过程中特别注意以下几个问题。

2 集成材加工中需注意的几个问题

2.1 含水率控制方面

干燥均匀的锯材是集成材生产过程中的原料保障。锯材干燥时须按照不同材种的木材特性与周围介质的传热、传湿现象, 结合木材内水分的吸湿、解吸情况, 严格控制其最终含水率, 使整窑的木材含水率偏差控制到最小的范围, 尽可能控制木材的湿胀、干缩程度。木材出窑后, 须进行2周以上的陈放。一是通过陈放, 可逐渐适应干料室内的气候条件、温湿环境, 同时可将堆垛的内外、上下及相邻木料的含水率趋于一致。二是可使木材内的应力得到释放。由于木材在干燥过程中, 水分的移动和木材径弦向, 尤其是靠近树皮的面干缩不一致, 内、外板产生的压、拉应力相互作用和抑制, 导致干燥后的板材在不同程度上存在着尺寸和体积的变形。木材保持一定时间的陈放, 可以有效地降低内应力, 防止开裂。

此外, 集成材进行指接、拼板前, 必须严格控制其含水率, 相邻、单独的木条进行指接、拼接时, 木材含水率偏差须控制在3%以内, 成品最终含水率普遍控制在8%~12%, 但具体情况需适产品使用地所对应的平衡含水率而定。我国各地区的木材平衡含水率呈现由西北向东南逐渐增高的变化规律, 生产者可依据《木材平衡含水率气象值》对含水率控制范围进行综合调整, 或通过强制通风、恒温恒湿、搁条码垛等的方法进行强制含水率平衡。

2.2 四面刨工序:避免波纹、啃头、扫尾、压痕等缺陷

加工精度和胶合质量的提高需在四面刨工序避免出现波纹、啃头、扫尾、压痕、上凹、下弯、扭曲、不平行等方面的问题。根据经验, 造成上述问题的原因, 多为设备调整不好、螺丝松动, 刀轴及压紧部件、进料轮调节不到位, 四个刀片不在同一水平面上, 各接触面角度偏离, 刀片磨损钝化、切削不良, 木料倾斜、吃力不均, 进料力度、速度不当等方面。纠正的方法也要适情况而定, 可适时调整设备参数、调整刀轴各部件相对位置、压力、吃刀量, 检修零件、检查接触面误差, 调整进料速度和角度, 研磨刀具等。同时, 平时要做好设备的养护和维护, 加强对操作工的技术培训, 提高技术熟练程度, 严格按照操作规程、指导作业书和质量工艺要求进行操作, 不断提高加工精度和质量。

2.3 选料工序:色泽美观避免色差

优质集成材在出厂时应做到木材表面纹理一致、无明显色差。这就要求生产企业在集成材生产加工的材料分选环节中落实做细。车间选料中, 除对集成材的材质和规格“硬伤”严格筛选外, 应按加工技术要求, 做好长度、纹理、色泽方面的综合分选工作。如纹理上, 应按照径切粗纹、径切细纹、弦切、半径半弦进行分选;花色上, 应按照深色、中色、浅色、两色进行分选。在分选的过程中, 若碰到油脂、蓝变、裂痕、压痕、结疤或规格不符要求的情况, 可暂归为不合格品, 后根据“损伤”程度和木料用途酌情处理。

此外, 应根据客户的要求和材种色泽纹理的差异大小, 酌情加增排版这一工序。以成品为6米长非集成材指接窗框料为例, 可置6米长桌, 将选料后单独木条按材种、色泽、纹理进行纵向排版, 6米为一版, 确保纵向整体纹理方向一致、连贯, 色泽均匀、美观。由排版工序来补充分选工序, 可使选料一步到位, 一分到底, 确保转到下一个工序可直接加工, 避免了二次加工和选配, 提高了产品质量的同时兼顾到了生产效率。

2.4 指接工序:避免“破齿”、“针眼”等问题

高品质的集成材应保证指榫接合处外形美观, 指榫接合紧密, 齿顶无缝隙。其指接工序要特别注意指接强度, 根据齿长、齿顶、材种的不同, 设定合适的纵向压力。压力不得过大或过小, 压力过小, 或挤压不到位, 则指接胶合强度不够, 也易出现齿顶部的间隙, 即“针眼”现象;压力过大, 则指榫根部则容易出现劈裂。以外径为250mm、厚度为3.8mm, 孔径为50~70mm, 齿顶为0.7mm, 指接齿长为11mm的6齿刀具为例, 加工针叶材应调整为4~8MPa, 加工阔叶材等应调整为8~10MPa。另外, 要适时调整加工指榫的锯片和铣刀的角度, 避免出现“针眼”。要定期对刀具进行研磨, 避免出现因刀具齿长不一致、刀具钝化而产生的“破齿”、弯曲现象。

2.5 拼板工序:注意用胶及胶合质量

胶粘剂对集成材的质量有很大的影响, 非结构集成材的使用过程中, 多使用水性高分子异氰酸酯胶粘剂, 这种胶粘剂最大的特点是固化速度快、胶粘强度高、耐热、耐水、耐老化性能强, 同时溶于水, 安全方便。调胶时, 要严格按照主剂与固化剂100:15的比例进行配比。当固化剂配比量不足时, 主剂化学反应不充分, 导致拼板胶粘接强度、耐水性明显下降。而当固化剂配比量超标时, 由于拼板粘接胶处的脆性强、韧性差, 也将严重影响到拼接质量。搅拌均匀后的胶粘剂应在5~10分钟之内完成加压, 以保证胶合强度。涂胶时, 要均匀, 做到够用而不浪费, 非结构集成材对于吸粘力强、油脂不多的材种, 大多采用单面涂胶的方式, 根据涂胶速度、胶粘剂的活性期、涂胶面积来调定涂胶量, 一般为150~250g/cm2。加压时, 要根据材种特性、木料温度对设备进行调整, 压力过大或过小都会影响胶合强度和耐久性。一般来说, 集成材针叶材的胶合压力为0.5~1MPa, 阔叶材的胶合压力为1MPa, 木材胶合温度控制在20~30度较为适宜, 加压时间一般为常温下冷拼为40~50分钟, 加压时压力要均匀。若采用热拼方式, 则需根据木料厚度适当缩短加压时间。压力大小以加压后, 有连续的胶面小胶滴挤出为准, 加压时还应注意因涂胶层开放时间过长引起的胶膜粘连, 并需避免开胶、错拼、错位等其他问题。卸压后, 由于胶合强度还未达到最强, 胶合后的集成材应根据材种、胶黏剂种类、冷、热拼方式不同进行养生堆放, 应至少经过48小时的养生期后, 再进行二次加工:如砂光或铣型。

摘要:现以提高非结构集成材的成品质量为目标, 讨论了在非结构集成材生产加工中需要特别注意的含水率控制, 纹理色差, 指接质量, 胶合质量, 波纹、啃头、扫尾的缺陷避免等若干问题, 为集成材生产加工企业提供了技术支持和参考。

关键词:非结构,集成材,生产加工,问题

参考文献

[1]徐有明.木材学[M]:北京:中国林业出版社, 2006.

[2]李黎.木材切削原理与刀具[M]:北京:中国林业出版社, 2005.

[3]于志明, 李黎.木材加工装备[M]:北京:中国林业出版社, 2005.

非结构化数据:被忽视的富矿 篇5

在数据分析行业, 大致的统计是, 世界上约80%的数据都是非结构化数据。此前, 数据分析对象绝大部分是结构化数据, 比如姓名、性别、年龄这些信息, 可以以Word, Excel等形式呈现的数据。而非结构化数据是更加“莫可名状”的:它们通常藏在我们的聊天记录、邮件、发布的图片、语音以及视频中。

在中美两国科技界对未来技术的甄选中, 大数据分析通常位列其中, 而非结构化数据又被认为是大数据产业的一个核心。目前, 国内的现有数据绝大部分是结构化的, 对于非结构化数据的分析处在“有概念、无工具”的状态。

点评:大数据分析, 特别是对非结构化数据的分析, 是未来技术发展的方向。对于非结构化数据的分析工具来说, 电商平台海量的商家数据、客户评论就是一个富矿。如果利用好这些非结构化数据, 未来就能打开庞大的市场。

非结构化文档的标记方法研究 篇6

1 基于Dublin Core的外表特征标记

本文参考了DC (Dublin Core, 都柏林核心集) 的15个核心元素, 剔除若干不需要的元素, 保留了其中的主要元素:标题Title、作者Author、日期Date、标识符Identifier和格式Format, 同时结合企业环境需要增加了3个元素:

Document Department:与文档相关的部门。企业是一个按职能划分的系统, 文档可来自不同的部门, 且会带有明显的部门特征, 增加这个元素, 可以更好地对文档进行归类管理。

Document ID:文档编号, 对文档按照统一的编码方式进行编码。

Access Control:权限控制。企业中对于权限的设置十分严格, 查看、修改、删除都必须有相应的权限, 增加权限控制项可满足企业安全管理需要。

2 基于语义标注的内容特征标记

要对文档进行内容标记必须对文档进行全面的内容理解, 这种理解是通过语义标注来实现的。语义标注, 就是利用本体中定义的词汇来显示揭示和表达文档中的内容, 主要可分为命名实体识别和实体关系识别。

经过语义标注之后, 即可形成关于源文档的标注文档。标注文档中的词汇能在一定程度上表达文档的内容, 但其没有对这些表达文档内容的词汇进行排序, 所以无法判断哪些词汇更能表达主题。本文采取的方法是:通过词汇之间存在的语义关系来计算词汇的语义加权值, 来表示词汇所能反映主题的程度, 下面先介绍下计算语义权重值过程中涉及到的几个定义:

上位词:同一本体中, 父概念是其子概念和实例的上位词, 父属性是子属性的上位词

词频:将词汇i在文档中出现的频数为词汇i的词频, 一般可记为frei。

影响值:文档中的两个词i和j, 若i是j的上位词, 那么称对i有影响, 否则无影响, 并j对i的影响程度称为影响值, 记作

具体语义加权值计算方法如下:首先将文档中包含的领域词汇的权重值weight[i]初始化为相应词汇的词频frei, 然后再按照词汇之间存在的上下位关系, 对权重值进行更新和叠加, 若在文档中存在该词汇的上位词, 则直接将影响值加到上位词的权重中;若不存在, 则将上位词加进来, 并初始化其权重值为该词汇对其的影响值, 具体计算公式如下:

经过加权语义标注后再综合考虑, 内容标记元素包括:分类Class、主题Subject、相关主题Related Subject、带权值的特征词汇Weighted Key Words、特征词汇所在的句子的摘录Key Sentences。

3 标记语言Schema设计

前面已经通过DC和语义标注完成了对非结构化文档在外表特征标记和内容特征标记两方面的研究, 接下来就是分析如何对这些标记进行完整的描述并形成一个完整的XML Schema规范, 并按照此Schema来填充和校验非结构化文档标记。

本文设计的标记Schema结构如下:MarkupLanguage为根元素, 以下再包含Head、Body及Foot三个子元素, 各子元素再往下细分。Head包含的是关于标记文档本身的一些管理控制元素, 以实现对标记文档自身的有效管理和应用, 具体元素有:作者、日期、语言、版本信息、权限控制、生成工具及所用的本体等;body元素是标记文档的主体, 包括外表特征和内容特征两个元素, 具体子元素前面已说明;Foot则包含了一些补充信息, 如版权和联系方式等。

文中的Schema文件、结构图和具体的XML标记文档, 都可以通过XML SPY工具软件来编写, 本文所采用版本为XML SPY2006企业版中文破解版。

4 小结

本文构建的非结构化文档标记方法重点是两方面:基于DC的外表特征元素和基于语义标注的内容特征元素, 之后添加了一些管理控制元素, 形成完整的Schema规范。对于文档的标记都按照Schema设计的元素规范来填充, 形成统一结构化的描述, 实现非结构化向结构化的转换, 以便进行下一步组织/存储, 实现更高层次的应用。

参考文献

[1]张德政, 张萍萍.非结构化信息管理[J].微计算机信息, 2006, 22 (9) .

[2]张晓艳, 王挺, 陈火旺.命名实体识别研究[J].计算机科学, 2005 (4) .

[3]刘建华, 张智雄.基于Stanford Parser的实体间关系识别[J].现代图书情报技术, 2009 (5) .

非结构化问题 篇7

1 存在的问题

随着信息化办公的长远发展,数据的集中存储和管理是实现各个业务应用系统数据融合、信息共享、数据挖掘、获取有益数据的重要保障。但目前由于信息化数据管理标准、管理模式及要求等方面仍然存在着一定的问题。其中包括:

1.1 数据管理面临的典型问题

1)信息化办公中的非结构化数据需要内容管理平台的有效管理,但缺乏统一的管理标准和数据分类标准;

2)业务应用系统对非结构化数据的需求不统一;

3)各个业务系统中数据格式多样化,对数据的访问频率也各不相同;

4)非结构化数据的共享利用率较低。

1.2 目前主流的内容管理平台方面存在的问题

1)非结构化数据存储方式及数据格式多样,整合存在困难,使数据共享和共享平台建设留下了许多问题:

2)在数据挖掘和统一搜索方面,能够实现简单的业务元数据方式的查询,极少数实现了全文检索,同时随着非结构化数据量的增长,使得应用系统的查询过程变得漫长。;

3)数据传输的安全性相对薄弱,缺少数据的传输加密功能,比如多数系统无法控制被利用电子文件传输的安全性:

所以,通过对业务应用系统数据需求分析和存储现状的研究,制定一套统一的、专业的数据迁移方案和工具势在必行。通过对业务应用系统历史非结构化数据的集中存储和管理,为内容管理平台建设提供有力支撑,对实现数据共享、数据挖掘、加工利用提供有效保障;同时通过内容管理平台,加快解决用户对数据访问效率。

企业级内容管理平台的非结构化数据迁移工具的设计与实现的定位是以“来源于数据、利用于数据,实现数据共享、深度挖掘、提升利用价值”的思想,有力的支撑内容管理平台实现数据的统一存储和管理,提高数据的安全性,保证合理的数据共享和利用。

2 业务应用系统数据现状

2.1 需求分析

根据目前企业业务应用系统建设情况,分为已建系统和在建系统,大部分已建系统存在着大量的非结构化数据,这部分数据已在业务流程中使用,为实现数据的集中存储,需要将这部分数据迁移到内容管理平台进行统一存储和统一访问,以实现非结构化数据大集中管理,业务系统对历史数据迁移提出了以下需求:

1)存储空间的需求:业务系统根据自身系统非结构化数据的现状,计算非结构化数据的总容量和总条数,同时预估每年可能产生的数据量,需要使用多大的存储空间,提供多少的预留空间;

2)支持多数据源的迁移:目前公司业务系统非结构化数据的主要有数据库大字段BLOB、文件系统、FTP文件服务器等,根据业务系统不同的存储方式,内容管理平台需要提供不同的解决方案,以满足不同的业务系统对历史数据迁移的需求;

3)迁移支持的数据格式:各个业务系统对非结构化数据存储格式的需求不同,如:OA办公系统的非结构化数据有doc、ceb、wps、xls、pdf等格式,档案管理系统的文件格式有TGA、GIF、TIF、TIFF、MPG、AVI、MOV、MPEG、WAV、MP3、WMA、HTML、TXT、XML等;

4)迁移后用户使用非结构化历史数据体验不变:待历史数据迁移完成后,对于用户来说,非结构化数据迁移前和迁移后没有任何的体验变化;

5)非结构化数据的完整性:迁移过程中,不能破坏原有的非结构化数据,以免造成非结构化数据的不一致性;

6)平台的稳定性:历史数据迁移完成后,内容管理平台提供稳定运行,以保证业务系统能够实时使用迁移到内容管理平台中的非结构化数据。

2.2 存储现状

1)数据库的BLOB字段。将非结构化数据以二进制的格式存储在数据库的BLOB字段中,其优点是调用文件的速度快,维护和管理简单。使得企业大部分的应用系统中的采用此种方式将非结构化数据进行存储。其缺点是;一是由于非结构化数据文件相对于结构化数据较大,在数据量不断增长的情况下,数据库的存储达到一定程度,会导致数据库性能下降,进而影响业务应用系统的性能;二是由于各个业务应用系统相对封闭和独立,其他应用无法共享相关文档资料。

2)本地服务器。对于大多数没有应用系统的非结构化数据,如信息管理部门常用的工具软件、开发的应用系统软件、源代码、开发过程文档、技术研究资料等,新闻中心的素材、资料等通常都是将文件直接存储到文件服务器中。

3)FTP文件服务器。以FTP方式将文件上传至文件服务器中。其优点是解决文件的共享。其缺点是受到网络拥塞的影响,会导致数据访问性能下降。

3 数据迁移工具设计

3.1 数据迁移目标

业务应用系统历史非结构化数据迁移是实现数据集中管理和利用的一个重要步骤。迁移一般要达到以下目标:

1)在完成业务应用系统与内容管理平台接口集成的基础上,平滑的将原有业务应用系统内的历史非结构化数据完整地迁移到内容管理平台中。

2)简单、准确的数据校验方法。

3)最小限度的影响现有系统的运行。

4)最小的数据维护时间。

3.2 技术路线

整个框架基于Spring框架搭建,通过配置文件动态注入。包括数据源,日志,数据目标,数据传输模型等通过动态注入。同时运用了SQL Server数据库技术、Windows Service技术等等

3.3 技术方案

通过设计开发的数据迁移工具实现数据的迁移,其优点是不需要对业务应用系统停机,即对业务应用系统的影响极小,其缺点是数据迁移相对较慢,对系统的I/O资源消耗较大。

3.4 数据迁移工具总体结构框架

图1为总体结构框架。

3.5 数据源表结构

创建数据源表

备注:

3.6 数据迁移功能设计

数据迁移功能设计总共分为7个模块,分别为:导入处理模块、适配器模块、数据传输模块、数据存储模块、日志模块、配置模块、可视化配置模块。

1)导入处理模块:对数据传输模块,适配器模块、数据存储模块、日志模块的进行合理的调配和管理。

2)适配器模块:提供数据统一接口,用于数据初始化,读取数据库表中的数据信息,转换为统一格式,同时用于内容管理平台生产的文件ID回写到数据库表中。

3)数据传输模块:用于控制数据的传输。

)数据存储模块:将数据传输模块传送的数据按照元数据和文件分别存放到内容管理平台。

5)日志模块:用于保存数据迁移的日志信息,如传输文件、时及传输成功、失败的日志信息。

6)业务配置模块:用于配置业务应用系统的系统编码,用户名,密码,文件柜等配置。

7)可视化配置模块:提供初始化信息配置,例如,导入进度显示。

3.7 数据迁移方案

3.7.1 历史数据迁移系统架构

参照上面的历史数据迁移系统架构图:其业务实现的步骤是:

1)首先,业务应用系统项目组根据数据源格式整理出业务应用系统需要迁移的历史非结构化数据和数据源,然后将数据源导入到数据库表中,提供给内容管理平台项目组,以便非结构化数据迁移工具读取非结构化数据。

2)通过非结构化数据迁移工具调用内容管理平台提供的HTTP接口,把迁移过程中的相关信息、系统验证码等信息传送给内容管理平台。

3)通过HTTP接口得到的对应信息,将通过权限认证(系统验证码)来判断从历史迁移工具获得的信息是否验证通过?若权限认证通过,则把导入的数据放入到对应的内容存储库中。若权限认证未通过,将返回错误消息。

4)将内容库中生成文件ID返回到内容管理平台,通过内容管理平台提供的HTTP接口,把文档ID回写到数据库的数据源中。

5)在通过内容管理平台历史迁移工具对业务系统的每条数据迁移到非结构化平台后,内容管理平台项目组将数据源导出,提供给业务系统项目,将文件ID更新到业务系统的数据源中。

综上所述,要进行成功的数据迁移,业务实现阶段的每一步骤的工作都要做好,充分而周到的准备工作是完成数据迁移的重要基础,正确的迁移策略和技术是完成数据迁移的核心条件,完善的检验工作是保证数据正确可靠的必不可少的补充。总之,完成数据迁移之后要保证新系统中的信息完备无遗、不包含冗余信息等。

3.7.2 业务应用系统历史数据迁移标准流程

1)迁移准备

(1)内容管理平台项目组组织业务应用系统项目开展迁移的调研工作,包括业务应用系统与;(2)内容管理平台接口集成情况,历史数据大小、文件类型等。

确定历史数据迁移时间计划,人员安排,确保迁移工作的顺利进行。

2)迁移工具验证

搭建测试环境,通过迁移工具开展验证测试工作,验证数据迁移工具是否成功实现数据迁移。

3)数据梳理

(1)业务应用系统项目组需要向对口业务部门和运维单位提出生产环境历史数据导出申请,并将数据导出到指定的服务器中。

(2)业务应用系统项目组根据内容管理平台项目组提供的历史数据的数据源格式对数据进行梳理,按实际情况完善历史数据的数据源。

(3)业务应用系统项目组将生产环境历史非结构化数据和历史数据的数据源提供给内容管理平台项目组。

4)测试环境数据迁移

(1)内容管理平台项目组和业务应用系统项目组在测试环境下搭建各自的测试环境,并实现业务应用系统与内容管理平台的接口集成工作。

(2)内容管理平台项目组根据业务应用提供的生产环境历史非结构化数据和历史数据的数据源对历史数据迁移工具进行配置。通过历史数据迁移工具读取历史数据的数据源信息将历史非结构化数据迁移到内容管理平台。

(3)迁移完成后,内容管理平台项目组将重新内容管理平台回写生成的数据源提供给业务应用系统项目组,由业务应用项目组将新的数据源更新到业务应用数据库。

5)生产环境数据迁移

(1)内容管理平台项目组使用历史迁移工具读取历史数据的数据源中的记录,将历史数据迁移到生产环境内容管理平台中。

(2)完成生产环境的历史数据迁移后,内容管理平台项目组将重新内容管理平台回写生成的数据源提供给业务应用系统项目组,由业务应用项目组将新的数据源更新到业务应用数据库。

6)完成

(1)内容管理平台项目组根据数据迁移工具的日志信息分析数据的迁移情况;通过查看历史数据迁移日志分析迁移工具是否正常运行,历史数据迁移条数是否正确。若迁移条数与实际不符,业务应用项目组和内容管理平台项目组共同通过查看日志和数据库记录分析原因、解决问题;

(2)业务应用系统项目组通过数据源中回写的FILE_SIZE与业务系统中历史数据的数据大小进行对比分析,若发现不一致的情况,及时与内容管理平台项目组沟通解决。

(3)业务应用系统项目组通过业务应用系统对迁移后的数据进行抽查访问,确保数据的完整性。

4 数据迁移的综合价值分析

开展非结构化数据集中管理平台数据迁移的研究,将使分散在各个业务应用系统中的企业非结构化数据存储孤岛能进行有效整合和集中存储,以此建立全方位的非结构化数据中心,只有通过此种整合和集中整合,方能建立企业非结构化数据存储标准,为将来的非结构化数据挖掘、给各业务应用系统提供统一的获取非结构化数据的基础支撑。

1)降低运行成本

降低企业运作成本,提高经营管理和服务水平;数据的集中存储,从一方面,针对于信息维护人员实现了对单个业务应用系统的数据维护转变为针对各个业务应用系统集中存储的数据维护,大大的减少了人力成本;

2)提高效率

通过数据迁移工具实现了业务应用系统历史非结构化数据的迁移和存储,有效整合和管理在业务流转过程中产生的大量的非结构化数据,优化存储架构,提高存取和利用效率。

3)合理存储

多数业务应用系统数据由于独立存储业务数据,存在有的业务应用系统存储空间大,但数据量和数据增长量相对较小,有的业务应用系统存储空间小,但数据量和数据增长量相对较大,导致存储不均衡,通过人为分配容易造成数据损坏或丢失的风险。通过数据迁移,实现数据的统一存储,减少了人为风险,同时,根据每年的数据存储情况可以容易得知数据增长量,使得信息运维人员更合理分配存储空间。

4)建立全面的内容安全管理

通过数据迁移工具的加密功能,保证了数据访问的安全性,同时内容管理平台自身的内容加密、权限管理、安全监控及备份还原等功能,为企业内容提供全面的安全防护,确保内容无异常损毁、无泄漏,内容流转过程可控。

通过数据迁移工具把企业中非结构化数据的整合和数据采集、传输、存储和利用。对大量的企业信息资产进行深入分析,挖掘有益信息,为智能决策服务打破数据流转和共享的壁垒,实现企业内容有效整合、集中存储、规范标准、统一服务,实现流程互通。

摘要:国内大型企业开展内容管理平台的搭建,有效的整合了各个业务应用系统生成的非结构化数据,合理的实现了数据从分散存储到集中存储的巨大跨越,但是对于现有业务应用系统中海量历史非结构化数据迁移至内容管理平台的问题有待解决。保证业务应用系统和内容管理平台的安全稳定运行前提下,文中提出了通过第三方数据迁移工具和标准的数据迁移方案,从而保障各个业务应用系统非结构化数据的迁移工作有序的开展,并对迁移的历史数据的完整性和一致性进行校验,确保历史数据迁移后能够正常访问。

关键词:内容管理平台,非结构化数据,数据迁移,数据校验,标准流程

参考文献

[1]王克,王清心.基于ECM理念构建电信级知识内容管理平台的研究[J].微型机与应用,2010,29(22):9-12.

[2]苏明.企业内容管理平台的研究与实现[J].科技信息,2011,(4):238-239.

[3]任庆东,李天阳,袁满,等.基于元数据驱动的通用数据迁移工具[J].大庆石油学院学报,2011,35(1):76-80.

[4]高强,魏薇.大型企业级非结构化数据的迁移与转储技术研究[J].电脑知识与技术,2011,7(6):1225-1228.

基于灰度特征的非结构化道路分割 篇8

随着科技的不断发展和人类生活水平的不断提高,人们对智能汽车的关注也在不断提升,智能汽车的研究具有较大的现实意义,其中最重要的作用之一是可以提高汽车驾驶的安全性。道路识别算法是智能车无人驾驶研究的一个重要部分。

常见的行驶道路主要分为结构化道路和非结构化道路两种,本文重点对非结构化道路进行分割。许多学者在这方面进行了研究,如贾嫣等[1]针对雨雪天气的特殊性利用HSV空间中的H空间进行模糊增强,并选取阈值进行道路的粗分,使用形态学对图像的降噪,最后使用边缘检测得到道路边缘。熊思等[2]利用高斯金字塔对图像进行降采样,对图像进行双边滤波抑制噪声,采用基于小波变换求模极大值的方法对滤波后的图像提取边缘,通过阈值法去除非道路边缘点,给出基于斜率和截距的K-means聚类算法,实现道路方程拟合。吕艳鹏等[3]应用MATLAB使用Otsu法对道路图像进行分割,再利用数学形态学和阀值面积消去法对图像进行去噪处理,然后利用Roberts算子检测出道路边缘,最后利用最小二乘法对图像进行曲线拟合,得到平滑的道路边界曲线。吕艳鹏等[4]对非结构化道路的彩色图片利用熵、对比度等纹理特征值作为BP神经网络的输入层,进行网络训练。,然后将图片中的每一个20×20 小块的纹理特征值输入BP神经网络的输入层,经过运算判断小块是否为道路部分。龚建伟等[5]提出了一种结合多线程技术和多层感知器自监督在线学习技术的道路识别算法,算法中道路图像采集、分类器训练、训练集更新、分类器识别等计算操作分别在各自线程中实现,算法具有较好的自适应性及实时性。

我们根据道路的灰度特征,利用分块方法计算每块的灰度方差,并通过区域生长分割道路区域。

2 道路图像预处理

道路图像预处理主要是为了去除一些与道路无关系的干扰信息以及对道路图像特征信息进行增强处理。

2.1 图像分割

根据道路图像中的道路分布可知,一般情况下道路处于图像的中下部。为了提高处理速度,去除每一幅图像的1/3 上部部分,只保留与道路信息相关的下部2/3部分,如图1所示。

2.2 图像灰度化

由于大多数道路及边缘没有颜色特征,而道路中的灰度变化比道路边缘小,因此先将彩色图像(图1a)进行灰度化处理,采用平均法将道路的彩色图像变为灰度图像,如图2a所示:。

Gray=(B+G+R)/3

2.3 图像平滑滤波

平滑滤波是对图像进行模糊处理和降低噪声,常用的3×3和5×5均值滤波器如下[6]:

由于本文需突出道路边缘信息,因此滤波器不易过大,选择3×3大小即可。图2b为图2a滤波后的结果,

3 道路图像分块

为了区分道路与道路边缘的区域,同时又为了消除一定的干扰信息,对图像进行分块处理,以每个块作为一个处理单元(以下称为单元块),根据道路及边缘的特征,通过对单元块中的像素灰度分析,确定单元块的位置是否处于道路内部及道路边缘。

3.1 单元块的大小

单元块的大小确定是道路识别的关键。单元块过大,会导致块中灰度信息过多,不能突出道路边缘的特征;单元块过小,会突出干扰信息,使道路识别结果出错。经过实验得出w/20×w/20(w为图像宽度)单元块的处理效果较好,考虑到要突出弯曲道路边缘信息,单元块选定为长矩形区域较合适,即单元块的宽度为w/20左右,高度为w/30左右。如图3a所示。

3.2 单元块的特征值

为了区分道路与道路边缘,采用单元块中的像素灰度均方差作为单元块的特征值。

使用如下简化式代替均方差:

式中:I(i,j)-----单元块中像素灰度值

M、N-----单元块的宽与高(以像素为单位)

可以得出,单元块处于道路中时,特征值较小;单元块处于道路边缘时,特征值偏大。而单元块处于道路外时,其特征值不确定,取决于道路外的环境特征。如图3b所示,图中的灰度大小代表特征值的大小。从图中可以看出,道路中的单元块特征值基本上都小于道路边缘上的特征值,根据这个特点,设定合适的阈值(称为单元块阈值),从道路中部开始进行区域生长,将道路提取出来。

3.3 单元块阈值的确定

单元块的阈值取决于道路中的灰度变化情况,如果道路较少裂痕与干扰信息,道路区域内是一个特征值较小的连通域,所选的阈值可偏小;否则选的阈值偏大些。如图4显示了不同阈值效果图。当阈值较小为8 时,如图4a,道路中的水印及接缝影响较大;当阈值较大为22 时(如图4d),道路的连通域延伸到边缘外部,不能提取出道路信息。可见,阈值的取值范围还是较大的。经过对大量道路图像的试验,阈值取值在14 左右比较好。图5为不同道路的提取结果。

从图5 中可以看出,低于阈值的区域除了道路区域外,还有道路外的部分区域,为了从这些低于阈值的区域中定位道路区域,本文提出使用改进的区域生长法识别道路区域。

4 道路分割

4.1 区域生长法

区域生长是从满足检测准则的点开始,在各个方向上生长区域,当其邻近点满足一致性准则就并入小块区域中,当新点并入后再用新的区域重复这一过程,直到没有可并入的邻近点时生成过程就完成。区域生长的分割方法的关键是在于定义一个一致性准则,用来判断两个邻接的区域是否可以合并[6]。

区域生长法的两个关键点是选取起始生长点和确定生长准则。一般情况下,起始生长点的选取是随机性的,但对于本文中的道路识别,需要生长道路区域而不是其他区域,因此必须选择道路区域中的单元块种子作为起始生长块,即在道路区域内选择单元块小于愈生长的单位也是以单元块为单位而不是像素。根据前面的实验结果,生长的规则是单元块的特征值小于阈值,是全局特征而不是局部特征,这样可以消除道路中的干扰因素,否则如果起始生长点的特征值偏大或偏小,会影响整体生长结果。

4.2 改进型区域生长法

改进型的区域生长法基本思想是:1)根据道路图像的分布特点定位道路区域中的一个种子单元块。一般可取图像中下位置处的单元块。如果种子单元块的特征值大于阈值,则把该单元块合并到道路区域;否则不合并到道路区域。2)对其四邻域单元块进行搜索,计算四邻域单元块的特征值,如果大于阈值,则把该单元块合并到道路区域。3)对每个新合并的单元块重复(2),直到没有大于特征值的单元块为止,就完成了区域生长的分割。

图6是改进型区域生长法的生长过程图,图中白色区域为道路区域。图7 为两个道路区域标记结果图。从图中可以看出道路区域确定后,道路边缘线的提取与拟合就非常方便。



5 结束语

上一篇:学生安全教育下一篇:病毒隔离系统