实时信息搜索技术论文

2024-06-06

实时信息搜索技术论文(精选9篇)

实时信息搜索技术论文 篇1

摘要:网络信息时代, 人们习惯在网上搜索所需的信息, 如何在海量的网络信息中找到所需的资料, 这需要使用一定的搜索技巧。

关键词:网站信息,搜索技巧,检索工具,搜索引擎

在网络时代, 网络的信息海量存在, 人们已经渐渐习惯在网络上看新闻, 查资料, 找答案。网上信息资源具有如下几个特点:1、信息资源非常丰富, 覆盖面广;2、提供信息资源的方式多样;3、价格低廉, 有时甚至是免费的;4、涉及的内容和用户广泛, 有时甚至可以直接进行交流;5、网上的内容一般是非正式和自由发表;6、信息内容海量、分散、无序, 难以控制;7、信息的可靠性、真实性、合法性无法得到保证。在浩如烟海的网络资源中, 如何快速准确地找到自己想要的资料, 这需要使用一定的技术与技巧。

在网络中检索网络信息的一般方法是浏览网页, 偶然可以发现感兴趣或是有价值的信息, 然后顺着相关链接而继续浏览相关的网页内容, 这种检索方法随意性很大, 有时看了大量的网页, 还是没能找到你需要的资料, 所以这种方法效率很低, 除非是无目的地上网浏览, 否则, 大多数人都会利用检索工具来帮助查找自己所需的资料。所谓的检索工具, 一般可以分成三类:1、目录型检索工具 (主题指南) ;2、搜索引擎;3、网络导航等。人们根据自己所找的资料的性质不同可以选择不同的检索工具来帮助自己搜索所需的资料。下面分别阐述各种检索特点和优缺点。

一、目录型检索工具

为了帮助Internet上用户方便地查询到所需要的信息, 人们按照图书馆管理书目的方法设置了网上目录。网上目录一般以主题方式来组织, 大主题下又包括若干小主题, 这样一层一层地查下去, 直到查到比较具体的信息标题。这就是目录型检索工具, 也称主分类站点目录, 专题目录, 主题指南, 站点导航等, 它是按等级排列的主题类索引, 排列的方法有字母顺序法、时间顺序法、地点法、主题法等等, 或者各种方法综合使用。它是将网络信息资源搜集后, 以某种分类法进行整理, 并和检索法集成在一起的检索方式。它能让用户通过主题浏览Web站点列表、检索相关信息。

网络目录一般采用人工方式和机器自动处理方式结合进行, 在效率和效果上求得平衡。目录型检索工具的使用方法是:1、选择目录大类中的项目, 然后一步步地缩小范围;2、用一个含义较广的关键词 (如科学、教育技术、高职高专等) 查询, 然后继续点击更详细的标题;3、如果一个目录不能给你合适的结果, 可以用另一个试试。通常目录间会有很大的差别。

目录型检索工具的优点是:1、目录结构人工选择;2、学术性强;3、分类浏览直观, 适合新手;4、适合目的不明确的检索;5、降低了检索结果不相关的可能性;6、同一主题下的信息相对集中。缺点是:1、数据库的规模相对较小, 检索到的信息数量有限, 收录不全面;2、更新、维护速度或周期慢, 死链较多;3、分类体系不一定为用户熟悉。综上所述, 目录型检索工具一般适合于查找综合性、概括性的主题概念, 或是对检索准确度要求较高的课题。常用的目录型检索工具有:国内:中文雅虎http://cn.yahoo.com/;搜狐:http://dir.sohu.com/;"所有Soyou"http://www.soyou.com.cn等, 国外:http://www.yahoo.com;http://www.galaxy.com;http://www.vlib.org等。

二、搜索引擎

搜索引擎 (search engine) 是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息, 在对信息进行组织和处理后, 将处理结果信息显示给用户, 是为用户提供检索服务的系统。搜索引擎使用自动索引软件来发现、收集并标引网页, 建立数据库, 从使用者的角度来看, 搜索引擎以Web形式提供给用户一个检索界面, 供用户输入检索关键词、词组或短语等检索项;通过浏览器提交给搜索引擎后, 搜索引擎就会返回跟用户输入的内容相关的信息列表, 从而代替用户在数据库中找出与提问匹配的记录;返回的结果会按一定的相关度排序输出。搜索引擎又称网络资源的关键词索引, 强调的是检索功能。

搜索引擎优点是: (1) 信息新颖, 数量巨大。搜索引擎的最大的优点是在WWW上的综合覆盖面大, 信息新颖。 (2) 可检索到部分高质量、专指性强的信息。利用搜索引擎还可以检索到部分高质量的学术期刊和论文, 其中有些刊物和论文仅以电子版发行。搜索引擎最擅长检索那些处于"灰色地带"、不易归类的主题以及一些专指性很强的词汇。 (3) 可检索到相关性高的信息。搜索引擎能够将其认为相关性高的检索结果排列在前。此外, 不同的搜索引擎具有不同的检索功能和特色。总体来说, 在用户需要进行范围广泛的查询, 而且有时间筛选检索到的大量信息的情况下, 搜索引擎具有极高的价值。

搜索引擎缺点是: (1) 信息质量不高。这是搜索引擎的主要缺点。检索到的资料缺乏权威性, 缺乏像书刊出版社一样的审查录用机构对资料的质量把关, 资料不准确, 过时等, 搜索引擎对检索到的资料不提供任何解释, 也不提供任何质量方面的标识。 (2) 信息内容重复。搜索引擎的检索结果中还经常重复出现同一信息资源的不同部分。 (3) 费时费力。与商业性联机检索数据库相比较, 利用搜索引擎检索常常要花费大量时间进行搜索、浏览、筛选, 因此比较费时费力。此外, 搜索引擎通常仅限于检索WWW上的信息, 检索其他信息则需要考虑使用其他检索工具。

由此可见, 搜索引擎比较适合于检索特定的信息及较为专、深、具体或类属不明确的课题。

搜索引擎代表:1、Google:http://www.google.com;2、百度:http://www.baidu.com/;3、天网:http://e.pku.edu.cn。

搜索引擎通过描述资源信息的特征来定位索引的资源, 使用方法如下:1、通过关键词索引 (所有词条、术语、词条的组合) , 这是最普遍最常用的一种方法。2、通过网页标题索引。3、通过资源的定位 (URL) 索引。4、通过网站的属性索引。5、通过文档的类型 (Filetype) 索引等等。下面以搜索引擎Google为例, 根据不同检索的方法, 说说相关的搜索技巧。

在没有任何限定情况下, Google自动分解输入的检索词。

例如检索:梅县教师进修学校, 该词组会被自动分解为:梅县、教师、进修、学校四个词, 四个词的任意组合的短语 (术语) 都被认为是检索词, 并进行检索。当然, 同时包含这四个词的相关网页会排在最前面, 然后再根据相关关系的紧密程度来排列。

实际使用过程中我们可以活用Google搜索技巧。

1、使用双引号。

使用双引号表示强迫搜寻完整词组, 在想要进行确定短语搜索, 而不进行自动关键词拆分的时候使用。范例:在检索框中输入:"国庆旅游", 将以 (国庆旅游) 四个字, 作为完整的关键词来查询, 不再拆分关键词组。

2、使用「+」或「空格」。

当想要查询两个关键词都包含的网页时使用。范例:在检索框中输入:C语言课程设计或C语言+课程设计, 就可以找到有关C语言课程设计相关资料的极大值。注意使用「+」时不可以有空格。

3、使用「-」。

当想要缩小搜索范围, 从关键词1检索结果中取出含有关键词2的部分资料时使用。范例:拖拉机-游戏, 这时就不会出现拖拉机游戏、网上拖拉机等不相关的网页资料。注意使用时在「-」号之间要先空一格。

4、使用「OR」。

当要查询与关键词1与关键词2的相关数据时使用, 使用方法是:「关键词1」+「空格」+「OR」+「空格」+「关键词2」。范例:四级OR CET4, 会按照「四级」→「CET4」→「四级CET4」这样的检索词顺序显示检索结果。注意使用时OR一定要大写。

5、使用「site」。

当要查询单一网站中的资料或是限定查询资料的网页国籍时使用。使用方法是:「关键词」+「site」+「:」「网站名称」or「国别」。范例:MPA site edu.cn, 表示在教育网中查找有关MPA的网页资源。注意使用时在查询的网站前面不可加上「http」以及「www」的网址部份连结的网页。

6、使用「inurl」。

当想要更精确定位在网页中的资料, 针对特定连结做搜寻时使用。使用方法是:「inurl」+「:」+「关键词1」+「空格」+「关键词2」。范例:inurl mp3神话, 检索出所有资源URL中含有mp3、网页中还有"神话"的网页资源。注意使用时「inurl」后面续接的关键词不可以有空格。

7、使用「intitle」。

当要查询特定标题网页中的资料时使用。使用方法是:「intitle」+「:」+「关键词1」+「空格」+「关键词2」。范例:intitle:免费软件下载, 将检索出所有资源网页Title中含有免费软件下载的网页资源。注意使用时「intitle」检索语与关键词间不可以有空格。

8、使用「filetype」。

当要查询特定类别的文献资料时使用。使用方法是:「filetype」+「:」+「档案类型」+「空格」+「关键词1」。范例:filetype:DOC高校教师继续教育, 检索出所有资源内容包含"高校教师继续教育"的Word文档资源。注意使用此检索方式之前, 确定其网的文献资源的扩展名。

9、利用google的一些特色服务, 查询特殊的信息结果, 例如:

货币转换;计算器;股票查询;英汉互译;天气查询;邮编区号;手机号码;定义等。

综上所述, 当需要在网络中查找所需资料时, 适当采用一些搜索技术去帮助搜索, 可以比较快速准确地定位到你想要查找的资料, 起到事半功倍的效果。

参考文献

[1]谭启慧, Google搜索引擎功能及其使用技巧[J].科技情报开发与经济, 2007 (15) .

[2]邹小筑, 搜索引擎的选择与使用技巧, 图书馆研究, 2002.第5期

[3]李艳梅, 浅议搜索引擎google, 现代情报, 2003.7

[4]李育嫦;搜索引擎中完善关键词检索功能的探索[J];图书与情报;2003年05期

[5]李琳;搜索引擎信息检索功能与检索技巧[J];图书馆建设;2000年06期

实时信息搜索技术论文 篇2

【教学目标】

1、了解搜索引擎、关键字的概念及其作用;(知识目标)

2、掌握网络信息检索的几种主要方法与技巧,能够有效地获取网上信息;(知识目标)

3、培养学生有效地获取信息的能力,以及对所获取信息的鉴别与评价能力;(能力目标)

4、培养学生在网络环境下,探究性学习,自主性学习和多途径学习的能力。(能力目标)

【教学重点】 运用关键字进行搜索的方法与技巧。

【教学难点】 关键字的选择与组合、搜索方法的灵活运用。

【教学过程】

1、新课引入

提问:同学们上网搜索信息都使用过哪些方法? 根据学生回答,归纳出最常用的方法是使用专业搜索引擎,提出最常用的几个搜索引擎。

2、Google的使用 例1:用Google搜索关于九寨沟的文字信息。通过教师演示讲解,让学生掌握用Google搜索信息的方法。教师给出搜索引擎及关键字的概念,便于学生理解。分别用:九寨沟、九寨沟介绍、九寨沟旅游为关键字,进行搜索,对用不同的关键字搜索到的信息进行比较,理解关键字的作用。

3、百度的使用 例2:用百度搜索九寨沟的图片信息。通过教师演示讲解,让学生掌握用百度搜索信息的方法。

4、快速搜索信息的方法

活动

1、请同学们用百度搜索成都到北京的火车时刻表。收集学生的方法,比较用不同关键字进行搜索的效果。总结出,关键字用:成都北京火车时刻表,进行搜索时,因为更为明确搜索的内容,而大大缩小了搜索的范围。

活动

2、用google搜索歌名为“丁香花”的非RM格式的信息。收集学生的方法,比较用不同的方法进行搜索的效果。总结出,在关键字后面用英文的“-”(减号)就能减掉无关信息的搜索。

活动

基于文本的网络图像信息搜索技术 篇3

关键词:文本搜索,网络图像信息,搜索技术

在当今社会的网络信息存储中, 图像方面的信息占据了越来越重的比例, 根据之前的调查表明, 互联网上有80%的信息都来源于图像, 网民们对于图像的搜索需求越来越高。就目前的技术来看, 图像的搜索技术主要是基于文本和基于图像内容两种方法。在这两种技术方法中, 基于文本的网络图像搜索技术的不断发展, 更加符合绝大多数人的搜索习惯, 对于关键字的描述也相对准确。

1 基于文本的图像检索技术

1.1 什么是基于文本的图像搜索技术

基于文本的图像搜索, 就是指在收集图像的时候, 把这个图像周围的文本也一同收集了起来, 或是在搜索过程中, 图像中存在的文本被识别出来, 作为对于该图像的定量描述。基于文本的图像检索也就是通过关键字来进行图像检索, 非常地简便并且易于实现。

1.2 基于文本的图像检索技术索引数据库的建立

在基于文本的图像搜索技术中, 最关键要素就是索引数据库的建立。建立起这个索引数据库, 首先就要提取出跟图像的所有有关的信息, 比如图像的格式、名称和尺寸等。

1.3 基于文本的图像搜素技术的特点

根据当前的事情来分析, 基于文本的搜索存在着两方面的困难:一方面就是通过文本上的描述并不能准确表达图像的全部内容, 因为文字的描述能力有限, 它只能是通过定向的词语或句式来表达。一旦图像中出现了类似不规则形状或不常见的纹理时, 就很难应用文本对其进行解释。再有就是通过文本描述离不开会出现主观因素的形象, 当图像的内容过于丰富, 就会使内容上的描述具有很大的主观性, 那么这样的搜索方法会出现歧义。

但是基于文本的图像搜素技术也有很多优点, 比如说可以把图像的搜索转为了与图像相适应相符合的文本检索, 这样更加利于实现。另一方面, 由于文本搜索是人工来控制操作的, 所以它的查准率非常高, 可以用来辅助其他图像的搜索技术。

2 如何用文本的方法对图像进行搜索

2.1 图像关联文本的选取

基于文本的图像搜索, 其实就是找到与这个图像有关连的文本, 来对图像进行索引和标注。跟图像有关联的文本主要包括了文件的拓展名和超文本文件的图像标记符号。文件的拓展名就是图片的存储格式, 常见的有gif.、jpg.等, 根据这些文件的拓展名, 我们可以很好地定位图像信息。而超文本文件的图像标记符号其实就是让我们在实际的搜索中应用到超文本标记语言和可拓展标记语言。

2.2 文本匹配技术

当一个需要被搜索的图像里所有的文本都提取出来时, 就要根据这些文本的特征进行排序。不同的排序标准往往会出现不同的搜索结果, 比如根据图片的类型来进行文本搜索, 那么我们可能会搜索出特定的图片, 但如果是根据这个图片的内容在网站中进行搜索, 那么搜索的范围也会缩小。

3 如何对图像中的文字进行提取

3.1 基于文本区域空间频率特征的纹理方法

基于文本区域空间频率特征的纹理方法, 又称为纹理图像分割法。主要是采取了平稳离散的小波变换来对图像进行着分解, 由于纹理图像在局部的区域内是呈现不规则性, 但在整体中又表现出了规律性, 因此可以对其进行分割。这样的方法可以准确检测到字符与背景的对比度较小的文本, 但是也有一定的缺点:由于它产生的文本区域常常和附近的其他边缘轮廓相互黏接, 所以说不能得到文本区域的精确位置。

3.2 连通区域方法

根据图像进行连通区域的方法可以有效确定出文本区域的精确位置和大小, 但和基于文本区域空间频率特征的纹理方法相反的是, 它不能够检测到字符与背景的对比度较小的文本, 因此也有着自身的约束性。

3.3 神经网络方法

由于区域空间纹理法和连通区域法都有着自身的局限性, 所以提出了一种新的方法——神经网络方法。这种方法将纹理法和连通区域法进行了巧妙的融合, 通过整幅的彩色图像色调的直方图来对图像的颜色进行分类, 当字符和背景的对比度较小时, 根据图像中的其他像素颜色, 文本和背景的颜色就会在神经网络中形成一个绝大值。在实际的搜索中, 会用纹理法将图像分隔成一个个可能会包含着文本的图像块, 然后用区域法来确定文本的大小和具体位置。

神经网络的方法改进了纹理法和连通区域法中存在的不足, 是目前为止应用最为广泛的图像中文字的提取方法。

4 结论

其实基于文本来对图像进行搜索, 从根本上说就是利用文本的特征来准确搜索到图像, 在这里文本就是起到了桥梁的作用。在今后的生活中, 互联网将会是一个多媒体的网络, 除了文字外, 图像、音频、视频都在扮演着越来越重要的角色。随着基于文本的图像搜索技术发展水平越来越高, 也有着非常大的现实意义。但是技术的发展并不是一朝一夕可以完成的, 在现阶段的搜索技术力还有这很多问题, 显得不够成熟, 我们应该通过分析文本的图像搜索技术的优点和不足, 找出今后的发展方向, 推动检索技术更加成熟化发展, 给人们创造出更多的价值。

参考文献

[1]赖庆.基于文本的网络图像信息搜索技术[J].民营科技, 2008, (11) :30-32

[2]王占一, 徐蔚然, 郭军.智能文本搜索新技术[J].智能系统学报, 2012, (01) :40-49.

[3]阿斯艳·哈米提, 阿不都热西提·哈米提.基于文本的图像检索与基于内容的图像检索技术的比较研究[J].首都师范大学学报 (自然科学版) , 2012, (04) :6-9.

[4]韩泉叶, 杨晓健.文本信息搜索模型研究[J].兰州铁道学院学报, 2002, (01) :27-29.

实时信息搜索技术论文 篇4

信息技术

小学四年级下册

第 第 2 2 课

搜索信息真轻松

教学设计

教学内容:用浏览器搜索信息 教学目标:

知识与能力:认识常见的搜索引擎网站。

方法与过程:掌握用关键词搜索信息的操作。

情感态度与价值观:感受网络搜索的便捷。

学情分析:

信息技术课是学生最喜欢的课程之一,本课教学对象为四年级学生,他们已掌握登录互联网等相关知识。但学生的认知能力和掌握基础知识都不一样,所以为了保证教学质量考虑适当的分层教学。

教学策略与方法:以学生为主体采用任务驱动、情景教学法、协作学习法、分层教学法、赏识教育法。

教学重点:利用关键词搜索信息。

教学难点:利用网络选择适当的关键词搜索解决实际问题。

教学课时:一课时 教学环境及资源准备:

计算机网络教室、教科书配套资源 教学过程:

一.引入

师:看看他们在参加学校组织的什么活动? 生:运动会,六一运动会 师:快到“六·一”儿童节了,我们学校也要举办一场运动会,同学们想参加吗? 生:想 师:学校想从 5 月 29,30,31 日中选天气适合的一天开运动会,我们可以通过什么知道这三天的天气呢? 生:天气预报 师:通过什么方式能查看天气预报呢?

生:报纸、电视、收音机······ 师:老师告诉你们一个便捷的方法,用搜索引擎搜索。(板书课题:搜索信息真轻松)

二.新授

(一)认识搜索引擎 师:说搜索引擎是不是很陌生啊?那我们一起来看看吧,像百度、搜狗、谷歌都是搜索引擎。网络中有一种专门用来帮助人们搜索信息的网站,即搜索引擎网站,简称搜索引擎。

(二)搜索信息

(运用幻灯片给出明显的关键词,让学生自己提取,同时破谜题,激发学生兴趣。)

师:接下来我们用百度搜索引擎搜索天气预报吧!有人会用百度搜索引擎搜索信息吗? 找一名同学说步骤,老师演示。

师提示专业术语:输入文字的地方叫搜索框。

师:同学们学会怎么用搜索引擎搜索信息了吗?动手试一试吧 生根据关键词搜索。

请一位学生演示操作,并建议某一天开运动会。

师:同学们太棒了,这么快运用搜索引擎帮助学校和老师解决一个难题了。而且你们用的方法要比看报纸、看电视更便捷!

教师介绍关键词搜索及关键词:前面介绍的搜索方式叫作“关键词搜索”,输入的“天气预报”就是关键词。关键词可以是词组、短语,也可以是零散的能够表达要搜索信息特征的文字。关键词搜索是目前最常用的搜索方式,在以后的学习中,我们还要利用它来搜索音乐、视频等信息。

(三)搜索引擎大家庭

1.用搜狗搜索引擎搜索信息 师:搜索引擎除了天气预报,还能查很多信息呢,比如:老师周围有很多人去阿尔山旅游,所以我很好奇,阿尔山到底是什么样的?你们是不是也有同样的问题? 生:是 师:那我们可以利用什么可以快速的查找关于阿尔山的信息呢?

生:搜索引擎 师:请看任务提示卡:

任务一:用搜狗搜索引擎,搜索“阿尔山”。

(1)

关键词是什么?(2)

用搜狗搜索引擎搜索信息,网址:http://(3)

查找信息;(4)

展示搜索的步骤及搜索到的信息。

师:那我们接着浏览关于阿尔山的信息吧(三分钟)。

师:大部分同学还是对阿尔山的风景感兴趣,那用“阿尔山风景”作关键词搜索,搜索到的信息有什么区别?你发现了什么?同学们带着这两个问题分别用“阿尔山”和“阿尔山风景”关键词搜索信息。

师:用两种关键词搜索后现搜索到的信息发有什么区别了吗? 生:关键词写的越详细,搜索的范围越小 师:搜索阿尔山风景,选出自己最喜欢的一张图片。

请一位学生演示操作,展示自己最喜欢的图片。

教师给予积极评价。

2.用必应搜索引擎搜索信息

师:除了这些,用搜索引擎还能搜索什么信息呢? 生:电视节目、诗、作文、不会做的题······ 师:这么多,那我们分组来完成任务二吧,请填写任务提示卡并按要求完成:

任务二:用必应搜索引擎,搜索信息。

(1)

用必应搜索引擎搜索信息,网址:;(2)

共分为 4 组;每组完成一个任务。

(3)

任务 A:CCTV 少儿频道今天的节目表? 任务 B:蒙古人用英语怎么写? 任务 C:成吉思汗的生辰? 任务 D:五岳是什么?(4)

搜索的关键词是();(5)

查找信息;

想一想:浏览搜到的信息时你会只阅读一个搜索结果并相信它是真的吗?

()

(6)

展示搜索的步骤及搜索到的信息。

师组织学生分组,确定每组查找关于什么的信息,生在组内讨论关键词,并按要求查找信息、展示。

集体对每组的展示作评价。

(四)多个关键词搜索 (从易到难,由少到多提取关键词,设置情境,持续吸引学生的注意力,培养学生运用网络解决问题的能力)(7 分钟)

师:完成了前面的任务,你们可不要沾沾自喜,那只是基础知识训练,这里还有更大的挑战等着你们,准备好了吗?

师:请完成任务卡上的任务三,并把结果填写吧!

师读任务三的要求。

任务三:听歌找歌名 听《相信自己》的片段。

(1)我是偶然听到这首歌的,它的歌词中写到:

只因为始终相信,去拼搏才能胜利,总是在鼓舞自己,要成功就得努力,热血在赛场沸腾,巨人在东方升起,相信自己,你将赢得胜利,创造奇迹!非常励志,鼓舞人心!老师非常新欢这首歌,但是不知道歌名,同学们能帮助老师吗?(2)用什么方式查找歌名更便捷?(A、查看歌词集

B、用搜索引擎搜索)

(3)你要用什么搜索引擎?()

(4)你要搜索的关键词是:()

(5)你判断的最终结果是:()

生: 思考,阅读,讨论,寻找关键词

学生根据关键词搜索。

师提示:多个关键词搜索 生: 学生根据关键词搜索,找出歌名。

生演示过程。

教师评价:这回同学们利用搜索引擎可是帮了老师一个大忙,谢谢你们!

师小结:只因为始终相信,去拼搏才能胜利,总是在鼓舞自己,要成功就得努力,要成功就得努力!相信自己!

三、总结

通过本次课我们应掌握以下内容:

1、认识常见的搜索引擎(学生回顾)

搜索引擎的功能:搜索信息!

2、运用贴切的搜索关键词进行信息的搜索;(学生回顾)

(1)访问搜索引擎(2)输入合适的关键词搜索(3)从搜索到的信息里寻找对我们有用的信息

希望同学们能运用互联网有目的地进行学科知识探究、学习以及帮助家人解决在实际生活中遇到的问题!

四、作业 1.利用多种搜索引擎搜索下面的关键词。

天安门

长江

黄河

长城

故宫 2.以自己的生日为关键词搜索信息,看看当时世界上发生了什么事情。

板书设计:

实时信息搜索技术论文 篇5

现阶段,是信息化的时代,网络资源的合理利用尤为重要。一些网络管理体系正在建立和发展,网络资源的搜索也是网络管理的重点和难点。但是,国家也很重视网络信息的合理利用和推广,并加大了投资力度,网络资源的信息搜索能力也正在显著提高。目前的发展现状是网络信息的属性存在差异,各自都有自己的区域,这样很难建立有效的关联来统一管理,做不到信息的共用共享。而网络信息搜索的目标是随意调用网络资源的所有信息数据,实现资源的合理利用。现阶段采取的网络资源信息搜索主要有下面几种:蚁群算法、异域算法和神经网络算法等。这几种算法中以信息异域算法为应用最广泛的方法,其搜索向智能化发展,是网络资源信息搜索的重点研究方向,并已经取得了一定的研究成果。

网络资源信息平台搜索原理

1 基于关联性系数的信息搜索理论

网络资源信息搜索平台,是衡量一个网络资源管理发展程度的重要标准。对网络资源信息搜索有一定的优化作用,这个平台在更新网络信息方面有一定的时效性,可以提高网络信息的管理水平。利用网络资源信息搜索,能够将不同属性的网络资源信息进行整合,从而快速搜索更多不同属性的、有价值的网络资源信息,最终提高网络资源信息的搜索效率。

网络资源信息搜索是按照不同局域网络进行区分的,用户通过所在属性的网络资源信息搜索进行信息查找,从而获取需要的相关资料。用户需要查找网络资源信息时,需要提出申请,并且将该申请利用网络接口传递到信息处理中心。信息查找的基本原理如下:

假设网络资源信息搜索中包括的局域网数目是n, N是与网络资源信息搜索基础结构匹配的管理中心数目,是网络资源信息搜索第j个管理中心执行参数,是不同局域网网络资源信息搜索用户申请数目,是全部网络资源信息数目。利用公式(1)能够计算网络资源信息搜索差异参数:

利用公式(2)能够计算网络资源信息搜索关联系数:

利用公式(3)能够计算需要查找的准确的网络资源信息的时间系数。这个系数代表搜索的耗时:

2.网络资源信息搜索中的不足

目前的信息资源数据都有自己的区域,很难找到不同区域的信息资源间的关系,这对信息资源的统一管理增加了难题,这对网络信息的搜索造成了困难,我们看一下网络信息的属性差异,根据公式(1)能够得知,信息数据有着很大的属性差异,会提高参数的差异。依公式(2)可以算出,提高信息参数的差异会导致数据信息间难以建立关系。依公式(3)可以算出,关联性的减少就会导致所有信息资源的时间延长,搜索速度会很慢。

以上不足直接影响网络信息搜索的发展,所以,找到一种融合信息间差异的算法对信息资源进行优化是非常重要的。网络资源需要建立相应的模式进行管理,可以处理不同的信息资源,以达到完善信息资源搜索的目的。我们调整网络信息的结构,处理不相同的网络信息间的关系,进而优化信息数据的搜索效率。这样可以依据网络信息的结构关系,对不同的信息资源进行管理,提高网络信息的利用率,进而弥补信息资源存在差异的不足之处,完善信息资源的搜素能力,进一步提高工作效率。

有效提高信息平台搜索能力的手段

根据SEO的特有性,对ASP.NET进行优化,其主要的方法有一下几个方面:

1.Url的静态化地址意义

URL的静态化在搜索中具有重要意义,我们看一下URL的两种方式:动态化和静态化。动态化地址有一些难以理解的参数,让搜索很难进行。如:http://www.hao123.com/product.aspx?id=1&category=2

而我们在比较一下静态化的地址,如:http://www.hao123.com/product/1/2/

或者, http://www.hao123.com/index.html?tn=24027068_1_hao_pg我们看出静态化的地址更加易于搜索,在这个搜素引擎中有hao这样的容易理解的词语。所以,显得很有意义。这让整个URL地址更加明朗,更适应网络的发展。还有一点好处是可以隐藏一些信息,对网络安全有重要意义。其中,URL静态化的实现方法很多,其中包括:Web服务器、Http模板和网页界面等。

2. ViewState的合理控制

我们了解,ASP.NET的地址中Viewstate是一种隐含的字符串,它是客户端的重要内容。但如果内容过多会影响搜索引擎的搜索,因为网络蜘蛛只能抓取100K的字符内容,内容过多会影响网络蜘蛛的正常判断和抓取,这样不利于网址在网站中的名次。所以,在不需要Viewstate或者尽量可以减少Viewstate的内容时,应该进行关闭或者缩减,以免影响网络蜘蛛的内容抓取。我们还可以对它进行控制,例如,把Web.con-fig文件中加入,这样把Viewstate放在页后也可以避免影响网络蜘蛛的抓取。

3. 分页控件的合理应用

科学合理的使用显示数据插件也是一种好的优化数据分页手段,这种控件可以减少代码量,使用起来方便简单。我们看一下GridViews这种控件,它的工作原理是利用Viewstate来实现回传。但这样还会影响url的搜索,因为分页会影响网络蜘蛛的抓取,网络蜘蛛对分页的内容不会进行录入,这使搜索引擎很难正常对网址进行排名。所以,采用控件Repeater是一种很好的分页控件,它可以编程分页程序,还能保证网络蜘蛛的正常抓取,完全解决了以上的难题,让数据分页更加合理。

4. Sitemap的职能辅助作用

智能抓取是搜索引擎最需要的辅助工具,Sitemap可以辅助搜索引擎进行智能抓取。它可以给搜索引擎提供网址。我们看一下XML文件,作为Sitemap的普通形式,它可以分析出每个网站的一些元素。如:更改数据,更新时间等。这对搜索引擎的辅助是极其重要的。

网络蜘蛛的查找方式都是根据自身网站或者其他网站进行搜索,Sitemap就是利用抓取工具对Sitemap提供的网址进行抓取,并合理的分析所提供的数据信息。我们看一下Sitemap的分类:1.协议性Sitemap,这种方式是给搜索引擎提供协议性的抓取数据;2.导航性Sitemap, 这种方式是网址自己经过处理,让用户便于了解的方式。协议性Sitemap是大众公用授权,它是遵循Sitemap 0.90的要求, 受到了雅虎、酷狗和谷歌等多种搜索引擎的支持,是被广泛应用的一种方式,而且其标准也受各厂商的肯定。我们在看导航性Sitemap,它是网站自身的导航方式,它把自身的各个节点充分的展现,让用户可以清晰的看出这个网站的内部结构。这对ASP.NET非常重要。所以,Sitemap一定要建立两个方式,这对网络蜘蛛的抓取很重要,可以展现网站的结构,便于网络链接。

5. 重定向的重要作用

ASP.NET网站会遇见一下错误,这会影响搜索引擎的使用,更影响了用户对搜索引擎的使用率。我们看一下常见的问题包括:运行程序错误、服务器错误,页面不存在等。所以,有效处理这一问题是提高搜索效率的关键。处理出错定向状态码非常重要。

我们可以采用增加配置的方法进行调整, 在web.config的system.web中加入:

RedirectMode的设置ResponseRedirect时, 将用户重定向到该错误页面, 并且原始网址变成该错误页面的网址。RedirectMode属性设置为Respon-seRewrite时, 不改变浏览器的原始网址,就可以重新定位错误页面,就可以实现在自定义方式。所以, 在搜索过程中, 转向会发挥作用,重定向就是当浏览用户或者搜素引擎在对错误界面进行点击浏览时,服务器可以把错误的网页直接转移到重定位的网页。所以,当需要传递RP值并转向时,为了提高搜索引擎的抓取,需要采用301进行转向,把老的网址转移到新的网址。可以保持原域名与新域名见得关系(如数据等)。而且这种方法的实现容易,我们只需要在原网页的Page Load中写入以下:

6. 合理优化AJAX技术

ASP.NET的AJAX技术非常重要.所以,合理优化AJAX是重中之重。Javascript是AJAX技术得以实现的基础。但是,Javascript确是搜索引擎中的重大隐患,因为,由于它的应用会引起网络蜘蛛的不收录,这对AJAX完成网址搜索提供了障碍。所以,Sitemap在建立静态化连接中,不进行Javascipt的功能就可以实现页面初始化是解决这一问题的重点。因此,一定要科学优化AJAX技术。

基于搜索引擎的信息查询技术研究 篇6

搜索引擎为人们查找信息提供了极大的方便,通过搜索引擎可以大量地、准确地、快速地获取信息,输入关键词就可以查找到所需要的资料。搜索引擎是某些站点提供的用于网上查询的程序。它实际是一个专用的WWW服务器,搜索lnternet上的网页、网站及数据库等信息,组成庞大的索引数据库。通过网络搜索软件或网站登录等方式,收集因特网上大量网站的页面,经过加工处理后建库,从而能够对用户提出的各种查询作出响应,并提供所需的信息。搜索引擎是目前Internet对信息资源进行组织的主要方式,其主要功能是信息组织和信息检索。其重要性已成为网站建设的重要功能,成为搜索网络信息的主要途径。

二、搜索引擎的查询技术方法

1、使用具体查询条件

在查询中,要使用查找内容中比较特殊的短句或单词,输入的关键词或词组要尽可能多,尽可能精确。比如查找有关“Word高级排版的具体使用方法”的文章,可以输入查找内容“Word高级排版”,但不要仅输入“Word”。两种查询所返回的搜索结果数量是不同的。第一种条件返回的搜索结果数量比第二种搜索条件返回的搜索结果数量少许多。所以,为了搜索结果的准确,查询条件要具体一些,查询条件越精确、越具体,搜索所得的结果范围就越小,文档的相关性越强,就越容易找到需要的文档。

2、使用布尔表达式

使用布尔表达式的进行检索称为布尔检索,如“和”(And)、“或”(OR)、“非”(NOT)。不同的搜索引擎在布尔检索的具体表达式写法上有区别,使得在使用布尔检索方式时,会出现一些错误,从而影响到返回的搜索结果。正确的使用不同搜索引擎工具的布尔表达式可以减少搜索结果的返回数。

3、使用加号、减号连接符及“*”通配符

需要确认搜索结果中包含所在查询的词,而不是一部分。这时可以使用加号或是空格。如键入“+信息化+教育技术”,会找出包含关键词“信息化”与“教育技术”两方面的信息;但键入“信息化+教育技术”,检索的结果内容中一定包含关键词“教育技术”的信息,但不一定包含“信息化”的信息。

当需要在查询某个内容时,又不希望在这个内容中包含另一个内容,可以使用减法中的减号。例如搜索所有包含关键词“搜索引擎”和“历史”但不含‘文化“、“中国历史”的中文网页,可以搜索“搜索引擎历史-文化-中国历史”,但在减号前留一个空格位。

在搜索结果包括不同的拼写或单词结尾,插入一个符号,通常是*。可以将相同词干的词全部检索出来。但“*”不能用在检索词的开始和中间。例如;检索式“information*”,可得到informational,informationism,informationlization等结果。

4、使用短词、短语检索

为了提高查询的准确率,许多搜索引擎都提供短词组、短语检索的功能。短词组、短语是将自然语言中的语句,分解为多层次的语义结构网,处理为短语检索式,作为入口词进行检索,充分借助计算机在字形匹配的快速运算能力[1]。如查询“为什么天空是蓝色的”,可以输入“天空蓝色”这一短语进行检索,就能够快速、直接地获得准确的信息回馈。在搜索引擎中,乘法的公式是:“短语”。这一公式可以使搜索结果非常准确。

5、关键词之前添加t:或u:

在搜索的内容之前添加t:,仅会查询到该网站名称。例如:键入t:电影,会找出包含电影的网站名称。在搜索的内容之前添加u:,仅会查询到该网址。例如:键入u:taiyuan,会找出包含taiyuan的网址。

6、使用双引号、括号

运用简单查找出现的是大量不需要的信息,但如果使用双引号查找一个词组或多个汉字时,会将括在其中的多个词被当作一个短语来检索。会得到最少、最精确的结果。例如在查询框中输入“学习成绩管理系统设计”就等于告诉搜索引擎只反馈回网页中有学习成绩管理系统设计这几个关键字的网址,这会比输入学习成绩管理系统设计得到更少、更好的结果。

利用()可以把多个关键词作为一组进行优先查询,用于改变复杂检索式中固有逻辑

运算符优先级的次序。例如:键入“(计算机+网络)-(硬件+价格)”,表示先执行括号中的运算,再执行括号外的运算。即搜索包含“计算机”与“网络”的信息,但不包含“硬件”与“价格”的信息。

三、搜索引擎查询技术展望

搜索引擎为用户检索网络信息提供了方便,搜索引擎运用了许多领域的理论和技术,拥有大量的用户,有很好的经济价值。随着WWW信息的指数增加,搜索引擎将向适应不同用户需求的方向发展,并且取得了很好的成果,同时对搜索引擎查询技术也有了更高的要求。

1、提高检索功能与信息查询结果的准确性

搜索引擎的检索功能强大,支持布尔逻辑检索、词组检索、截词检索、字段检索、限制检索和位置检索等功能。在进行信息查询时,返回的结果数量往往很多。解决查询结果过多可以使用智能代理跟踪用户检索行为,分析用户模型;使用相关度反馈机制,使用户告诉搜索引擎哪些文档和自己的需求相关,哪些不相关,通过多次交互逐步求精。也可以使用可视化技术显示分类结构,但要注意分类的合理性、分类是否完善、是否提供交叉显示功能、类名是否规范、各类内容的说明是否清楚等。这样可以方便地让用户找到自己所需要的信息,大大提高检索的效率。

2、智能型的搜索引擎

智能型搜索引擎将整个互联网作为一个整体的、超大型的、动态的数据库处理,对自然语言的检索具有一定的处理能力,能充分利用分词词典、同义词典、同音词典改善检索效果[1],它将收集用户信息,帮助用户制定检索策略,分析用户数据,创建符合用户特性的访问模式,进行信息索引、过滤,对搜索结果进行排序,并整理检索结果,将有用的信息提交给用户,使得用户获得最佳的检索效果,从而达到个性化搜索。智能型的搜索引擎充当用户和网络信息检索工具的中介,为用户提供一个真正个性化、智能化的网络信息搜集工具。

3、多媒体、个性化的搜索引擎

随着宽带技术的发展,未来的互联网是多媒体数据网络,多媒体检索主要包括声音、图像、视频的检索。比如风景方面的视频资料,使用多媒体检索系统,就可以在多媒体数据库中查找到与该风景资料类似的视频文件,以满足用户的特定需要。

个性化的搜索能够按照不同的个性需求调整搜索的结果,例如可以选择时间排序、重要性排序、地域性排序等方式,即将搜索建立在个性化的搜索环境之下,跟踪用户的搜索行为,通过对用户的不断了解、分析,积累用户的搜索个性化数据,提高用户的搜索效率,使用户得到满意的搜索结果。

4、突出专业性特色及用户友好化

每一学科专业都有自己独特的词汇及用语,特定的专业信息检索工具使用相应的标引和检索语言,网络信息检索工具应注重突出专业特色、针对性强、实用性强的特点。检索结果输出形式应具有易用性、直观性、结构清晰、方便用户进行浏览、选择和利用检索信息,先进友好的结果直接影响到用户对信息的吸收和利用[4]。

随着网络技术的进一步发展,搜索引擎拥有了大量的用户群,网络搜索环境也越来越完善。我们应通过实践,体会每个搜索引擎的特色和功能,积累优秀的专业网站和数据库网址,掌握搜索引擎的检索方法,进一步提高检索技术及对信息的分析与处理能力,满足我们对网络信息的需求。

参考文献

[1]陈湘.搜索引擎之我见[J].中国索引.2007.2.

[2]任玉梅.网上搜索引擎信息查询的方法[J].机械管理开发.2009.12.

[3]廖大容.浅析网络信息检索的方法—搜索引擎[J].内蒙古科技与经济.2009.9.

[4]吴楠.Web搜索引擎检索技术的分析与展望[J].淮阴师范学院教育科学论坛.2007.2.

[5]陈志新.搜索引擎的发展趋向和建设思路[J].农业图书情报学刊.2009.10.

信息技术与实时动态企业报告探讨 篇7

注:“信息池”包含企业的采购信息、生产信息、销售信息、人事信息、财务信息等全方位的信息。

1 自助式企业报告的优点

第一, 自助式企业报告具有更强的及时性和相关性。传统的企业财务报告为定期提供, 经济业务发生时点与报告使用者通过企业财务报告获取到该信息的时点具有较长的间隔, 降低了信息的及时性和相关性。举例说明, 假定某企业在2014年4月份发布了企业2013年的年度财务报告, 该企业2013年10月份的信息经过半年之久才传递到财务报告使用者的手中, 该企业10月份的信息的及时性和相关性大为折扣。然而, 如果存在自助式企业报告体系, 信息使用者可以在2013年10月或者11月就获取到该信息。

第二, 自助式企业报告提供的信息更为全面, 尤其是非财务信息, 可以满足不同的信息使用者的不同需求。传统的企业财务报告以财务信息为主体, 而会计要素的确认受限于可计量性、客观性等方面的要求, 财务信息并不能放映出企业全貌。非财务信息涉及的范围甚广, 不同的报告使用者所需求的非财务信息是不同的, 我们很难确定哪些信息是报告使用者所不需要的, 以及受制于传统披露成本因素, 企业财务报告并没有包含报告使用者所需的全部信息。自助式企业报告的“信息池”包含了采购信息、生产信息、销售信息、人事信息、财务信息等企业全方位的信息, 每一个信息需求者都可以在该“信息池”里找寻到他所需求的几乎全部信息。并且, “信息池”与企业的信息系统相连, 通过信息技术自动更新, 可以降低信息的提供成本, 可以提供更为全面的非财务信息。

第三, 自助式企业报告可以降低交易费用, 减少信息的不对称, 维护中小投资者的利益。实际中, 大股东和机构投资者由于具有规模优势, 往往会通过其社会资源 (比如人脉关系和实地调研) 更早的获取企业的信息和获取更为全面的相关信息。小的投资者由于不具有规模优势, 无法承受搭建人脉关系和实地调研的成本, 无法及时获得其所需要的信息和获得除财务报告以外的其他信息, 从而在与大的投资者博弈过程中处于不利地位。如果建立了自助式企业报告体系, 任何一个投资者只要拥有一台电脑, 就可以及时获取到他所需求的几乎全部信息, 大股东与中小投资者的信息不对称性可以显著减少。

2 构建自助式企业报告体系面临的困难

第一, 如何防止过度披露以至于泄露企业的商业秘密。由于自助式企业报告可以提供企业全方位的信息, 并且是实时信息, 一方面如果一些信息为竞争对手所利用, 那么该企业在竞争中就可能会处于不利地位, 另一方面如果一些信息为供应商、经销商所获知, 那么该企业在谈判中就可能会处于不利地位。不过我们可以将这些会泄露企业商业秘密的信息予以筛选剔除。

第二, 如何提高自助式企业报告信息的可靠性。由于自助式企业报告提供的信息是实时的持续性的、动态的, 传统的审计模式难以发挥应有的作用。并且自助式企业报告提供的信息量更大, 非财务信息所占的比重更大, 如何构建新的审计模式或者监管体系来确保信息的可靠性成为新的难题。

3 如何构建自助式企业报告体系

假若构建自助式企业报告体系, 本文认为可以采用以下步骤:

第一, 确定自助式企业报告应当提供的信息, 包含两方面的要求:确定信息需求者所需要的信息和筛选出会泄漏企业商业秘密的信息。可以采用问卷调查的方式, 首先向信息需求者 (包括投资者、债权人、员工、社区居民、政府部门等) 发放问卷, 确定信息需求者所需的信息。接着, 向企业经营者和专业人士发放问卷, 确定企业可以提供的信息和将会会危机企业商业秘密的信息。最后进行汇总比较, 确定自助式企业报告应当提供的信息。

第二, 构建自助式企业报告信息系统和监管体系。构建自助式企业报告信息体系需要信息技术人员与其他人员跨领域合作, 构建的信息系统能够实时更新, 能够支撑信息使用者的访问, 并且能够防止电脑黑客的入侵。为了确保自助式企业报告提供信息的可靠性, 我们需要建立新的审计模式和监管体系。同时自助式企业报告体系也将会影响审计模式和监管体系, 比如, 如果建立了自助式企业报告模式, 审计时就可以将有业务往来企业提供的信息进行比较, 来检验是否相符, 甚至该比较工作可以由电脑自行完成。

参考文献

[1]蔡海静.企业整合报告理论:历史演进与发展趋势[J].财会通讯, 2012, (2) .

实时信息搜索技术论文 篇8

1 飞机维修信息管理概述

早在工业革命时代, 人们设计并制造了飞机, 带动了相关产业链条的发展。当我国进入到信息时代以后, 飞机制造机维修业凭借计算机信息技术, 革新了一项又一项生产与维修技术手段, 更加合理的使用、管理飞机。可见, 诸多技术的实践, 推动我国航空事业的良性发展。

1.1 飞机维修信息管理模式促进该项工作的有序执行

飞机维修信息管理系统是航空公司飞机维修工作的一体化运行平台。在这一平台至上, 可以实现飞机维修工程技术、质量监督、飞机日常维护等关键领域的管理工作, 提升了飞机维修环节管理的效率。飞机维修信息管理平台能够对飞机应用过程中的数据、内容以及业务流等信息进行集中储存与管理, 以便于在飞机维护过程中随时调用有益信息, 从而规范飞机维修流程。该系统提供维修数据信息的过程具备智能化的特征, 将大量储存数据在短时间内进行筛选与分析, 从而辅助工作人员对飞机做日常维修和检查工作, 而且, 每个工作环节都可以实时预警, 降低维修失误的概率。

1.2 分析搜索引擎技术对于飞机维修信息管理的重要作用

搜索引擎技术的应用, 能够加快飞机维修信息数据的查找速度, 其智能化的搜索功能, 令飞机维修信息记录在输入相应的指令后快速的呈现出来, 从而缩短维修管理的时间, 提升服务效率。经过搜索引擎技术与飞机维修系统的整合应用, 提升了飞机维修信息管理系统的多项智能特性与信息数据搜寻的效率:通过飞机维修信息管理系统中机型维护功能的应用, 对飞机的所有部件进行登记维护, 这是实施信息管理的首要步骤;通过质量监控步骤的应用, 将飞机发动机数据、零部件数据以及维修记录进行实时管理, 而且, 可将飞机每天的飞行数据进行维护与调用, 从中挖掘出飞机可能出现的故障;在搜索引擎技术的支持下, 以及在飞机维修工程技术智能的作用下, 飞机维修信息管理系统可将技术文件、技术资料、工程指令、工程通告以及技术培训等信息进行统筹, 以便于当飞机发生故障或预警时, 能够从中找寻到相应的处理痕迹, 从而对飞机维修工作做较为细致的记录。

2 基于搜索引擎技术的飞机维修信息管理系统的发展方向

飞机维修信息管理系统不仅能够对航天制造类企业的各项生产控制环节进行信息管理, 还能够对航天制造所需的材料应用进行跟踪与管理, 这需要更高级的信息处理技术进行系统管理与维护。其中, 基于搜索引擎技术的飞机维修信息管理的生产控制职能的实际应用包括:飞机定期检查内容的编制、安排具体的定检计划的执行步骤、维修工作计划与故障信息记录等内容;航材管理的内容包括:对各种情况的飞机制造及维修物料进行管理与追踪, 将飞机的送修、转移等信息数据录入系统, 并且能够随时将数据信息通过搜索引擎手段调出来, 将其应用于实践, 从而实现维修信息的智能化管理。

基于搜索引擎技术的飞机维修信息管理系统的应用简化了实际维修管理的工作步骤, 该系统把复杂的数据检索资料与飞机维修业务关联起来, 革新了传统的管理流程, 在保证飞机维修质量的基础上, 提升了工作效率[3]。搜索引擎技术的应用缩短了飞机维修数据信息的查找时间, 改善了维修工作的实际能效。飞机维修信息管理模式的未来发展将会呈现出更加智能化、个性化的趋势, 融合更为先进的智能化搜索技术, 将我国航天航空事业做大做强。

3 结束语

在实践过程中, 飞机维修信息管理技术的提升依赖于现代化搜索引擎技术的整合, 从而增强此项工序的执行效果, 完成飞机维修信息管理系统的构建。通过研究现代航空制造类企业的业务工作的各项环节, 尤其是维修信息管理系统的有序运行, 对我国现代化飞机维修信息管理技术有极大的信心。飞机维修信息管理系统对于信息数据的处理更为精准, 又花了以往飞机维修信息管理的模式, 为客户提供更为人性化的服务项目。相信在搜索引擎技术以及其它计算机应用技术的支持下, 我国的航天事业与相关制造企业的发展空间巨大。

摘要:飞机维修信息管理的相关技术随着现代科技的发展而产生重大变革。保持飞机飞行安全是一切技术执行的前提条件, 在这一目标的导向下, 制定出合理的维修方案, 采取较为经济、高效的维修手段, 是当下亟待解决的问题。本文就搜索引擎技术层面下的飞机维修信息管理模式进行简要分析, 提出合理化的执行建议, 并且在实践过程中进行了相应的技术测试, 以供参考。

关键词:搜索引擎技术,飞机维修,信息管理

参考文献

[1]吴昊.基于案例推理的民用飞机系统维修间隔确定方法研究[J].航空维修与工程, 2011, 4 (04) :166-167.

[25]吴兴旺.民航飞机维修管理思想介绍及其对其他工业领域的启示[J].机电技术, 2010, 10 (20) :156-157.

[2]吕志刚, 宋笔锋, 戚燕杰.第三代飞机寿命确定的技术问题[J].空军工程大学学报, 2010, 2 (04) :112-113.期.

[3]孙侠生, 肖迎春, 张积广, 李野.飞机结构健康监测技术进展及发展趋势[J].结构强度研究, 2010, 12 (06) :133-134.

[4]吕志刚, 戚燕杰, 刘马宝, 李立人.提高飞机结构安全性与经济性的新对策——ICMS技术对保证飞机结构安全与经济使用的重大作用[J].中国民用航空杂志, 2010, 6 (06) :178-180.

实时信息搜索技术论文 篇9

大部分动态车间调度研究都专注于问题规模、算法收敛速度而忽略了工件本身的数据结构和它们之间可能存在的关系。于是, Mohammad提出了一种改进的变邻域搜索算法 (Modified Variable Neighborhood Search, MVNS) , 即搜索前采用K-means聚类后, 利用工件之间的距离来得到更好的结果。但是, 变邻域搜索较为简单, 对所得结果准确度的提升有限。而GA等算法在迭代时因群组过大会出现耗时太长的问题, 因此, 本文采用将分散搜索与改进的变邻域搜索相结合的方式来完成全局搜索。在大规模的车间调度下, 采用这种全新的混合分散搜索算法 (Hybrid Scatter Search, HSS) 来解决动态车间调度问题对实时性有较高的要求。实验结果显示, 与现有的几种动态车间调度算法相比, 这种新的算法得到了更好的结果, 凸显了其实时性和高效性。

1 混合分散搜索算法 (HSS)

与静态车间调度问题相比, 动态车间调度问题中所有的工件并不是在调度一开始就到达的, 而是随着调度的进行而逐渐到达工厂。除此之外, 在动态车间调度问题中, 我们还需要考虑机器的损坏。动态车间调度算法就是解决如何在这种情况下找到一种优化的工件调度序列。

分散搜索算法 (Scatter Search, SS) 是一种已经被成功应用到很多领域来解决优化问题的算法。由于分散搜索的每个步骤都是独立的, 可以分别改进, 因此具有很高的可调整性。除了五个标准的部分外, 我们还在分散搜索中引入了精英策略, 以确保最好的调度个体不会在进化过程中遗失。图1所示为混合分散搜索算法流程。

动态环境中, 机器故障和新工件的增加使得原来的调度已不再适应新的局面。因此, 在发生这些事件时, 需要重新调度。图2所示为实时动态系统。在初始状态下, 有3 个工件, 每个工件有3个工序, 其加工时间都为1.图2 (a) 为整个系统的初始态;图2 (b) 为在正常运行条件下且时间等于1 时, 工件1, 2, 3 的第一个工序均已完成;图2 (c) 中的机器3 发生了故障, 维修时间为1, 系统重新调度, 将工件2 的第二个工序的加工时间延迟了1;图2 (d) 为新工件到来, 可以看到工件4 被置于整个调度中。

本文研究的是10 台机器 (6 台机器以上为复杂的车间调度问题) 处理300 个工件, 每个工件有10 个工序, 每个工序的处理时间均平均分布, 工件到达车间的时间按照泊松分布。在计算平均流程时间时, 由于工件会无休止地到来, 因此采用从稳定态到某一个时间点的算法计算。这种计算方法避免了初始态不稳定的情况对结果造成影响。

1.1 编码方法和适应度函数

在车间调度算法中, 一个关键问题是如何将一个调度计划编码成一种合适的形式。不同的编码架构有不同的优缺点。在研究中, 我们采用了一种基于工序的表示方式。采用这种编码方式可将一种调度计划编码成一个工件编号的序列。假设每一个工件都必须在m个机器上加工一次, 在这种编码方式下, 每个工件编号都将出现m次。通过从左到右依次对编码序列扫描, 我们得到的第k次出现的某个工件编号代表了这个工件的第k个工序。比如, [2 1 3 2 3 3 1 1 2]这串序列就代表了以下这些工序的排序:[O21, O11, O31, O22, O32, O33, O12, O13, O23], 其工件的加工顺序如图3 所示。

适应度函数是车间调度问题中的另一个关键性问题。我们用适应度函数来评价所得到的不同调度计划的表现优劣。在静态车间调度问题中, 我们的优化目标是最小化调度计划的总制造时长 (makespan) 。然而, 在动态车间调度问题中, 通常, 我们的优化目标是最小化所有工件的平均制造时间。在本文中, 一个调度计划S的目标函数被定义为:

式 (1) 中:n为当前已经完成的工件个数;tck为第k个工件的完成时间;trk为第k个工件的到达时间。

1.2 多样性生产方法

基于给定的初始解, 多样性生成方法将产生一组多样性的调度计划作为整个分散搜索算法的第一代解。“多样性”这个词的含义可以理解为, 产生的这些第一代调度计划和初始解具有很大的不同, 并且每个解之间也具有很大的差异。生成的方法可用以下公式表示:

S (h∶t) ={[t], [t+h], [t+2h], …, [t+rh]}. (2) 式 (2) 中:h待定;t=1, 2, …, h, t+rh<l, l为初始解长度。

比如, 给定初始解p= (1, 2, 3, 4, 5, 6, 7, 8) , 如果我们选择h=4 作为多样性生成方法的参数, 那么将得到

p (4∶4) = (4, 8) , p (4∶3) = (4, 8) , p (4∶2) = (2, 6) , p (4∶1) = (1, 5) 。合并这4 个集合, 我们将得到一个新解p (4) = (4, 8, 3, 7, 2, 6, 1, 5) 。类似地, h取n个不同的值, 就可以得到n个不同的解。

1.3 改进部分:结合聚类的变邻域搜索

在用于解决静态车间调度问题的分散搜索中, 这个步骤则为简单的局部搜索。本文采用了结合MVNS的搜索方法:在工件进入车间后, 我们会根据工件本身的特性, 即在各个机器上所需的加工时间用K-means对其聚类。聚类的依据为加工时间的相似度, 相似度越高, 越可能被分为一类。这个分类信息在接下来的交换和插入中会被用到。简单来说, 相距越远的两个类中的工件, 越容易被选中并进行变换, 距离计算公式可参考公式 (2) 。由于距离越远, 意味着两个工件的加工时间差异越大, 交换或者插入这两个工件越容易使整个调度产生更大的变化, 从而使整个搜索变快, 更快地取得更出色的解。

总体的思路如下:

初始化:选择一组用于搜索的邻域Ni (i=1, 2, …, imax) , 产生一个初始解, 设置终止条件 (迭代次数为N) 、设置聚类数。用K-means完成聚类, 计算各类中心之间的距离。

重复以下步骤直至满足终止条件: (1) 设置i←1. (2) 重复以上步骤, 直到i=imax. (3) 随机搜索。根据聚类中心的距离, 随机在第i层产生解x´ (x´∈Ni (x) ) 。 (4) 局部搜索。将上一步得到的x´作为初始解进行局部搜索, 得到局部最优解x´´. (5) 更新。如果x´´比x´好, 则用x´´代替x´, 并在N1 (i←1) 中继续搜索;否则, i←i+1.

VNS算法非常简单、有效, 已经被广泛运用于很多这类问题的优化中。简单来说, VNS的中心思想是在初始解的附近搜索, 如果没有找到比初始解更好的解, 则跳到下一层, 直至k层;如果有比初始解更好的解, 则替换初始解再搜索, 原理如图4 所示。VNS算法优于一般局部搜索之处在于, 它的搜索范围在不断变动, 更加灵活, 所以收敛速度也快得多。

对于VNS算法中“邻域”的定义, 本文采用的是交换和插入, 其中, 交换是指两个工序交换位置, 互相替代;插入是指一个工序插到另一个工序之前。这里要变换的两个工序并不是完全随机挑选的, 而是要结合K-means算法的结果。在这个调度算法中, K-means算法的分类依据为最小方差和, 具体计算公式如下:

式 (3) (4) 中:k为分类的数量;Xij表示第j个工件被分在第i类;Ci为第i类的中心;ni为第i类工件的个数。

1.4 精英策略和引用集

在改良方法、优化步骤之后, 我们对组内所有的调度计划进行了精英策略操作。迭代时, 保留这一代中最好的解, 用来替换下一代中最差的解。原来的分散搜索中没有这个操作, 所以会在迭代过程中丢失暂时取得的最优解。

分散搜索中的引用集是一个兼具多样性和强化性这两个关键特性的解集。根据引用集, 我们可以得到子集。子集的形式为 (x, y) , 其中, (x, y) 均来自引用集。根据不同的方法, 我们将得到3 个子集: (1) 根据引用集A中的解, 两两组合得到; (2) 根据引用集B中的解, 两两组合得到; (3) 第一个解来自引用集A, 第二个解来自引用集B, 其中, 来自B的解为与第一个解距离最远的那个解。我们可以将这三个子集理解为对引用集中的多样性和强化性这两个特性的进一步深化, 可使搜索更加快速、有效。最后一步是对这三个子集中的元素内部交叉变异产生两个新的解。

2 实验结果

为了更直观地看到结果, 我们在编程中加入了显示部分, 用于甘特图的实时输出。每次重新调度时, 系统会自动截取这一刻生成的最优调度方案。图5 所示为混合分散搜索算法下系统产生的甘特图。图5 中, 5 号机器发生故障, 62 号工件为最新加入的工件, 这次的重新调度是因为机器故障, 原本在5 号机器上的60 号工件的最早开始时间由原来的“当前时刻”变成了机器故障被修复后的时刻。

为了更为公平地进行比较, 我们建立了一个与Adibi M A和Shahrabi所写论文中相同的动态实验环境。为了在初始时可以调度, 本文设置的是在刚开始时已经有10 个工件可供调度。两个工件之间的平均到达时间差符合平均值为100~300 的泊松分布, 共5 组实验。之所以这样设置, 是因为间隔超过300时, 工件的到来太过稀疏, 机器上常常只有两三个工件, 调度意义不大。而如果间隔小于100, 则太过密集, 绝大部分工件在等待, 与实际生产不符。机器的平均损耗时间为5 700, 平均修复时间为300.工件的各工序在各机器上的处理时间为平均值为300 的正太分布。工件的加工顺序为随机产生。

在计算时, 为了减少开头静态10 个工件带来的影响, 我们在计算平均流程时间时, 不是计算所有工件的平均流程时间, 而是计算当第150 个工件到达时, 最近完成的100 个工件的流程时间的平均值 (一般说来, 当第150 个工件到达车间时, 已经完成了100 个以上的工件) 。

为了更好地比较本文算法的有效性, 我们在相同的动态环境下, 对以下四种算法, 即混合分散搜索、分散搜索、改进遍邻域搜索和先入先出 (FIFO) 进行了仿真。在参考文献[13]中, 分散搜索用于解决静态车间调度问题, 本文的算法是分散搜索首次用于解决动态车间调度问题;而FIFO和MVNS已经有研究用于动态调度中, FIFO的思想非常简单, 即先到的工件先被安排到调度中, 在参考文献[12]中用于跟MVNS作比较。

图6 所示为各算法运行时间的比较。从图6 可以看出, 我们设置的是工件平均到来的间隔在150~300 之间, 这符合一般实际生产中的情况, 即工件来得不是特别频繁, 但机器总是保持忙碌, HSS与SS和MVNS所花费的时间比较接近。图7 所示为各算法平均流程时间比较。从图7 可以看出, 混合分散搜索在各种工件间隔条件下, 始终比其他算法表现得出色。图8所示为HSS与MVNS比较。从图8 可以看出, 与目前比较有效的MVNS相比, 混合分散搜索所用的时间增加了24%左右。

从以上3 个图不难看出, 我们提出的HSS在动态车间调度问题的解决上有很强的应用性。混合分散搜索之所以能有这样出色的表现, 我们认为主要有以下三个原因: (1) 在引用子集中, A集为最优解, 而B集为与之距离最远的解。将这两个子集用于后续的交叉操作, 既保证了接下去可以强化结果, 又保证了多样性。能兼顾这两点的算法非常少, 而这两点是启发类算法中至关重要的两点。 (2) 融合了MVNS中K-means和VNS后, 相比于简单的局部搜索, 能结合工件本身的特性, 整个搜索变得更加有效、快速。 (3) 引入精英策略使得每代中最好的解被保留下来, 与原来的分散搜索相比, 最优解不会在迭代过程中丢失。

3 结束语

在本文中, 我们设计了一个事件驱动的实时动态系统, 并提出了一种全新的混合分散搜索方法来解决动态车间调度问题。这是分散搜索首次应用于动态车间, 并用改进遍邻域搜索代替了原来分散搜索算法中的局部搜索, 在迭代次数相近、搜索时间相近的情况下, 使得工件的平均流程时间大大缩短。在大规模的条件下, 实验结果表明混合分散搜索算法可以有效解决动态车间调度问题, 对于自动化程度较高的产业具有一定的指导意义。

摘要:车间调度问题是最为人熟知的生产自动化调度问题之一, 而在实际生产中, 动态车间调度问题更为常见。动态车间调度问题包括机器故障和新工件的到来, 这对调度算法的实时性和效率提出了更高的要求。为提高调度算法的实时性和效率, 设计了实时动态系统, 并提出了一种全新的混合分散搜索算法:用改进的变邻域搜索代替分散搜索中简单的邻域搜索, 使得搜索更快;同时, 引入精英策略, 使得搜索结果更好。大规模的实验证明, 提出的混合分散搜索算法在解决动态车间调度问题上表现出色, 应用效果非常好, 且实时性强。

上一篇:液化气生产下一篇:网络示教