Web信息产品(共7篇)
Web信息产品 篇1
在产品开发的过程中, 用户需求调查所花费的费用只占产品设计成本的一小部分, 但它直接决定了产品最终是否可以拥有较高的用户满意度, 为企业赢得更多的利润以及占有更多的市场份额。随着IT技术的迅速发展, Web信息产品在互联网中随处可见, 然而在实际的开发中如何做到使产品更满足于用户需求, 保持用户粘性, 做到从用户需求的角度出发, 设计出符合用户操作习惯和认知并具有实践指导意义的设计方法和流程显得极为迫切。
1用户需求导向与Web信息产品的概念
1.1“用户需求导向”的界定
用需求导向是相对于企业以产品为导向和以市场导向的另一种新兴的战略定位导向, 尤其适用于当今互联网产品的设计研发。以用户需求为导向的产品设计更加强调市场调研, 通过详细分析用户目前的需求以及未来一段时间的需求趋势, 设计、研发满足用户需求的产品或服务。用户需求导向强调需求调研和以用户为中心这两个重要的原则。需求调研是用户需求导向策略的首要前提和基础;以用户为中心是需求导向的立足点和出发点, 它是需求导向策略不会重蹈产品导向和市场导向覆辙的根本保证。
1.2 Web信息产品的定义
Web信息产品是指运行在桌面电脑和移动设备 (如手机、平板电脑) 上的各类网络应用, 例如各大静态、动态网站中的Web2.0站点以及iOS、Android等手机平台上运行的各类应用。随着移动互联网的兴起, Web信息产品的发展进入快速增长期;相应地, 对Web信息产品的设计和开发人才产生了强烈的需求。Web信息产品的设计, 不仅要求设计人员掌握产品结构和开发技术等专业知识, 还需要开发团体对用户的需求有着深刻的认识。
2挖掘用户的需求
2.1用户的需求模式
用户需求模式的建立作为产品开发活动的首要任务, 为产品的设计活动提供了必要的前提和基础。及时地获取用户需求、精确地理解用户需求, 以及在设计Web信息产品时尽最大可能的满足用户需求信息, 在当今竞争激烈的信息时代中具有最重要的现实意义。准确、有效地获取产品信息需求不仅可以在时间上缩短产品的开发周期, 还能大大提高客户满意度。获得用户需求信息和根据用户需求设计产品是目前Web信息产品开发设计中的两大关键领域。根据目前的研究经验表明, 信息用户关于产品的需求包括多方面的内容, 如图1所示。目前绝大多数从事Web产品开发的企业将用户产品需求用用户特征与用户需求分析调查开始Web产品的设计, 而在进行实际研发的过程中才考虑企业管理需求、开发技术需求以及相关部门协作方面的需求。由于后3种需求的滞后性, 企业通过这种用户需求模式后会出现严重的研发管理与控制方面的混乱, 最终无法满足用户正常的需求。因此, 开发Web信息产品所遵循合理的用户需求模式应该是在产品定义的过程中综合考虑用户特征、消费者需求、企业管理需求、开发技术需求以及相关部门协作方面的需求中的各个要素, 并将这些要素映射到新Web产品原理概念的设计中去。
2.2获得用户信息需求的途径
2.2.1网络调查法
掌握用户对Web产品的需求可以促使开发团队不断改进自己的工作, 提升自己的产品;但为保证在网络进行用户需求调查的可行性, Web信息产品开发团队必须重复了解用户对产品的具体需求。关于如何创立自己的企业网站, 并利用网站中用户个人数据进行分析, 可以根据用户的访问页面、逗留时间以及访问频率等相关数据进行统计;对网络使用记录中的相关序列模式进行分析, 并根据所获得的用户需求相关的知识协调用户与研发团队之间的信息交互模式, 最终开展针对不同用户的开发策略和Web产品推送;通过协同过滤等相关算法对具有相似需求的用户以聚类的范式聚类、分析其共同特征, 最终提供更适合不同用户且有针对性的个性化服务模式。目前关于网络调查用户需求的方法主要有: (1) QQ聊天法; (2) 电子邮件法; (3) Web站点问卷调查法; (4) 日志统计法; (5) 用户注册信息调查法; (6) 网上观察法。
2.2.2数据挖掘方式
通过数据挖掘的方法获取用户的需求主要是依靠系统完成的。多数系统直接或间接的保存用户的大量信息, 而这些信息客观上反映了用户相应的信息需求, 因此可以基于这些数据通过相应的信息收集系统和数据分析系统以数据挖掘的方式分析用户的需求。简而言之, 数据挖掘法获取用户需求就是系统主动收集用户偏好的过程。目前基于数据挖掘的主要方式有: (1) 分析网站网页、电子邮件关键词; (2) 分析纸质文献借阅记录; (3) 分析用户检索词; (4) 分析用户页面逗留时间和浏览频率。利用数据挖掘方法获得用户需求可以提高结果的准确性, 并且基于系统的获取方式也大大地节省了人力劳动, 但应用起来通常较为复杂。
2.2.3客户端获取方式
网络调查法与数据挖掘方式获取用户的信息需求都是建立在B/S的基础上, 对安全的控制能力相对弱, 面向的用户群通常是不可知的;而通过客户端方式获取用户信息需求是建立在C/S的基础上的, 该方式不仅可以更有针对性的获取相关用户的需求, 而且拥有很强的用户信息安全控制能力, 可以在最大程度上包含用户信息。例如, 新浪微博推出的windows客户端和目前移动终端上大量的App应用。这些客户端可以通过安装在用户客户端上的软件 (调协器) 来接收用户传送过来的信息, 不仅可以通过有线互联的方式获取用户所需信息还可通过无线移动通信网来满足用户需求。
2.2.4多次获取与评价反馈机制相结合
经过统计, 目前关于如何搜集、获取用户信息需求的方法有很多。方法的众多并不意味着在进行某项Web信息产品开发时, 将所有的方法应用到获取用户需求上。这种想法是不理性、不科学的;并且由于人力、物力、财力的限制, 从实践的角度也是不可能、不必要的。在实际产品开发中, 只需结合选用几种必要的、可相互补充的方法, 本着多次获取、循序渐进的原则, 并建立一套评价反馈机制, 就可获取相当完备的用户需求。而评价的方法可通过了解用户对最终产品的满意度来测定选取方法是否达到了预期的效果。用户满意度可以使用调查法和用户产品率统计两种方法经行统计。总而言之, 关于用户需求的获取, 开发团队应该本着通过评价可以调整用户需求的思想, 多次获取、多次评价、循环反馈, 切不可急于求成、急功近利。
3信息产品的设计
3.1用户界面的设计
3.1.1优化Web信息产品的视觉效果、加强视觉体验
一个拥有良好视觉效果的Web信息产品可以给用户留下深刻的印象, 可以帮助研发团队提高用户体验, 提升产品在用户心中的形象, 进而无形之中凸现了产品的品牌价值。用户界面优化是通过优化Web信息产品的布局、产品样式、页面关键词、可点击选项以及关键开发代码等手段来实现, 最终达到增加Web信息产品的使用量。但用户界面的优化不能为了渲染产品的视觉效果和视觉体验而去过度的改变Web信息产品布局和风格, 这样是得不偿失的。因为尽管采用这种手段可以重新获得一部分新的客户, 但由于过渡优化破坏了整个产品原有的整体形象, 对已经使用的客户会造成产品视觉效果差的想法, 很容易给这部分客户留下不好的印象。这样的结果往往是新用户的使用量在上升、老客户的使用量在下降, 但新客户涌入的速度远远赶不上老客户流失的速度。老客户的流失导致产业固定使用人群的数量在下降, 对于企业来说失去了固定消费人群, 进而导致企业收益下降。所以网站优化要遵循用户优化原则。
3.1.2合理的界面布局
合理的界面布局对用户体验的提升具有重要作用。优质的界面布局不仅要求界面拥有一个快速的载入速度, 还应考虑到占用网络的带宽、页面及其图标体积等诸多因素。目前在开发Web信息产品时候通常使用CSS技术。通过CSS可以使页面载入得更快 (由于将大部分页面代码写在了CSS当中, 使得页面体积容量变得更小) ;并可以降低产品流量的带宽, 减小页面体积, 加快浏览速度。CSS技术在修改设计时可以在不破坏页面其他部分布局样式的同时根据区域内容的相关标记, 找到开发包中的相应ID, 简化修改流程、保持视觉效果的一致性;以往表格嵌套的制作方法, 会使得页面与页面, 或者区域与区域之间的显示效果会有偏差。由于CSS技术本身是将所有页面或所有设计区域统一使用CSS文件控制, 这种操作本身就避免了不同区域、不同页面因为使用技术和要求不同体现出的效果偏差而降低用户视觉感受的现象发生。通过对Web信息产品的合理布局可以让开发应用更具亲和力, 增加产品的使用用户。
3.2 Web信息产品与用户的强交互性
任何产品都不是一个单一的主体。Web信息产品在绝大多数情况作为一个信息传递的平台, 因此在与传统产品相比在用户使用时需要有更强的交互性。强交互性在产品的研发过程中并不是一个可选项而应该是必须选择的部分。通过调研目前市场上具体的Web信息产品后可以发现, 产品的强交互性主要体现在以下两个方面:
(1) 可操作性。
心理学研究发现, 人们对事物的认识通常是由表及里的实践认知过程。因此, Web信息产品细节的可操作性, 即在研发产品中必须有明确的指示和图标, 并且能够让用户不通过相关的使用说明就了解如何操作产品。
(2) 产品界面设计 (UI) 的导航性。
产品必须有明确的可操作界面。目前多数Web信息产品都拥有可视化的操作界面。在用户与产品的互动过程中, 可操作界面对用户使用产品的感受起到了关键作用, 且直接影响着产品交互性的强弱。界面存在于人———物信息交流中, 甚至可以说, 存在人———物信息交流的一切领域都属于界面, 它的内涵要素是极为广泛的, 可将界面定义为设计中所面对、所分析的一切信息交互的总和, 它反映着人———物之间的关系。界面导航性强的产品可以在第一时间内吸引大量的用户, 因此, 产品界面设计的导航性是产品交互性强弱的一个重要的指标。
3.3功能的人性化
Web信息产品设计的目的在于满足当下互联网用户的各种需求, 而基于用户需求的设计是所有研发设计的起点, 也是产品设计的原动力。用户需求的不断提升推动着产品设计的不断改进, 并影响和制约着开发团队的研发内容和产品的实现方式。但所有研发产品都应遵循着产品功能的人性化以满足用户在不同需求层次的需求。美国社会心理学家马斯洛提出的需要层次论, 揭示了产品设计人性化的实质。只有前面的需求的轨道充分的满足后, 产品对后面需求的满足才能达到最大的收益。因此Web信息产品在实现功能人性化设计的过程中也应该由满足用户简单需求开始依次满足除基本需求之外的各类精神文化因素的需求, 最终通过满足用户需求层次逐级上升来实现产品功能的人性化。产品设计在满足人类高级的精神需要、协调、平衡情感方面的作用却是无庸置疑的, 因而设计的人性化因素的注入绝不是设计师的“心血来潮”, 而是人类需要的自身特点对设计的内在要求。
3.4性能的稳健性
稳健设计包括产品设计和工艺设计两个方面。稳健设计的最大特点之一是高强度的环境适应性, 可以使产品在复杂变化的环境中保证其原有高质量的性能, 并拥有极强的抗干扰能力。产品性能将更加稳定、质量更加可靠。值得指出的是, 通过调整设计变量及控制其容差使可控因素和不可控因素, 当与设计值发生变差时仍能保证产品质量的设计也应当成为稳健设计, 换言之, 如果设计出的产品通过各种假设的干扰因素的检验后依然是稳定的, 或者用相对较为廉价的部分组装出性能稳定好的产品, 则也应认为该产品的设计是稳健的。
目前有关机械稳健设计的方法大体上可分为两类:一类是以经验或半经验设计为基础的传统的稳健设计方法, 主要有田口稳健设计法、响应曲面法、双响应曲面法、广义线性模型法等;另一类是以机械工程模型为基础与优化技术相结合的机械稳健优化设计方法, 主要有容差多面体法、灵敏度法、变差传递法、随机模型法等。Web信息产品设计中所指的性能的稳健性主要是第一类。
4 Web信息产品的完善
4.1做好用户需求与产品功能的逐步过度
“功能过度”包含两层含义:一是指目前Web信息产品开发过程中由于用户对知识的缺乏, 作为合同甲方对系统功能提出的过高要求, 或者是用户在产品开发过程中随着知识的不断增加而对产品功能不断提出超越项目合同的新要求;二是指产品开发过程中专业人员利用信息技术的优势为用户设计了一些对用户需求无关、无用的功能, 或者是设计了一些有关、有用, 但过分超前, 目前产品无法运行的应有功能。
“用户需求”与“功能过度”是相关的。如果用户需求解决的好, 用户需求系统、完整地反映了新产品的本质需求, 新产品的功能设计便会在科学的前提下进行, 自然不会出现前述的两种功能过度的情况。反过来, 如果出现了功能过度的情况, 一定是用户需求没弄清楚, 即产品开发的需求不清楚、不系统。既可能是用户方对用户的需求不清楚, 也可能是产品开发人员对新产品需求不完全了解。
4.2对已识别用户和未识别用户采取不同的用户向导方式
在产品步入市场之后, 对于不同的Web信息产品使用用户, 应该采用不同的用户向导方式。应当通过相关的技术对已识别用户和未识别用户加以区分。对未识别用户采取标签元、兴趣测试的方式收集用户的兴趣爱好加以推荐;而对已识别用户而言, 应采取使用记录以及个性化推荐 (RSS) 的方式。
5结论
在Web信息产品设计中, 用户需求的信息传递与开发者理解之间存在着映射关系, 当两者能够有效匹配时, 就可以使信息产品更加符合用户的需求。以用户为中心, 在设计中充分考虑用户需求, 通过用户需求与设计产品功能的匹配实现信息产品的可用性是Web信息产品设计需要考虑的核心问题之一。
参考文献
[1]肖希明, 黄连庆.以需求为导向的数字信息资源开发[J].中国图书馆学报, 2007 (6) :65-68.
[2]饶增阳.利用网络资源进行个性化信息服务[J].南阳师范学院学报 (社会科学版) , 2003 (10) :124.
[3]王智勇.网络课件辅助生成系统的设计和实现[D]北京:北京交通大学, 2009:23-24.
[4]张岩.基于DIV+CSS设计ASP网站[J].大学教育, 2012 (8) :60-61.
[5]鲁群霞, 熊兴福, 张启亮.论产品界面的人机交互设计[J].包装工程, 2005 (10) :163.
[6]许永生.论产品设计中的人性化[J].装饰, 2008 (2) :162-163.
[7]黄美发, 叶德辉.电子产品设计中的人机交互性[J].包装工程, 2012 (8) :260-262.
[8]陈立周.工程稳健设计的发展现状与趋势[J].中国机械工程, 1998, 9 (6) :59-62.
Web信息产品 篇2
随着Internet和Intranet/Extranet的快速增长, Web已经对商业、工业、银行、财政、教育、政府和娱乐及我们的工作和生活产生了深远的影响。许多传统的信息和数据库系统正在被移植到互联网上, 电子商务迅速增长, 早已超过了国界。范围广泛的、复杂的分布式应用正在Web环境中出现。Web的流行和无所不在, 是因为它能提供支持所有类型内容连接的信息发布, 容易为最终用户存取。
在基于Web的系统开发中, 如果缺乏严格的过程, 我们在开发、发布、实施和维护Web的过程中, 可能就会碰到一些严重的问题, 失败的可能性很大。而且, 随着基于Web的系统变得越来越复杂, 一个项目的失败将可能导致很多问题。当这种情况发生时, 我们对Web和Internet的信心可能会无法挽救地动摇, 从而引起Web危机。并且, Web危机可能会比软件开发人员所面对的软件危机更加严重、更加广泛。
在Web工程过程中, 基于Web系统的测试、确认和验收是一项重要而富有挑战性的工作。基于Web的测试与传统的软件测试不同, 它不但需要检查和验证是否按照设计的要求运行, 而且还要测试系统在不同用户的浏览器端的显示是否合适。重要的是, 还要从最终用户的角度进行安全性和可用性测试。然而, Internet和Web媒体的不可预见性使测试基于Web的系统变得困难。因此, 我们必须为测试和评估复杂的基于Web的系统研究新的方法和技术。
而自动化测试就是希望能通过自动化测试工具或其他手段, 按照测试工程师的预定计划进行自动的测试, 目的是减轻手工测试的劳动量, 从而达到提高软件质量的目的。自动化测试的目的在于发现老缺陷。而手工测试的目的在于发现新缺陷。自动化测试涉及到测试流程、测试体系、自动化编译、持续集成、自动发布测试系统以及自动化测试等方面的整合。也就是说让测试能够自动花, 不仅是技术、工具的问题, 也是一个公司和组织的文化问题。首先公司要在资金、管理上支持, 其次要有专门的测试团队去建立适合自动化测试的测试流程、测试体系;其次就是要把源代码从受控库中取出、编译、集成、发布可运行系统、进行自动化的单元测试和自动化的功能测试的过程。
自动化测试可以减少或消除一些手工测试中的重复和烦琐, 节约测试所必需的时间和提高测试的一致性和可重复性。自动化测试可以提高产品质量并尽可能在软件生命周期的早期发现缺陷。
并非任何测试自动化都可以起到预期效果, 只有好的自动化测试体系才能扬长避短, 达到建立自动化测试体系的初衷, 在质量保障方面有所作为。否则测试自动化可能会由于其建立和维护等方面的负担造成延误工期、成本浪费, 甚至最终被完全放弃。
2. Web自动化检测系统的设计原理
如何解决自动化测试过程中遇到存在的问题呢?本文主要通过提出基于关键字驱动的检测方法, 这是通过相应的关键词、关键字进行数据检测的方法:
2.1 界面元素名与测试工具定义对象名的分离
可以在被测程序和生成的测试脚本之间增加一个模型层, 它可以将界面上的所有元素映射成对应的逻辑对象, 测试针对这些逻辑对象进行, 界面元素的改变只会影响映射表, 而不会影响测试。
2.2 执行动作与具体实现细节的分离
把测试执行的动作和测试具体实现细节分离开来, 用关键字描述测试执行动作, 只说明该步测试执行什么动作而不管测试工具具体怎样执行。这样做是因为测试的实现细节通常和特定的测试执行工具有着密切的联系, 比如QTP和RTF。这种分离使得关键字对于实现细节不敏感, 有利于测试在不同工具间的移植。
2.3 测试脚本与测试数据的分离
最后, 可以把测试执行过程中所需的测试数据从脚本中提取出来, 在运行时由测试控制模块从数据库中读取预先定制好的数据, 这样测试脚本和测
试数据可以独立维护。
采用上述关键字驱动自动化测试的思想, 使执行动作、测试对象和测试数据相互独立, 最大程度的减少相互之间的影响, 彻底解决了使用GUI自动化测试工具产生的问题
3. 软件自动化测试框架
该测试框架从逻辑上自底向上分为4层, 如图1所示, 分别是:由测试对象和识别脚本构成的模型层, 由标签库和测试数据库构成的数据层, 由控制文件构成的控制层以及由用例描述原语 (ASL) 构成的应用层。本文以自动化测试工具QTP为例, 搭建具体的测试框架。
3.1 模型层
在框架最底部测试的方法, 主要是通过对于模型层测试工具所识别的GUI控件对象以及对象的识别脚本构成, 模型层负责将GUI控件对象和识别脚本分别组织并以友好的方式提供给数据层的标签库模块使用。
(1) 对象识别脚本
在使用QTP录制时, QTP自动记录GUI对象并生成测试脚本。该测试脚本包含了对GUI对象的识别、执行动作和测试数据, 使得测试脚本难以重用和维护。本文在测试框架模型层中只保留对GUI对象的识别脚本, 而把测试数据放到数据层、执行动作放到控制层管理, 从而实现了相互之间的分离。
(2) GUI控件对象
在测试框架模型层中, 通过对界面元素的分析 (UI分析) 并和QTP对象识别机制相映射来组织GUI控件对象。UI分析是从被测系统界面入手, 记录页面层次并把该页面中的GUI对象以要素的形式记录到数据库中, 以达到结构化、层次化管理对象的目的。
3.2 数据层
数据层由标签库和测试数据库构成, 标签库保存要素名和识别脚本的映射关系, 测试数据库保存具体的测试数据。
标签库是针对某一个应用建立的, 它可以通过学习而扩展, 其中包含了图形用户界面交互的完整细节, 包括GUI界面和对象。本文通过打标的方式来对具体交互细节进行封装:首先利用QTP录制待测系统的执行过程, 获取各测试对象的脚本;然后对录制脚本进行打标, 实现要素名和测试对象的对应;最后对打标后的脚本进行分解并提取识别脚本和标签, 生成标签库。
3.3 控制层
控制层为自动化测试框架提供了一个控制入口, 测试工程师利用控制层实现具体的测试意图:测试工程师可以对测试的执行顺序根据需要进行调整, 使得测试不必按录制顺序回放;可以通过关键字设置GUI对象的执行动作, 实现各种操作;可以通过要素名匹配测试数据。
3.4 应用层
应用层通过用例描述原语 (ASL) 具体实现测试的执行:ASL首先获取测试案例的某一控制文件, 得到该测试逻辑并解析出测试数据标志和标签;然后通过要素标签在标签库中查找相应脚本, 匹配测试数据库中测试数据, 组合生成测试工具QTP可以执行的脚本;最后调用测试工具QTP实施自动化测试。
4. Web产品检测技术的框架实现
本文主要通过Web产品检测技术的实现过程, 来分析如何能够在关键字驱动下进行自动化的检测。例如:在某银行开户流程的测试中, 要求对所有对象进行验证, 以保证软件质量。假设每个测试对象仅需要测试1个正例和1个反例, n个对象的测试组合就是2n次。
而利用本测试框架, 只在测试开始时建立框架体系, 对控件对象识别、打标并生成标签库, 对测试规则分析设计出测试用例。通过这种方式使测试逻辑、测试脚本和测试数据相互脱离, 在回归测试中仅通过对控制文件的修改就可以对相同功能、不同数据的用例进行测试, 同时, 测试脚本不关心测试用例, 测试的数据和业务逻辑都集成在测试数据表格之中, 测试的设计就简化为测试数据表格的设计。
由上述测试实例可以看出, 应用关键字驱动技术进行自动化测试, 可以把测试工程师从繁琐的重复性劳动中解放出来, 也为软件产品提供更为高效的、更为精准的测试, 提高产品的竞争力。
参考文献
[1]王磊, 罗省贤.业务流程路径覆盖方法的研究与实现[J].电子测试, 2009 (01) :15-19, 52.
[2]陈越, 刘强, 陈玉健.基于GUI的面向对象软件回归测试技术研究[J].计算机应用研究, 2006, 23 (5) :49-51.
Web信息产品 篇3
生命周期评价(life cycle Assessment,LCA)是研究整个产品生命期对所可能涉及的环境潜在影响进行评价的方法。现有LCA评价方法存在不成熟、可操作性差、不能动态描述产品的环境影响的缺点[1]。产品的生命周期分析中数据处理的研究是国内外的一个研究热点,我国在这方面也有一些相关研究[2~3],但由于评价工作涉及领域广、信息分散,且数据量大,因此目前仍存在许多难点有待解决[4],特别是评价数据的收集和处理。
1 利用IDEF0分解产品生命周期的环境影响复杂过程
LCA是一个复杂系统:1)产品生产过程的复杂性;2)边界划分难以考虑真正意义上的生命周期全过程;3)评价的指标不完整不统一;4)评价某一产品或系统时,其负荷环境与性能、工艺、成分等的关系尚未建立直接联系,相关研究不充分[5]。
IDEF0方法是分析复杂系统的常用方法之一。该方法的基础是是基于层次理论[6],适用于复杂系统的功能说明。
IDEF0是由结构化分析方法得到的建模方法,该模型由一系列图形组成。图形元素主要是简单的盒子及箭头。盒子表示活动,而箭头表示由系统处理的事件。一般来说初始图形是对整个系统最一般或最抽象的描述,如图1所示。每个成分经过分解再用一个图形来显示其他细节,这个图形把他的组成成分也用盒子来表示。此盒子又能分裂成更多的图形,直到把系统描述得足够细致为止。
LCA涉及原材料生产、制造、使用及报废后回收处理共4个过程,整个过程的信息量大,其过程分析比较困难,容易造成评价的不准确。IDEF0可以很好的解决这一问题。
2 建立基于IDEF0的产品生命周期评价系统
使用IDEF0进行系统的总体设计时,可以采用“自顶向下,逐层分解”的方法将其清晰化;在具体实施此类系统时采用“自底向上,循序渐进”的方法,将其阶段化。这里以发动机为例,来说明具体的分析过程。发动机产品生命周期包括4个过程,具体如图2所示:
2.1 建立A-0图
应用IDEF0法首先要建立如图3所示的系统整体功能A-0图,即最顶层的IDEF0模型。
A-0图对发动机的生命周期排放进行了描述。方框上部箭头表示实现系统功能所需要的控制条件,下部箭头表示实现评价所需的支持机制。从左到右表示活动进行的是什么,左边表示系统所需要的输入数据,右边表示系统输出的污染排放数据。
2.2 建立A0图
发动机生命周期评价分为4个过程:原料生产、发动机生产、消费使用、生命周期结束后的回收。现在对其进行活动模块分解,如图4所示。
其中C1、C2、C3分别为排放标准、法律法规和评价目标。可以看到,在发动机不同生命阶段输入有所不同,原材料生产阶段和产品制造阶段输入都是产品结构、生产工艺和生产数据,只不过2阶段的这些数据各不相同而已;在产品使用阶段,输入为路况、汽车行驶状态;在产品回收阶段输入为再制造工艺、拆卸工艺。
由于我们建立的是产品污染排放信息模型,对其他输出没有考虑,所以,在每一个阶段,只考虑该阶段污染排放的输出数据O1、O2、O3、O4。
2.3 A1~A4图的建立
按照IDEF0建模方法继续对A1、A2、A3、A4几个模块进行分解。本文给出了发动机生产阶段环境污染情况的分解A2图,如图5所示,其他A1、A3、A4可以类似画出。这里污染排数据放为O21、O2 2、O2 3、O2 4。
2.4 对发动机生命周期评价的继续分解
相应地,可以继续画出发动机生产过程的毛坯的铸造和锻造、机加工、装配、测试过程的A11、A12、A13、A14…及A21、A22、A23、A24…等图,相应得到污染排放数据。通过这样逐层分解,把发动机生命周期评价这样一个复杂系统一直分解到最基本的可以量化的生产工艺过程,最后得到基本的数据[7]。
3 建立基于Web的LCA污染排放数据集成系统
以上通过对系统的逐层分解,得到了基本污染排放数据。应用数据库技术可以方便地实现信息共享,保证系统数据的一致性。
数据库与知识库是LCA的基础,评价过程的每一个阶段都需要数据和知识的支持。国外许多进行生命周期分析的研究机构都建立有自己的数据库(如:EDIP、DEAMS等)。
数据库比文件系统能提供更强的功能,方便地提供数据共享。数据库中所存放的是生命周期评价所需要以及所产生的各种数据,知识库则是用来存放产品生命周期评价决策的规则。它们在功能上是相似的,在处理对象上则有些不同,数据库的大部分管理技术对知识库同样适用。数据库与知识库是整个产品生命周期的评价基础,为评价的每一阶段提供数据与知识的支持,它们的设计好坏将直接影响到产品生命周期评价的效果。
数据库与知识库中应该包括了与产品生命周期相关的所有数据、标准、及其他信息,比如材料的相关参数、产品性能参数等等。图6描述了产品生命周期评价数据库模块组成:
这里参考由Sun公司提出的4层体系结构[8]用来构建发动机生命周期评价的网上数据收集和整理如图6所示。
其结构说明如下:
1)客户层:向用户提供应用的接口,是一个图形用户界面。这一层运行的程序是Java Applet程序,这些程序可以在Web浏览器环境下,也可以在Java软件环境下运行,它只提供与用户交互的功能。
2)顶层Web服务层:主要起代理和缓存的作用。它与多台客户机放置在一个局域内,为多台客机提供服务,用来存储生命周期评价所需的Java Applet程序静态数据,如环境标准等,提供访问本地资源的能力,起到Java Applet主机和和访问其他服务的代理作用。
3)应用服务层:提供所有的业务逻辑处理功能,完成对系统中对数据库的所有操作功能。对于每一种应用服务,都有一个代理Servlet相对应。当客户请求某种服务时,顶层Web服务层的服务定位会传给相应服务的句柄,客户端利用句柄向代理发送请求,再由代理将请求发送到应用服务层,由应用服务层中的某服务完成对请求的处理。
4)数据库层:其功能是存储应用中的数据,主要是与生产过程有关的一些参数和市场情况分析等,它与应用服务层共同完成业务规划、验证和持续存储的实现。
在数据层,产品数据以各种形式存放于物理介质上。为了有效地管理这些数据,必须对这些文件进行文件格式转换[9]。XSLT工具集将不同格式的数据文件转换成可以在Web上显示的可扩展标记语言(XML)文件,CAD数据文件、产品模型数据交换标准(STEP)文件和Office文件等都使用各自的XSLT工具转换成相应的XML文件;SMIL的作用是将多媒体文件用XML格式书写传输;虚拟现实造型语言(VRML)可以直接在Web上浏览维实体;JDBC是存取关系数据库数据的有效方法。基于上述结构搭建的产品全生命周期信息框架具有可移植性、互操作性和可重用性的优点。应用层的各种应用代理和服务层上的各种服务代理可以部署在任何与J2EE兼容的服务器上,从而迅速、方便地建立起产品生命周期评价系统。数据层中的各种数据源可以存放在物理位置各不相同的地方,由服务层中的各种代理通过Web来共同管理,这样一来产品生命周期不同阶段功能模块可以柔性地集成在一起,共同完成产品数据及过程管理任务。
通过系统的建立,该系统数据库具有以下功能:
1)为设计者和使用者提供环境、材料、技术及经济方面的信息查询;
2)可以有效的对产品生命周期评价这种系统数据进行有效管理,保证为评价系统提供全面高效的数据支持。
4 结论
本文提出的LCA污染排放数据模型,将产品生命周期各阶段的环境影响利用IDFE0分解,然后通过对数据库技术、Web使能技术等一系列信息处理技术在LCA中的应用,可以使LCA过程更加快捷,并且保持了产品数据的完整性和一致性,因此,该LCA污染排放模型可以为各种复杂机电产品的环境分析提供数据支持,让企业及时了解生命周期中每一阶段的环境影响,从而作出相应的行动来保护环境提供了良好的支持。
参考文献
[1]向东,汪劲松,段广洪.绿色产品生命周期分析工具开发研究[J].中国机械工程,2002,13(20):1760-1764.
[2]刘钢,李方义,汪劲松等.基于局域环境的产品生全生命周期评估体系研究[J].中国机械工程,2000,11(9):991-994.
[3]向东,汪劲松,段广洪.绿色产品生命周期分析工具开发研究[J].中国机械工程,2002,13(20):1760-1754.
[4]向东,段广洪,汪劲松.产品全生命周期分析中的数据处理方法[J].计算机集成制造系统—CIMS,2002,8(2):151-154.
[5]刘江龙.材料的环境影响评价[M].北京:科学出版社,2001:83-84.
[6]费奇,王卫红.复杂决策问题的层次性及相关的决策技术[A].上海:科技教育出版社,2001:224-237.
[7]方刚,关淑华,李杰,基于Web的锻压技术查询系统的开发[J].中国机械工程,2002,13(4):568-570.
[8]吴橙.现代集成制造系统导论-概念、方法、技术和运用[M].北京:清华大学出版社,2002.
Web信息产品 篇4
中国互联网20年分为四个阶段:1994-1998年是初始阶段;1999-2004年是Web1.0阶段, 以门户网站、新闻网站为代表;2005-2009年是Web2.0阶段, 以博客、播客为代表;2010年至今是Web3.0阶段, 以微博、微信、移动客户端为代表。Web2.0互联网搜索、网络日志、SNS掀起热潮, Web3.0是是对Web2.0参与、展示、互动的深度发展, 算法加上人工智能与精准定制、推送, 在全新时空中创造了新体验。
互联网的演进也是“连接”的演进, 其阶段特征是:前Web时代是机器连接构成终端网络, Web1.0时代是超链接形成“内容网络”, Web2.0时代是个体连接形成“关系网络”, Web3.0是关联逻辑将扩展到信息之间、信息与人之间的智能关联[3]。
新闻生产本来就源于与社会、人的互动, 其社会实践属于整个社会的, 不独为新闻组织所专属专有, 专业主义、运营模式等机构化主导的新闻生产自然有其盲点, 而且, 新闻叙事如果还在“既定方针”下继续下去, 那么其发展的空间必定是有限的。
耶鲁大学文化社会学教授杰弗里·亚历山大在《重思新闻业:文化的力量》中阐述:新闻的文化力量能对抗技术和经济决定论。文化赋予个人和群体能动性, 记者及群体不仅能抵抗危机, 而且也会积极修复。越关乎职业核心理念和制度危机, 越会引发更多为行业生存而进行的防御战。只有理解这点, 我们才能理解新闻业危机存在的原因。只有明确这场危机的文化根源, 我们才能重思危机。[4]
1 媒体融合中新闻叙事的新命题
媒体融合Convergence的新闻传播学涵义包括媒体的科技融合、所有权合并、组织结构性融合和新闻采访技能以及新闻叙事形式的融合。媒体的科技融合是融合发展的基础条件, 随着媒体融合的逐步发展, 资本和所有权的问题成为重中之重, 科技初创公司和谷歌、脸书、微软等超大公司侵入新闻或者资讯产业, 颠覆了原有的新闻媒体生态。
在微观的内容采编的层面, 媒介融合的大背景下产生了跨媒介叙事的新命题, 如媒介所有权融合奠定跨媒介叙事的资源基础, 产制融合、沉浸传播等构成其结构基础。
媒体融合中有两个重要主体:传统媒体和新兴媒体。在基于互联网的媒体融合环境上, 新兴媒体和传统媒体之间的边界在日益模糊。在媒体组织的内外部, 在未来一个时间节点上, 传统与新兴媒体、技术与媒体加速融入。传统媒体和新兴媒体应该视自身为承担创新使命的、面向未来的融合媒体。
网络新闻是媒介融合的产物, 网络新闻业是指在一个互联网为中心组织的信息传播世界中, 每一个记者变成一个网络节点, 不管是搜集、新闻报告与分析、评论和反馈, 还是将信息意义化, 机构媒体、职业新闻记者仍然必不可少。职业记者的实践包括深入分析、添加背景信息, 加强解释和叙述以赋予意义, 然后通过确认、纠错, 最终提炼要报道故事的本质[5], 与数据技术、设计师之间的协同, 与社会各方面力量的合作, 包括体制外内容提供者为一个新闻组织或新闻网站提供图像、图片、音视频、评论以及其它新闻素材。
数据新闻、融合新闻把传统的新闻叙事与大数据、可视化技术结合起来, 创造了一种新的“讲故事”的方式。就像记者在处理芝加哥犯罪数据的报道时, 将各种数据来源整合, 通过反复抓取、筛选和重组、过滤, 可视化呈现数据与事实之间的细微联系, 加之地理实境场景的可视化呈现, 最后合成新闻故事。数据集合可以被当作新闻和新闻分析的来源来使用, 也可以当作新闻报道的工具, 或上述两者兼有。数据、融合新闻似乎整合了新闻报道的“信息模式”与“故事模式”, 最终生成易于被受众接受—带着情感的温度、信息精度的新闻。
我们应当对随着新闻衍生的数据如何影响和左右新闻故事的发展持清醒态度。技术倾向的大数据思维容易导致新闻价值的异化, 有些通过图形设计、数据映射以及交互式图形分析呈现的结果令人瞠目结舌, 把这样的信息源引入报道显然背离了新闻价值。
融合新闻是各种多媒体文本的汇集, 它是文图、动态图表、音视频段落和互动性的集合体, 以非线性结构呈现在网站上, 各种信息要素相互补充而不重复。但是, 融合新闻并不适合任何一种报道, 或者说媒体不需要将融合新闻程式化, 而是要充分利用网络新闻的特征—提供背景和保持传播的延续性, 来提升报道的高度和深度。
为此, 新闻记者需要具有精准的判断和明确的处置, 利用计算机辅助报道发展到今天的数据新闻体现了媒体技术变革对新闻生产的影响力;记者的工作是了解和传播事实, 大数据、可视化等是新闻叙事的一个关键组成部分, 当然, 传统的叙事范式要改变, 不然任由新闻文本的危机延伸到叙事危机, 会加剧内容生产的恶化情态。如何将数据化、视觉化、互动参与体验的要求与新闻叙事融合, 是今后迫切需要解决的重要问题。
2“故事”的创新与叙事的融合
一般而言, 生态系统运转模式分为寄生型、平衡型、嵌套型和开源型。创新模式3.0兴起标志着以创新生态系统为核心特征的新一代创新范式的诞生。创新是媒介与社会互动的最好勾连, Web3.0生态系统的创新是在商业、文化、技术与新闻组成的框架中, 其基本结构、各个主体、消费者以及其功能特性、动态特征、生命周期、循环机制等构成的复杂系统, 能量、物质交换就是技术信息交互。
新媒体、互联网为代表的数字/数码媒体给用户提供新平台, 将之前分散在新闻、各种艺术领域的叙事信息集成、分享, 超链接、互文、交互性叙事中产生全新的意义和价值。数码叙事包括基于人工智能、人机互动的数码叙事和以数码媒介为叙事传播机制的新闻组、博客等, 改变了“讲故事”的方式。
2.1“故事”的创新
互联网让传播者/作者、受众/读者/用户之间的在线实时互动成为可能, 这种叙事在还原传统社会“讲故事”的氛围。就像个体记忆、两人间的结构性交互记忆、群体间的合作性记忆以及媒介记忆、集体记忆, 科技变革给“记忆”带来革命性变化。个体记忆、群体记忆和媒介记忆构成的交互记忆系统影响着人际传播、组织传播甚至大众媒介传播, 这些一定会对网络媒体、自媒体、社交媒体并存的web3.0媒体生态系统产生复杂影响。而作为人类记忆与文化传承的“故事”无疑是一种重要的解决方案。
根据雅各布森言语交际理论, 故事讲述活动由六种要素构成:故事文本、讲述人、听众、故事媒介、故事语境等。它们有规则地互相作用, 共同生成讲故事的习俗行为。[5]讲述人、听众、故事文本和符码、故事媒介、故事语境六要素相互作用, 一同生成“讲故事”这一行为:听众和讲述人基于各自的故事库和记忆文本及相关的人生阅历或者听讲经验进行互动;而故事文本经由故事符码组合构成, 通过个性化和地方化口头语言媒介表达, 在一定语境中综合上述条件得以完成一次故事讲述。在讲故事发生的时空里, 讲述人和听众构成了故事讲述活动的主体, 他们之间接连不断的互动使故事符号系统的意义得以生成和被理解、共享。
传统故事叙事文化中的互文性是产生新意、形成对话的具有积极意义的互文性, 这种互文性不但可以启示文学文本向大众影视文本的媒介转换, 而且可以深入迥异的艺术本体的内部进行诸如叙事学、符号阐释的探讨。超文本是互文性的重要表现形式, 互文性则是超文本的内在特征。互联网作为一个典型的超文本系统, 充分地开发出潜在的互文性特征, 加上超链接、非线性时间等因素形成和丰富了“故事”讲述活动。网络超文本蕴含着“主体的消散”, “去中心”的网络结构创造了“开放的文本”。
自媒体传播呈现多向交错、立体传播的结构空间, 其交互性、对话性机制以及文本结构的多元素性都显现互文性特征。譬如, 受众参与文本仿拟是网络叙事的重要来源。以新浪微博为代表的戏仿话语不仅是一种网络草根表述方式, 通过对源文本带有反讽、戏谑意图的模仿和转换生成新的作品。从文本形式上来看, 戏仿是一种典型的互文形式, 也包含了源文本与戏仿者文本之间的对话。微博话语叙事以互文性为基础生成一种开放、复数的文本, “重新”阐释权力话语、经典或流行文本的表达方式。
融媒体新闻利用“人机互动”、“可视化”、“场景沉浸”等技术理念, 在跨媒介与跨文化的层面展开以完善“讲故事”的方式。
2.2 融媒体叙事传播形态
网络媒体为传统与当前提供了对话的可能, 从宏大叙事行进至关注日常意义和民间生活叙事的自媒体传播, 当代中国社会正在形成愈加开放的社会话语系统。融媒体叙事的形态可以是以融媒体为平台、新闻与艺术以及多媒体设计技术的结合, 在开放与参与的融合文化环境下共同打造时空交错的流网络媒体为传统与当前提供对话的可能, 从宏大叙事行进至关注日常意义和民间生活叙事的自媒体传播, 当代中国正在形成愈加开放的社会话语系统。
融媒体叙事传播的形态是以融媒体为平台, 新闻与信息、计算门类在技术与艺术的“界面”上的融合, 分享、开放的互联网精神以及对话与参与的融合文化环境共同打造了异时间的“流空间”。
由此, 作为媒介叙事形态的新闻生产可以得到改造与升级。
1) 更多借鉴影视、电子游戏、动漫等叙事形态, 加快融合。
在融和媒体环境下新闻的意义赋予的过程中, 新闻报道作者的声音, 讲故事人的声音并不是一个声音, 从而创作的故事呈现一种多样性、流动性和不确定性。如在融合平台上, 一个故事的讲述者可以是:第一时间顺序的作者、故事中的主人公和其他角色, 读者和受众中任何一个, 通过人机互动和深度交互技术实现。调动用户的参与, 更多采用体制外、非职业媒体人的讲述视角显得极其重要。
2) 适应移动与碎片化的需要, 基于RSS集成的网络原生数字资源会成为未来重点。在人工智能、分布式技术推动的新闻聚合与N次扩散中, 传统媒体机构、社交媒体、自媒体已成为当前生态中的重要传播渠道。作为Web3.0最重要技术应用之一的RSS技术, 是一种XML格式, 新闻聚合是利用信息定位技术、深层链接技术实现的。
3) 故事叙事模式可以辅助技术驱动的场景沉浸、虚拟体验等。跨媒介转向融媒体平台, 在大数据、可视化、传感、虚拟现实、实境增强等技术支撑下, 多媒体信息元素的调用会获得更好实现, 以更加年轻一代为主力的新闻传播者同样可以获得基于场景的沉浸体验。
3 结论
故事作为人类媒介记忆的有机组成部分, 穿越了文学艺术、新闻、影视、互联网、新媒体数码艺术的千年风尘。依靠技术与叙事话语的支撑, 互联网重塑了人类生产和生活场景, 将现实和虚拟世界连接起来, 我们要积极建设属于中国故事的意识形态话语体系和自身的形象传播体系。
我们要走出运用二元冲突模式来看待技术主宰新闻或驱动文化转型的问题, 呼唤新旧媒体文化的融合, 促进故事与新闻、叙事之间的异趣沟通, 才能在杂语冲突场域中建构文化身份, 从而展开基于生活实践的日常叙事维度。
参考文献
[1]李莉, 胡冯彬.新闻业的黄昏还是黎明?—罗伯特·皮卡德谈变化中的新闻生态系统[J].新闻记者, 2015 (3) :13-19.
[2]详见《Journalism studies》杂志2014年第15卷第5期, 该期论文的电子文献参见http://www.tandfonline.com/toc/rjos20/15/5[EB/OL]2015-05-20.
[3]彭兰.“连接”的演进—互联网进化的基本逻辑[J].国际新闻界, 2013 (12) .
[4]周红丰, 吴晓平.重思新闻业危机:文化的力量——杰弗里·亚历山大教授的文化社会学反思[J].新闻记者, 2015 (3) .
[5]祝秀丽.解析故事构成要素:雅各布森的理论视角[J].民俗研究, 2013 (1) :57-64.
Web信息产品 篇5
1.1 产品知识模型的思维生成过程
一个成功的产品知识模型的生成往往需要一个较复杂的循环过程[1],如图1所示。
图1所示的知识生成过程可以看成是一个知识通过知识工程师生成过程的思维过程。经过这样的过程,知识工程师通过产品知识模型的人机获取界面将先前的产品知识进行归纳、总结和不断完善,生成产品知识模型并记录下来。这在本文中主要以XML文件的形式和关系数据库的形式保存。
将上述的产品知识模型的思维生成过程进行归纳,作者将领域知识的获取过程分为四个阶段:(1)理解、归纳领域知识的基本结构与特点,寻找适当的知识表示方法;(2)确定适当的知识存储结构;(3)以产品应用目标为目的,抽取产品知识并转化成适用于特定应用环境的计算机可识别语言,如基于Web的应用环境;(4)完善、精炼产品知识模型。
由此可见,知识获取策略是由知识的组成结构和知识的表示模式所决定的,而机械设计领域知识是一个多层次的、多目标的综合性知识。而且,在本文的应用中,还需要考虑到产品由定制开始,到组织设计、组织零部件的生产和供应的全过程,这就最终决定了知识表示的具体方法和知识模型的构筑内容。
因此,要实现机械产品的知识获取,首先要建立符合机械产品阶段性应用生命周期的知识表示模型,从而确定合理的知识组织结构和知识获取策略,最终才能设计出可操作的机械领域产品知识获取系统。
1.2 基于本体的产品知识获取策略
1.2.1 层次化产品知识模型的多元知识获取策略
从基于KADS[2]的知识模型所建立的产品知识模型来看,机电产品的KADS知识模型主要包括三个方面的知识:产品领域知识、产品任务知识和产品推理知识,而且这三个方面的知识又包括了层次化的产品知识的几个子方面:产品客户定制知识、产品设计知识、产品工艺知识和产品供应链知识。这是一个多元的知识组织模型,这就决定了本文所论述的产品知识模型的获取是一个多元化的过程。
产品知识模型的知识获取任务通常是由多部门的人员借助知识获取模块共同完成的。如:(1)产品设计知识的主要来源是企业的设计人员,以及有关的专业技术文献;(2)产品工艺知识主要来源是企业的工艺人员,以及有关的专业技术文献;(3)而产品客户定制知识则主要是通过企业类似于客户服务部或信息商务部的人员对客户定制的产品进行统计、分析、归纳得来;(4)产品供应链知识的主要来源是通过类似于采购-生产管理的部门的人员得来的。
通过以上的产品知识模型的知识来源,再借助专门的知识获取界面,把从书本和专业人员那里抽取的知识转换为计算机可识别和存储的内部表示形式,并进行必要的检测,如语法与语义的一致性、有效性检查等;然后把它们存入到产品知识模型表示文件(本文的XML文件)和关系型知识库(如MS SQL Server)中,便形成了可供系统重用的产品知识。
1.2.2 基于本体的层次化知识模型获取策略
在知识模型的本体式表示方式的基础上,结合本体的三元素表示方式、层次化的本体树结构,根据层次化知识模型设计任务、工艺任务和供应链任务的可分解性等特点,针对产品定制的多过程,通过知识获取人机界面获取知识[3,4]。
2 机电产品知识模型本体的知识组织方法
在产品知识模型分析的基础上,作者从知识获取的角度对产品知识模型中模型本体的知识组织方法进行分析。按照本体的类(概念)、槽(属性)和侧面(属性值)三个基本元素进行知识的组织定义,其组织定义结构如图2所示,图中以产品领域知识模型本体为例进行说明。
为了说明产品知识模型基于本体的知识获取方式,下面先对本体的类、槽和侧面的定义方法进行阐述。
2.1 机电产品知识模型中模型本体类的定义方法
产品知识模型中模型本体类(Classes/Concepts)的组织方法主要讨论的是如何定义一个类和类的层次结构。这里主要有以下三种方式[5,6]。
(1)由顶向下方式(A Top-down Method):先定义领域内最为通用的概念,然后定义领域内的具体名词。如,先定义环境实验设备,再定义恒温恒湿箱、老化车等。
(2)由底向上方式(A Bottom-up Method):即由特殊到一般的过程,先定义一系列详细的子类,即本体树的叶。然后归纳出更为通用的概念,即本体树的枝和干。
(3)混合方式(A Combination Method):混合了由顶向下和由底向上的方式。先定义一些最为突出的概念,然后归纳并细化。
其中,类与子类有继承关系,属于子类的,必属于其父类。可以将产品知识模型本体分解为不同的概念组(类组),将产品知识模型中模型本体分解的基本本体所描述的概念组。这是一种混合式的定义方式,因为令人首先想到的最低层的知识———产品设计知识、产品工艺知识和产品客户定义知识、产品供应链知识,以及最高层的产品知识模型本体;然后才将这些基本本体划分给不同的中间层———产品领域知识模型本体和产品任务知识模型本体。
2.2 机电产品知识模型中模型本体槽的定义方法
单独的一个类并不能说明本体的能力,而槽(Slots roles/properties)的定义则体现了类的内部结构———属性,每一个概念组(类组)可分解成一系列的属性槽,属性槽之间为“与”的关系。如恒温恒湿箱的外表颜色、尺寸。其定义方式如下:
(1)本质属性槽,如产品设计知识本体的产品关键特征,侧重于功能和性能上的描述;
(2)外部属性槽,如产品设计知识本体的产品尺寸、产品色彩;
(3)结构属性槽,如产品设计知识本体的产品零部件名称;
(4)关联属性槽,如产品设计知识本体的产品设计者,它虽然不是属于以上三个属性,但它是产品与产品制造商之间的一种关联关系。
任何具体的一个描述都应是类的一个槽,如产品设计知识本体的某一具体产品的设计知识,它都是产品设计知识本体这个类的一个槽,最典型的就是本文所论述的范例的设计知识,它应是产品设计知识本体的一个槽属性。
2.3 机电产品知识模型中模型本体侧面的定义方法
槽的侧面(facets/role restrictions),即属性槽的类型、属性槽值、属性槽值的数量(属性槽值数量的最大值与最小值限制)以及其它一些属性槽值的特征等。它是产品知识模型本体最底层的描述。属性槽之间的关系为“与”的关系,但属性槽值之间的关系为“或”的关系。
由此可见,由概念、槽和侧面组成的一个属性槽的基本结构包括:槽名、概念名、槽值类型和槽值。
3 电产品知识模型中模型本体的知识获取系统
面向Web的产品知识模型和范例模型本体的获取与维护系统是机电产品知识管理系统成功实现的核心部分。它为基于一阶谓词逻辑的智能程序语言表示的模型模型推理和基于范例模型本体的相似性推理构成的混合式推理提供最为基本的底层知识形式和完整的基于模型本体的组织方式。通过使用本体,系统能判别出知识之间的关联,从而自动引导使用者输入所需的知识,并能对整个过程给予适当的解释。
3.1 产品知识模型的多级知识获取模型
由于建立了机电产品知识模型本体的层次化结构、本体树的结构和知识获取的本体概念、属性槽和槽值,因而可采用基于本体的产品知识模型和范例的多级知识获取方式,各级为:产品知识模型基本本体生成级;产品知识模型概念生成级;产品知识模型属性槽生成级;产品知识模型槽值生成级。
产品知识模型的多级知识获取步骤的流程图见图3。其中,产品知识模型基本本体生成级生成基本本体的横向框架;产品知识模型概念生成级生成每一个基本本体概念逻辑与或树模型;产品知识模型属性生成级则生成概念的逻辑或树模型;产品知识模型属性值生成级则生成属性的逻辑与树模型。
首先,进入基本本体生成级模块,形成基于本体的相互关系树,组成一个具有继承功能的层次化产品知识模型树状结构。
为了尽可能避免处理自然语言,系统采用一种动态的限定格式的输入方式,用户只需选择一种基于本体的关系式即可,如,“IS_A_KIND_OF/HAS_PROP-ERTIES/HAS_VALUE”方式,或选择一个量词、名词、逻辑符号等。这些限定格式的关系式,名词、逻辑符号等均存放在知识词典中,其动态性表现在知识词典可随时更新、添加。
最后,进入产品知识输入界面,元知识控制知识获取系统搜索概念与或树模型,自动引导用户输入特定条件下的知识,经XML Schema语法检查和一致性、完整性检查后,存入层次化产品知识模型库,见图3。其中,每一个过程形成一个独立的子知识库,并对上一层公用知识库具有继承关系,这在XML Schema文档中可以体现。
3.2 基于WEB和本体的机电产品知识模型获取框架
基于产品知识模型本体的知识获取系统(本文称为PKMOKAS,Product Knowledge Model Ontology-based Knowledge Acquisition System)是根据产品客户定制、产品设计、产品制造工艺和零部件的供应链知识的特点,建立的一个集产品知识模型获取、模型特例———范例的获取与有效性检查于一体的智能化领域知识获取系统,其主要模块如图4所示。
主要模块说明如下。
(1)启发式向导知识输入模块:用于建立产品知识模型基本本体,包括建立本体概念逻辑与或树模型、建立本体属性逻辑或树模型和建立本体属性值逻辑并树模型底层信息,以及范例的知识建立等功能。
(2)启发式向导知识维护模块:主要包括产品知识模型和范例知识的增加、删除、修改和编辑等功能。
(3)知识有效性检查模块:由于系统对非注释性知识采用了一种动态的限定格式的输入方式,故无需对非注释性知识进行自然语言描述的语义检测。该模块主要根据知识词典和XML文档,利用Schema/DTD和数据库的全文检索功能,完成对用户输入值的一致性、完整性的有效性检查。
(4)产品知识词典建立与维护:用于建立和维护概念词典、属性词典、属性值词典和限定词词典等。
由于范例是产品知识模型的一种特殊表现,故在PKMOKAS系统中将范例作为产品领域知识模型本体库的一个属性组进行保存。
3.3 知识获取过程中语义有效性的保证机制
在PKMOKAS系统中主要通过三种方式来保证客户输入的信息与知识的有效性检测。
(1)界面控制的动态限定格式输入方法:用户在输入非注释性知识时,通过系统提供的启发式向导,用户只需选择一种基于本体的关系式谓词,如,“IS_A_KIND_OF/HAS_PROPERTIES/HAS_VALUE”方式,或者选择一些量词、名词、逻辑符号等等,这些限定格式的关系式,量词、名词、逻辑符号等均存放在知识词典中,通过知识词典的随时更新、添加,不断完善。
(2)逻辑检测方式:对于XML文档,利用Schema/DTD的逻辑检测功能,对生成的XML库文档进行词汇出现的顺序、输入值的属性等进行有效性检测。
(3)全文检索方式:对于在关系型数据库存储的信息知识,尤其是非结构数据(主要是文本),采用DBMS提供的全文检索工具。由于全文检索可以对查询条件进行衡量,并报告与原始条件的匹配程度,故本系统中还采用了全文检索方式对用户的输入值进行匹配性检测,并通过搜索出的与用户输入值很相近的形式,如名词的复数形式、动词可能使用的各种形式,或者原始搜索条件的大写或小写形式(这在XML文档中是非常敏感的)等,反馈到人机交互界面。
3.4 基于XML文档和关系型数据库的知识查询机制
产品知识模型库和产品知识词典是基于本体式的建立,为有用信息与知识的分类与管理提供了方便。在PKMOKAS系统中,根据存储方式的不同,本文采用了XML自身提供的数据查询功能和关系型数据库查询功能相结合的方式进行产品知识的查询。
产品知识库的检索主要保证检索的准确性、完整性和非冗余性。在PKMOKAS系统中提供了三种资源检索方式:关键字查询、分类查询和全文索引。
(1)关键字查询方式采用的是一般的关键字匹配方式,考虑到用户对关键字的理解有所不同,没有提供关键字的精确匹配,而是采用模糊查询的方式进行。
(2)分类查询方式根据事先对数据库里的资源进行的分类,用户对资源进行搜索,这在一定的程度上制约了用户的选择程度与范围,但同时也把用户的随意性降到了最低。
(3)由于本文所选用的关系型数据库(MS SQL SERVER)支持全文本索引,故PKMOKAS系统同时提供了布尔运算符(AND、AND NOT和OR)的查询方式对全文检索表中的字符、数据执行语言检索。语言检索对全文目录当中的单词和短语进行操作,不像LIKE谓词是用于检索字型。而且,全文检索功能可以对查询条件进行衡量,报告与原始条件的匹配程度,这为基于范例的相似性推理提供了可操作的数据。
4 机电产品知识模型本体维护机制
4.1 基于ECA规则的主动式数据库
传统的数据库及其数据库管理系统是一个被动的系统,它只能被动地按照用户提出的具体请求之行相应的数据库操作,用户是主动的请求者,数据库是被动的执行者。主动式的数据库(active database base),它能够根据知识库的当前状态,主动适时地做出反应,执行某些操作,向用户提供有关信息。主动式数据库在传统的关系型数据库中嵌入事件自动触发的模型规则,在某一事件发生时,引发数据库管理系统去检测知识库的当前状态,若满足设定条件,则触发规定动作的执行,即文献[7]所论述的ECA规则:“事件(Event)—条件(Condition)—动作(Action)”,其含义即[8]:在事件发生时,若条件成立,则执行活动。
在本文中,结合文献[7]所论述的ECA规则,应用到产品知识模型的维护当中,并形成基于“ECA模型规则”的机电产品知识模型的知识维护机制。它是知识获取和维护,保证知识有效性的一个基本环节。
本文所提出的ECA模型规则是基于本体建立的各个“类-槽-侧面”模型在产品知识模型库中的模型框架的概念,以区别于专家系统中提出的纯规则。在本文中,已经将产品的推理知识融入到了产品知识模型当中,也就是说,模型规则是将本体模型与相应的描述规则相结合。
4.2 基于ECA模型规则的机电产品知识模型的维护机制
基于事件驱动的ECA模型规则的一般形式分为如下的“MODEL-RULE”和“ACTION”两个部分;
其中,在MODEL-RULE部分<规则名>就是各个本体定义的各个类;<参数i>就是每个类中的各条“槽”———类的属性及特征;<事件表达式i>与相应的参数相对应,并构成一定的条件表达式。ECA模型规则中的<条件i>为一合法的逻辑公式;<动作代码i>即系统欲定义的动作,相当于一个程序或进程;在本文中此处归结的是一个执行代码。在ACTION部分,<动作名>与类名,即<规则名>相呼应;<动作参数i>就是各个事件表达式中所得到的动作代码。
本文中建立的基于事件驱动的主动式产品知识模型本体库ECA模型规则的运作方式是:在某一事件发生时(如,产品知识模型本体的概念、属性、属性值更改时),引发数据库管理系统去检测知识库的当前状态,看是否满足设定的条件;若满足设定条件,则触发规定动作的执行。
事件驱动的ECA模型规则的语义是:当事件发生时,DBMS主动触发执行其后的IF-THEN规则,匹配检测IF-THEN规则,并生成相应的执行代码。待整体事件循环检测完毕后,便将动作代码交由ACTION部分执行。这就是按“匹配-解决问题-执行循环”的产生式规则的执行模式来解释执行相应的模型规则集合。
在本文中,事件的来源是通过人机交互界面的程序执行检测和感知,而关系型数据库相关记录数据的更新检测和感知是通过数据库的触发机制来实现的。
5 小结
本文通过对产品知识模型生成的思维过程分析,提出了产品知识模型的获取策略,阐述了产品知识模型本体的概念、属性和属性值的定义方式。并根据机电产品知识模型本体的层次化特点,提出了产品知识模型的多级知识获取模型、系统功能框架和知识获取过程中语义有效性的保证机制。同时,对产品知识模型库提出了基于XML和关系型数据库的知识查询设计。最后,根据现有的主动型数据库的ECA规则,对产品知识模型本体库基于更新和添加的维护方式,提出了基于ECA模型规则的维护机制。
通过以上的方式建立起来的产品知识模型本体获取系统,具有以下的优势:
(1)可以降低基于知识系统开发过程中人力资源的浪费,即一些机械性的知识获取过程和知识组织、分析过程,并可减少知识工程师与领域专家的会谈时间,提高产品知识本体库的质量;
(2)由于知识获取工具中特定获取技术的引入,如知识词典、限定格式输入法、XML Schema/DTD和全文检索的检测机制,提高了知识获取过程中知识的统一化程度和知识的一致性、有效性和完整性;
(3)采用多级知识获取策略,较好地结合了层次化的产品知识模型本体的知识组织结构,使得对产品知识模型的增加、删除、修改、编辑等功能,以及知识的一致性、完整性检查更加简单准确。
在本文的研究中,作者创新性地提出了“基于WEB和本体的机电产品知识模型获取框架”和“基于ECA模型规则的机电产品知识模型本体的维护机制”。
摘要:在机电产品基于网络环境下的知识管理以及知识工程(KBE)系统中,知识的获取和维护是一个十分重要的环节,通过本体知识模型技术和网络描述语言的应用,分析了WEB网络环境下产品知识模型中模型本体的知识获取策略、方法,确立了机电产品的多级知识获取模型,提出了基于产品知识模型本体的知识获取系统的功能结构框架和基于ECA模型规则的机电产品知识模型本体的维护机制。
关键词:WEB,机电产品,知识模型,获取与维护
参考文献
[1]陈恩红,范炎,王行甫,等.网际网上半结构化数据抽取与知识发现方法及其实现[J].计算机科学,1999(10):49-52.
[2]A.Th.Schreiber,B.Weilinga,and Breuker,et al.KADS,APrinciple Approach to Knowledge-based System Development[M].Knowledge-based System,Academic press,London,1993.
[3]钟佩思,高国安,刘梅.面向复杂产品设计的多级知识获取策略及其实现[J].机械工程师,1998(增刊):50-51.
[4]李爱平,陈剑锋.分散网络化制造环境下基于Internet的知识供应链[J].同济大学学报,1999(6):749-753.
[5]Uschold M.,Gruninger M.Ontologies:Principles,Methods andApplications[J].Knowledge Engineering Review,1996,11(2):30-35.
[6]Gruber,T.R.A Translation Approach to Portable OntologySpecification[J].Knowledge Acquisition,1993(5):199-220.
[7]徐洁磐,马玉书,范明.知识库系统导论(第一版)[M].北京:科学出版社,2000.
[8]刘云生.现代数据库技术[M].北京:国防工业出版社,2001.
Web信息产品 篇6
一、系统搭建及开发环境配置
本系统采用基于.NET Framework4.0的三层架构设计, 系统开发环境配置如下:
1. Internet信息服务 (IIS5.0或更高版本)
2. Visual Studio2008或Visual Studio2010
3.. NET Framework框架 (安装Visual Studio时已经自动安装)
4. SQL Server2005数据库
二、产品分页技术实现
DataList、GridView等Visual Studio2010自带的分页控件功能有限, 不能满足用户操作及对界面美观的要求, 下面详细介绍第三方控件结合代码和Repeater控件实现功能强大的分页功能:
1. 在表示层的Bin文件夹下导入DataPage.dll和DataPage.pdb
2. 在需要分页的页面 (如cpMore.aspx、expressList.aspx) 导入DataPage, 代码如下:
3. 在代码页面expressList.aspx.cs中导入对应的命名空间, 代码如下:
为Repeater控件绑定数据并分页的详细代码及代码分析如下所示:
三、下单购物功能实现
下单购物功能即通常意义的购物车功能, 指的是应用于网店的在线购买功能, 它类似于超市购物时使用的推车或篮子, 可以暂时把挑选商品放入购物车、删除或更改购买数量, 并对多个商品进行一次结款, 是网上商店里的一种快捷购物工具。是否实现购物车功能是区分电子商务系统和其它普通系统的重要标志。在ASP.NET中实现购物车有两种常用方案:一是在数据库中加入对应购物车功能的表Cart;二是通过在购买页面建立Session["Cart"]来实现购买功能, 而不需要在数据库中建立对应的表。本系统采用第一种解决方案, 下面详细介绍:
1. 完成产品详细信息页面设计, 并在页面中添加“加入购物车”的Button按钮btnAdd和“立即购买”的Button按钮btnAddOrder控件;
2.在“加入购物车”按钮btnAdd的单击事件中加入如下代码:
3. 当单击“立即购买”按钮时触发btnAd-dOrder_Click事件, btnAddOrder_Click事件详细代码及代码解析如下:
四、注意事项
1. 分页技术部分省略了ExpressFenYe () 方法的具体代码, 本文分页采用了第三方控件DataPage.dll, 且采用代码方式为Repeater控件指定数据源, 灵活性很强, 但也要注意理解数据源的格式转换问题。
2. 网上下单部分着重介绍了“加入购物车”和“立即购买”两个事件, 其中涉及的通过外键获得相关类的方法都没有列出, 相信大家能够理解。
3. 由于条件的限制, 本文没有列出下单以后执行网上缴费功能, 因为这需要第三方开放专用的收费接口, 然后再在系统中建立Webservice服务来调用对应的方法以真正实现网上缴费功能。
4. 本文需要具有一定的.NET基础才能理解, 因为篇幅限制, 本论文仅列出了关键部分代码。
摘要:电子商务平台要能够吸引顾客注意并真正实现网上下单的功能才可能具有实用价值, 因此美观大方的界面设计、良好的用户体验和实现必备的购物功能尤其重要。本文以B2B河源手机产业电子商务平台为例, 介绍开发电子商务系统过程中使用的分页技术及网上购物两个基本功能, 以期能够为后来的Web学习者提供帮助, 推动.NET技术的应用和发展。
关键词:电子商务,Web,B2B,分页技术,网上购物
参考文献
[1]北京阿博泰克北大青鸟信息技术有限公司, 深入.NET平台和C#编程, 科学技术文献出版社, 2008-1
[2]北京阿博泰克北大青鸟信息技术有限公司, 使用ASP.NET技术开发网上书店, 科学技术文献出版社, 2008-1
[3]微软公司, 数据库访问技术, 高等教育出版社, 2007-6
[4]Karli Watson.Christian Nagel, Beginning Visual C#2005, 清华大学出版社, 2006-5
[5]奚江华, ASP.NET2.0开发详解, 电子工业出版社, 2006-11
[6]魏峥.王军.崔同良, ADO.NET程序设计教程与实验, 清华大学出版社, 2007-4
[7]田原, ASP.NET程序设计教程, 清华大学出版社, 2006-6
[8]常永英, ASP.NET程序设计教程 (C#版) , 机械工业出版社, 2009-2
[9]尚俊杰, ASP.NET程序设计案例教程, 北方交通大学出版社, 2005-10
WEB信息检索综述 篇7
关键词:Web信息检索,检索工具,检索技巧
1概述
因特网上丰富多彩的Web信息资源给人们带来了巨大的便利, 每天上网浏览新闻, 收发邮件, 检索相关资料等几乎成了人们每日必需的一道工作餐。不论是哪种类型的网络信息, 一般情况下, 我们不知道其在网上存储的地址, 也无法记住那么多内容的地址。另外, 其他一些媒体如图像、音频和视频也大量存在。Web是一个非常大的、非结构化且无处不在的数据库, 这就需要有效的工具来管理、检索和从数据库中筛选信息。为了有效地查询和利用网上信息, 人们开发了各种Web信息检索系统, 即搜索引擎 (Search Engines) 。它是一类能自动搜索, 组织Web信息资源, 并提供检索服务的信息服务系统。
Web信息检索的基本形式有三种。第一种搜索引擎, 它标引一部分网络文献作为一个全文数据库;第二种是Web目录, 它按主题来对所选的Web文献进行分类;第三种还没有完全成熟, 却利用超链接结构来检索网络。
1.1实现Web信息检索的条件。实现Web信息检索必须具备信息资源, 信息处理和信息传输这三大条件。其中, 信息资源指对各种信息进行分类, 汇总, 加工, 组织, 按照客观事物的相互关联建立起来的有序结构;信息处理指利用计算机信息进行的一系列筛选, 反馈, 匹配, 计算等加工操作;而信息传输指人和计算机借助通信网络进行的信息传递和交流。因此, 信息经济学专家提出:“信息网络是现代通信网, 计算机网和信息资源网的综合, 现代通信, 电子计算机, 信息资源 (信息内容) 三者互相渗透, 连接, 联合而形成的全方位的服务网络。这三种网络按不同途径发展, 在信息资源开发, 利用和共享这个方向下趋向三网合一”。
1.2面临的主要难题。主要有两类:数据本身的问题和用户及其检索系统交互的问题。a.数据的分布性:数据分布在许多计算机和平台上。网络互联的有效带宽及其可靠性经常发生变化。b.不稳定数据的大量存在:WEB资源经常更新, 导致要处理大量空链接和重新定位的问题。c.非结构和冗余数据:由于网络的共享性, 许多网络资非常相似或有大量的镜像存在。不同的资源有着不同的概念模型, 缺乏一致性。d.异构数据:全球文献中有各种语种, 如拉丁语系和汉语等, 而且不能简单地通过软件来解决。
2 Web信息资源检索方法与搜索技术
2.1Web信息资源检索方法。2.1.1直接访问信息源搜索的途径。通常的做法是通过IP地址直接打开网站或网页, 一般是在已知所查询的信息在某一具体的网站或网页时使用, 不过这种方法需要记忆大量的域名, 网址。一种更简便的方法是安装网络实名插件, 可在浏览器的地址栏或搜索引擎网站中, 直接输入中英文网站名称, 如, 3721网络实名, 可输入网站, 企事业单位, 商标, 产品等关键词的中英文名称, 就能直达对应的网站或网页。2.1.2利用网络检索工具。可使用综合性搜索引擎, 如雅虎、搜狐、百度、网易、Google等一些大的门户网站, 在查询过程一般提供分类查询和关键词查询。有些网站还提供了很多网址的链接, 根据需要点击, 可直接进入网站当需要检索某些专业性或特定信息时, 可使用专题搜索引擎。例如专业地图搜索的工具有图吧 (http://www.mapbar.com/) , 图行天下 (http://www.go2map.com) 。2.1.3构造检索提问式的要点。在检索中, 有两个最为关键的步骤, 一是概括检索提问, 选择精确的检索词;二是正确构造检索提问式, 达到检出目的。a.灵活运用各种运算符号。要考虑检索提问中的关键词是否有同义词, 近义词, 以及词形的各种变化, 活运用各种运算符号, 截词符号, 邻接算符等, 扩大词语的检索范围, 降低漏检的可能性, 提高检出效率。b.准确构造检索式。当有多个检索词, 且词语之间逻辑关系复杂时, 应分期分步制定检索式, 以免将检索词的逻辑关系弄混。即使是检索专家也不能保证开始检索就能找到想要的内容, 要在上一次检索结果的基础上不断修改检索提问和改变检索策略, 直到检索到满意的结果。
2.2 Web信息检索的一些关键技术。2.2.1基于内容的检索技术。Web是一个分布式的、全球性的数字图书馆模型, 它的URL相当于地址的文件标识器。而现实中, 常因URL会变动而导致搜索的返回结果变得无用。另一种代替URL来定位搜索目标的方法是基于内容的方法, 它是一个包含关键词的表, 可作为检索目标网页的查询条件。这种查询称为基于内容的寻址, 或概要查询。它的优点是, 当一个目标网页移动时, 基于内容的寻址定位也不会改变, 从而仍然可以得出正确的检索结果。另一方面, 互联网上存在着多种格式的文档, 除了文本之外还有图像、音频、视频。人们使用搜索引擎式基本上都是进行文本搜索, 对多媒体内容的检索技术尚不成熟。就此问题目前提出了基于内容的图像检索技术, 其工作原理是, 由机器自动提取包含图像内容的可视特征:颜色、纹理、形状、对象的位置和相互关系等。对数据库中的对象和查询样本图像在特征空间进行相似匹配, 检索与样本相似的图像。2.2.2自然语言处理技术。自然语言处理长期以来一直是人工智能的一个核心研究领域。比较基础的技术有自动分词、人名和机构名的自动识别技术、自动标引技术等, 其它像信息抽取、自动文摘、文档自动分类、中文概念词的自动发现以及概念词之间的语义关系的确定等复杂技术也都必不可少。应用了这些技术的搜索引擎我们称之为智能搜索引擎。实现智能搜索的过程主要分三部分:语义理解、知识管理和知识检索。其中, 知识库是实现智能搜索的基础和核心。2.2.3集成搜索引擎技术。这种技术是将搜索引擎系统建立在多个现有的搜索引擎之上, 提供对这些引擎进行统一访问的服务。集成搜索引擎自己并不维护所有文件的索引。但是, 为了提供更好的服务, 一个复杂的集成搜索引擎通常会维护一些关于底层搜索引擎内容的信息。当向集成搜索引擎提出查询以后, 它能将该查询分送到适当的底层搜索引擎, 再搜集和整理底层引擎返回的结果。将多个搜索引擎组合在一起, 可查询的网络覆盖面将比任何单个搜索引擎都要大很多。由一个建立在多个专题搜索引擎基础之上的集成搜索引擎代替综合引擎, 可以解决在Web上搜索的可扩展性问题。此外, 集成搜索引擎还可以方便对多个引擎的查询, 提高检索的有效性。2.2.4数据挖掘技术与检索技术的结合。数据挖掘技术也称数据库知识发现技术, 被广泛的应用于数据仓库、并行分布式数据库中, 以发现数据中隐含的规律和趋势, 用来分析经验、解释原因、制定决策、指导改进和预测趋势, 使数据库具有知识库的属性。数据挖掘技术涉及许多学科的技术, 包括数据库技术、统计学、机器学习、模式识别技术以及信息检索技术。现在有一种新技术称为Web挖掘技术, 它实现对Web存取模式、Web结构和规则, 以及动态的Web内容的查找。Web挖掘技术最大的特点就是从大量数据中发现有用的知识, 因此发展面向互联网的知识挖掘技术, 并将其与灵活使用的信息检索技术无缝的结合起来, 将会向人们提供一个全新的、方便的、内容空前丰富的学习知识和问题的求解途径。
3搜索引擎及其技术
3.1搜索引擎构成。搜索引擎是一种最为常见的Web信息检索系统, 主要由四部分组成:a.网络机器人:是一个功能很强的程序, 它会定期根据预先设定的地址去查看对应的网页, 如网页发生变化就重新获取该网页, 否则根据该网页中的链接继续去访问。网络机器人访问页面的过程就是对互联网上信息遍历的过程。b.索引器:网络机器人将遍历得到的页面存放在临时的数据库中。索引器的作用就是将文档表示成为一种便于检索的方式并存放在索引数据库中。索引一般按照倒排文件的格式存放。c.搜索软件:该软件用来筛选引擎中无数的网页信息, 从索引中找出与用户查询请求相关的文档, 挑出符合查询要求的网页并且把它们分级排序, 与查询关键字相关性越大的越排在前, 然后将分级排序后的结果显示给查询用户。d.用户接口:为用户提供可视化的查询输入和结果输出界面。在查询输入界面中, 用户按照搜索引擎的查询语法指定待检索词条及各种简单高级检索条件。在输出界面中, 搜索引擎将检索结果展现为一个线性的文档列表返回给用户。
3.2搜索引擎的工作原理及技术。搜索引擎的工作原理是:使用网络机器人遍历Web, 将Web上分布的信息下载到本地文档库, 然后对文档内容进行自动分析并建立索引, 对于用户提出的检索请求, 搜索引擎通过检查索引找出匹配的文档 (或链接) 并返回给用户。
目前网络上的搜索引擎一般使用两种技术来实现信息检索:一是使用网站分类技术, 由专家对网站进行归纳和分类, 即把网站进行树状的分类。网站分类技术为网络信息导航带来了极大的方便, 但其描述能力不能深入到网站的内部细节, 因此用户不能查询网站内部的重要信息。二是使用全文检索技术。全文检索技术处理的对象是文本, 它能够对大量文档建立由字 (词) 到文档的倒排索引。在此基础上, 用户使用关键词来对文档 (网页) 进行查询时系统将给用户返回含该关键词的网页。全文检索是一个很成熟的技术, 它能够通过关键词匹配把相关的网页查出来, 但是这又导致了它的缺陷———返回的信息量太大。
4结论
Web信息检索涉及的领域很广, 从信息资源的采集、布置到检索技术的更新以及检索工具的优化, 其总体目标都是使Web信息资源能够得到更有效的利用。面对如此海量的信息, 需要不断地进行关于Web信息检索方面的探索与研究, 相信在理论和技术的支持下, Web信息检索会达到人们期望中的辉煌。
参考文献
[1]陈艳红, 盛子刚.DC元数据与Web信息检索 (综述) [J].北科技师范学院学报, 2005 (2) .
[2]谢筠.InternetWeb信息资源的利用与检索技术[J].绥化学院学报, 2005 (4) .
[3]胡明.Web环境下产品信息检索策略[J].安徽科技, 2004 (12) .
[4]霍艳蓉.Web信息检索的关键技术[J].现代图书情报技术, 2002 (6) .
[5]赖茂生.Web信息检索技术及研究进展[J].现代图书情报技术, 2004 (5) .