方向搜索(共5篇)
方向搜索 篇1
一、引言
随着互联网海量信息的飞速膨胀, 互联网搜索引擎成为用户使用互联网的主要工具2006年中国搜索引擎用户达到了1.26亿人, 占互联网用户的92%。但是, 互联网搜索业务存在着终端的局限性, 用户必须通过联网PC终端才可享受到搜索服务, 无法为用户提供随时随地服务。
而手机移动搜索业务的推出正满足了用户及时获得信息的诉求。手机移动搜索, 是指移动用户在移动通信网络中通过移动终端, 利用SMS, WAP, IVR等多种特定搜索方式获取所需信息的搜索行为。移动搜索业务作为互联网搜索技术的延伸, 依托移动网络既有的特性, 为用户能够提供随时随地随身性的服务, 满足用户多方面需求, 成为一项极具发展潜力的移动增值业务。
二、移动搜索业务发展潜力分析
2002年8月, 英国首次出现“手机搜索乐曲名”服务。2004年10月8日, Google在美国推出了基于短信 (SMS) 的移动搜索业务。其后的3个月里, 以雅虎为代表的Google的对手们也纷纷推出了各自的移动搜索业务。同时, 国内诸如Cgogo、悠悠村和百度等一些搜索引擎开发公司和移动增值服务提供商也全面加快了移动搜索引擎的开发步伐。2005年初国内移动搜索引擎市场还是一片空白, 到了年末, 移动搜索市场已经形成产业化的雏形, 市场规模达到0.79亿元。
据专家预计, 2006年中国手机移动搜索用户规模为2800万, 比2005年增长366.7%。中国手机移动搜索分为导入期、成长期和成熟期。2004年-2006年, 就中国市场而言, 移动搜索市场处于导入期阶段, 初期是一些追求新奇的用户进行尝试性的体验, 具备一定规模的稳固的消费群体还未形成, 运营商则忙于市场的初步培育, 尚不能依靠搜索服务实现盈利。受到3G商用及无线搜索模式逐渐丰富的影响, 2008年中国手机移动搜索引擎用户数将达到11700万并继续保持高速增长。这表明中国手机移动搜索已经进入了真正的成长时期。
三、移动搜索业务的潜在挑战
(1) 技术上的挑战
当前互联网搜索引擎很大程度上基于关键词搜索, 其追求的是海量信息、大而全的结果。而移动搜索受终端的限制, 要求返回结果必须高精度、高匹配、高度符合用户需求。因为调查表明, 人们查看手机网页时进行4次翻页就会感到厌烦, 另外用户会为这些不相关信息支付流量费, 致使用户对搜索的准确性有较高要求。同时, 由于一般手机受到屏幕显示的限制, 几乎无法完成对Web页面的浏览, 因而虽然互联网内容丰富, 但现有手机的搜索功能却是更多地针对WAP网站的。由于无线互联网搜索的难点在于无线网站之间并不关联, 数据在运营商、服务商的网关中, 搜索引擎很难抓取, 文件格式又各不相同。此外手机终端的多样性使得适配很难, 必须开发专门的无线搜索技术。
(2) 用户使用习惯
目前人们对移动搜索还比较陌生, 很多人仅仅把手机当作一种语音通信的工具, 用户消费习惯的培养还需要一定过程;而且移动搜索业务在中国的发展短时间内还将面临着网络速度慢、终端屏幕小、操作步骤较繁琐等实际困难, 这些在一定程度上会影响用户对移动搜索的情感和偏好。另外, 从用户感受角度来看, 用户为通过移动终端上网支付费用与通过PC上互联网支付费用的感受完全不一样。固网的上网费用对当今的互联网用户来说很难引起重视, 已经有相当多用户把包月上网费用作为一种习惯性支出。相比之下, 通过移动终端上网的成本较高, 用户对此部分的价格仍较为敏感, 如何培养用户对移动搜索服务提供商来说的确是一个不小的挑战。
(3) 盈利模式
目前多数移动搜索服务商为用户提供免费的搜索服务, 运营商则收取短信或流量费。搜索服务商出于开拓市场的考虑, 不急于从移动搜索投资中立刻获取利润, 而是不断开发新技术、扩充搜索范围, 以期尽快扩大用户使用规模, 待形成固定用户群后再实行收费。可以看出多数移动搜索服务提供商仍寄希望于传统的互联网搜索盈利模式——向网络用户提供免费搜索服务, 从付费的广告客户那里获得收入。但是固定互联网搜索的盈利模式能否套用到移动互联网搜索产业存在很多变数, 这在一定程度上跟移动运营商的政策有关。另外, 受制于目前的终端设备屏幕小, 搜索如果还像传统网络搜索放置广告的话, 会使得屏幕信息显得杂乱, 影响用户的体验。
(4) 内容挑战
当前移动互联网的内容正在迅速丰富, 但与海量的固定互联网信息相比, 仍显单薄, 而且当前移动互联网的内容同质化现象严重, 还不能很好地满足用户的多元化需求。互联网搜索的兴起是先有丰富的内容, 人们对获取信息的方便快捷的需求催生了搜索引擎, 而WAP站点在移动搜索出现前处于缓慢的增长期, 可以说移动搜索的出现基本与WAP站点的增长同步。
四、移动搜索发展方向
虽然目前移动搜索服务商的盈利模式仍不清晰, 但是只有同时抓住个人用户和企业用户, 移动搜索服务商才能走上双向获益的盈利之路, 这就需要移动搜索服务提供商开发出更具特色, 更能体现用户需求的服务。
(1) 个人用户端——个性化、垂直搜索、智能化
1) 个性化搜索
移动搜索绝不应该仅仅是互联网搜索的一个简单延伸, 由于手机具有较强的个人化色彩, 用户会将手机随身携带且不会与他人分享, 基于这一特点根据移动用户的需求特点提供个性化的搜索方式对于移动搜索业务发展至关重要。例如, 基于移动网络的独有特性提供基于定位的搜索业务。美国的新兴无线搜索服务提供商Wave Market在定位解决方案服务中处于领先地位, 用户可通过Wave Market网站下载手机地图软件, 通过短信了解周围地形。Wave Market的另一项服务是通过短信搜索他人位置, 现在这项服务已经绑定了Friendster、Blogger、美国在线的Buddylist和mapping等几大交友网站, 这些网站的注册网友可以通过手机短信互相搜索。
2) 垂直搜索
目前, 对于市场细分的强烈需求逐步体现, 于是垂直搜索应运而生。垂直搜索是指用户通过多种接入方式提出搜索请求搜索特定类型的内容或服务, 例如音乐搜索、图片搜索、本地搜索等。作为美国新兴无线搜索服务提供商的Synfonic在2004年开始提供了一种商品寻价和比价服务, 直至目前为止, Synfonic已经可以为客户提供电影信息、体育比赛信息、股票信息、天气信息在内的多种垂直搜索服务。而在国内各家搜索厂商也投入到无限垂直搜索领域, 例如结信网络已经推出专业的搜索音乐类内容的服务品牌“So Lo搜乐”。这种搜索模式能够使用户更加快速的找到自己需要的内容或服务, 提高搜索效率, 同时也使搜索系统能够更好地理解用户的搜索请求。而且随着用户需求的不断细化, 垂直搜索一定会在移动搜索市场中占据越来越重要的位置。
3) 智能化搜索
无线搜索由于使用环境和应用终端都和传统互联网搜索有很多不同, 所以在具体的搜索技术和搜索模式上都更加强调智能化。由于网络服务模式的不同 (PC网络免费, 手机网络收费) , PC用户可以在任何时间, 即使在没有任何准确需求的情况下使用搜索引擎。而无线搜索用户在使用搜索时, 通常都有着非常强的需求性。而目前用户的使用习惯还处于培育阶段, 在针对关键字的搜索模式上部分用户仍存在一定困难, 用户还习惯于通过自然语句进行搜索。因此, 使用户可以通过自然语句的问题来搜索所需内容是移动搜索技术智能化的发展重点。例如, 结信网络推出的“搜乐”服务在音乐领域内拥有专业精确智能的搜索效果, 结合自然语言的AI技术, 可以根据用户自然语言提问搜索相关彩铃, 振铃, MP3等内容。
(2) 企业用户端——互动广告系统
目前, 企业端收费仍是无线搜索技术运营商非常重要的一种盈利模式。与互联网搜索盈利模式相同, 无线搜索技术运营商将提供竞价排名与广告位的方式作为向广告主收取广告费用的途径。但是由于手机终端屏幕较小以及用户使用习惯仍在培育中, 在广告推广方式上不可简单沿用互联网的服务模式, 需针对移动搜索服务具有的独特优势提供广告搜索模式。
由于移动运营商有能力获得每个用户的搜索请求, 将这些请求和该用户的个人信息进行关联分析, 就可以得到关于用户使用模式、付款习惯等相关信息。而电脑搜索时用户被I P地址所屏蔽, 广告商无法了解用户的个性化需求特点。结合当前出现的Web 2.0的思想通过推出互动广告系统即可实现广告搜索的有效推广。Web2.0的核心是强调人的个人化“生产”, 由Web1.0的被动接收信息转变到Web 2.0的主动创造信息。Web2.0对移动搜索来说很有实效性。运营商可基于个人用户搜索习惯信息, 将与用户最相关的广告连同搜索结果一道传送到显示屏上, 故互动广告系统的推出会更有针对性以及更有效率。
五、结束语
目前移动搜索服务相对于彩玲、彩信等成熟的移动增值业务来说还处在市场导入期, 市场尚需培育, 盈利模式也需要进一步探索。但是用户对随时随地获取信息的需求将促使这一新业务进一步发展。同时随着3G的临近, 无线接入速度和带宽加大, 移动搜索内容进一步丰富, 终端更加智能化, 移动搜索业务必将会进入一个快速发展的阶段。
参考文献
[1]袁琦.移动搜索技术与业务发展研究, 电信网技术, 2007, (4)
[2]刘峰.移动搜索业务发展前景分析, 现代通信, 2006, (10)
[3]欧中洪, 宋美娜, 宋俊德.移动搜索面临的机遇与挑战, 电信技术, 2007, (2)
[4]吴刚, 王抒芸.移动搜索:增值业务新宠, 通信企业管理, 2006, (3)
[5]胡海波.移动广告业务发展现状与分析, 通信世界, 2006, (9)
李开复之后搜索引擎的方向 篇2
李开复选择了离开谷歌。经历过苹果、微软、谷歌的华丽转身,李开复无疑已成为大学生寄托成功梦想的一线偶像。在当年的“打工女皇”吴世宏淡出人们视线之后,中国青年迫切需要这样的偶象,指引个人成功之路,相信李开复在这方面也会十分胜任。
不过,谈“李开复之后搜索引擎的方向”,并不是说李开复对搜索引擎这个行业有多么重要。李开复在谷歌中国任上的成绩不错,令其主要业绩翻了一番。但放在IT业的“搜索引擎历史”中,李开复的名字是看不见的,这点不同于对超链分析深有研究并曾深深影响INFOsEEK的李彦宏。李开复无论在微软,还是在谷歌,看来都不足以“全面掌控”战略发展方向,更象是顶层“交办任务”的总牵头人。只是,李开复的离开,适逢搜索引擎发生历史变局的前夜。我个人认为,李开复离开前,搜索引擎基本还处在“原始社会”阶段(虽然李开复对此不需要负什么责任);而从今以后,搜索引擎面对的问题——不如说是12岁至18岁间的下一代国家首富们面对的问题——如何使之进入“以人为本”的现代文明状态。
借李开复离开这个时机我想谈谈这个问题,不是因为了解技术,而是纯粹作为一个使用者,反映一个对搜索引擎“原始”现状深为不满的消费者的需求。
搜索引擎文明化第一个没解决的大方向上的问题,是根本技术路线问题。现有搜索引擎——无论是Inktomi(Yah00)、INFOSEEK(baidu)、Google——对人的理解,从顶层设计看是不中正的,过于偏向“人是机器”的一面,而无视了人的“湿”(生命性)的一面,这是要寄托于下一代信息与生命技术融合才能解决的问题。
从表面来看,搜索引擎技术只是技术问题,但其大的发展路径背后受技术哲学的支配。有什么样的对人的根本理解,就有什么样的技术。人工智能哲学在根上没有解决的问题,在搜索引擎技术路线选择上,同样突出反映出来。以Google们为代表的“老一代人”为例,思维始终陷在“人是机器”的大思路中,反映在技术路线上,就是片面依赖数学算法而形成对人的另一面——从经验到直觉——把握上的大片盲区,甚至根本不觉得感性有什么重要性。这条路走到黑,就会反映在如下的笑话中:你在Google上列出算式回车后,会得出如下荒谬的结果:999999999999999-999999999999998=0(而减少一位后,99999999999999-99999999999998=L)。说明机器计算总有一个极限,解决不了在人的直觉中很简单的问题。下一代要成为首富,肯定不是靠模仿这条路子(虽然计算派也会继续发展),而是脑筋急转弯,抢先在顶层猜出“人是什么”这个斯芬克斯之谜,然后再想还有没有别的路线可走。
我认为中国科学院一位专家的判断是符合这个方向的: “基于统计和经验的方法在超出传统机器学习的范畴之外也发展出一些独特的方法和技术,这些应用将会使下一代搜索引擎在技术上取得突破。”认识到人既有理性的一面(可以数学化、机器化),也有感性的一面(需要交互、锚定),也许并不是再发明个“经验算法”,而是要考虑如何把“算”法与“心”法有效联接。例如诺贝尔奖获得者卡尼曼通过经验参照点(可以在EMC的存储中,或IBM的智慧地球上)的感性选择,经过框架(规则库)沉淀,再进入(机器可计算的)理性选择,就较好处理了感性选择与理性选择的关系,而不是一根筋赖在数学计算上。
作为使用者,我现在用着搜索引擎,就好象用周口店人取火的木头,横竖不好使。我为什么要用浏览器搜索,而不能用统计软件来搜索呢?利用后者的神经网络、关联规则、决策树等功能,我本来可以从一大堆无关的现象中,透视事物内在联系;我用搜索引擎查找科研文献时,为什么不能象在CNKI服务中通过引用关系,在思路上灵活转换要导向的问题呢?我不是刁民,我无非是在和一般使用者想着同一件事:只想得到想要的。
其它学科关于心智成本、理性与经验关系的思考,要比搜索引擎行业对人的理解成熟得多。我以为下一代存在的最大机会,是平衡考虑人是什么的问题。连人是什么都没有搞懂,还搞什么技术呢?
搜索引擎文明化第二个没解决的大方向上的问题,是软件与人工服务结合的问题。搜索引擎业在心物二元、机器至上的大思路指导下,就容易产生轻视人工干预的倾向。这与下一代Saas和众包的潮流是不符合的。Google近年突出的进步,是在平台与增值业务分离方面迈出了实质步伐(而百度显然还局限在竞价排名这种平台与增值不分的陈旧思路里),但如何实现软件服务化,特别是将湿件整合进商业模式,还有较长的路要走。Google倡导的云计算是好东西,但主要是技术层面的云计算,而人这一层面的云计算(如众包)明显不足。作为产业领袖来说,这种问题还是出在技术决定论上。下一代的机会在于,要有针对地在Google“心一物”二元论的基础上,思考如何向“心”(也就是湿件,如SaaS和众包)的方面靠。 搜索引擎文明化第三个没解决的大方向上的问题,是从技术融合、业务融合向产业融合转变的问题,具体来说是搜索引擎与电子商务在产业水平甚至更高水平的整合问题。站在这一代人的角度看,似乎Google的商业化已经很成功了,后人没有多少机会了。但站在历史前方看,Google模式仍然是漏洞百出的。最集中的一点是,搜索引擎产业与电子商务产业,至今还是两大产业,而非同一个产业。这种状态可以被这一代人容忍,但对下一代来说,是可忍孰不可忍,应该要用大思路、大气魄、大创新来解决这个问题,实现技术与商业在商业文明层次上的彻底融合。按这个标准衡量,Google在从广告向窄告、销售向营销以及它们之间的融合创新上,已呈现某种暮气,需要年轻一代进一步发挥战略想像力,实现更大突破。这种突破的最终标准,是看在宏观上能不能实现对占一国GDP@45%N50%(以诺斯测算的美国标准)的交易费用进行重新配置;对应中观,就是搜索引擎与电子商务的产业级融合;对应微观,就是将90%企业不打广告盲目生产销售,变为90%以上企业通过窄告一对一营销。这将是真正革命。
方向搜索 篇3
刚体极限平衡法是对边坡进行稳定分析的一种定量分析方法, 凭借其简便和实用的优势占有重要的地位[1,2,3,4,5,6,7]。
早期的条分法是二维的方法, 源于瑞典的彼德森 (Petterson) 在1916年提出的瑞典圆弧条分法, 是实现极限平衡分析的一种具体方法, 费尔纽斯 (Fellenius) 和泰勒 (Taylor) 又进一步发展了这个方法。
近年来一些学者已经开始研究边坡的三维极限平衡分析理论, 目前已经发展出的三维极限平衡分析方法有:三维普通条分法[1]、三维简化毕肖普法 (A.W.Bishop) [2]、三维简化简布法 (N.Janbu) [3]、三维斯宾塞法 (E.Spencer) [4]以及三维剩余推力法[5]等。
三维边坡稳定分析研究主要包括以下3方面任务:
(1) 对滑坡体内某一确定的滑裂面, 计算其在某一确定方向上的抗滑稳定安全系数。
(2) 对滑坡体内某一确定的滑裂面, 计算其最危险滑动方向。
(3) 在所有可能的滑裂面中, 重复上述步骤, 找出相应安全系数最小的滑动方向所对应的滑裂面, 就是最危险滑裂面。
针对第1项任务, 文献[5]已建立了一种三维剩余推力法。在此基础上, 本文中针对第2项任务, 采用遗传进化算法, 提出一种搜索三维边坡最危险滑动方向的计算方法, 并将其应用于实际工程, 取得较好的结果。
1 三维剩余推力法基本理论[6]
1.1 边坡几何模型
首先用相互垂直的2组铅直面将滑动土体离散成m行n列具有垂直界面的条柱, x轴正方向平行于滑坡体滑动方向, z轴正方向铅直向上, 建立如图1所示整体坐标系oxyz。
1.2 安全系数的求解
安全系数的求解过程如下:
(1) 采用三维剩余推力法原理 (条柱受力如图2所示) , 对每块条柱建立3个方向的静力平衡方程。
(2) 然后将边界值及假定的安全系数F值带入计算出每一列最后一块条柱的剩余推力Pn。
(3) 计算
(4) 如果Pn大于零, 减小F值重新试算。
(5) 如果Pn小于零, 检查列面之间是否违反屈服条件, 如果列面违反屈服条件, 则减小F值重新试算。
(6) Pn小于零且|Pn|<ε (ε=10-5) , 并且列面间不违反屈服条件时F值就是所求安全系数。
该法可用于计算具有任意形状滑动面的边坡在复杂荷载作用下三维稳定安全系数。
2 遗传算法
2.1 遗传算法基本概念
遗传算法GA (Genetic Algorithm) 是由美国Michigan大学的John Holland教授于1975年提出的, 是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局的概率搜索方法。
遗传算法具有简单通用, 适应性强等优点。它在搜索过程中不容易陷入局部最优, 能以很大的概率找到整体最优解[6,7]。
2.2 遗传算法基本操作
为实现遗传算法的一个优化循环, 需要选择、交叉和变异3个基本操作:
(1) 选择操作。可以确定选用当代种群中哪些个体生成下一代群体中新的个体。
(2) 交叉操作。用于确定父代的染色体怎样结合, 形成子代的染色体。
(3) 变异操作。按给定的概率, 变异操作随机改变某个染色体中一个二进制位上的数值, 以提供新的基因, 防止迭代落入一个局部峰值区域。
遗传算法在进化搜索中以适应度函数为依据, 利用种群中每个个体的适应度值来进行搜索。一般而言, 适应度函数是由目标函数变换而成的。
2.3 遗传算法的实现
在使用遗传搜索三维边坡滑动方向时, 将边坡滑动角度作为染色体, 并对其进行二进制编码。滑动角度的最大取值范围为 (-90°, 90°) 。
为满足一定的精度, 每个变量均采用9位长度的二进制串。在本搜索方法中滑动角度是唯一的变量, 故染色体的总长度为9位。
由于遗传算法通常用于搜索最大值, 故将目标函数转化为适应度函数:
3 算例考核
首先对简单边坡进行考核。
本文采用与文献[8]相同的滑动面及参数。滑动面为旋转椭球面, 滑面方程为:
假定滑面通过坡顶和坡脚, 主滑面的滑弧半径为40 m, 在滑面方程中a=x0=z0=40 m, 滑体宽度为w, 可得
滑动土体容重γ=22 kN/m3, 滑面强度指标c=30 kPa, 内摩擦角φ=30°, 取w=20 m。滑坡体按等间距剖分, 坐标系及条块划分如图3所示。本算例中x方向是真实滑动方向, 其对应的三维极限平衡法计算结果见表1[5]。
现假定滑动方向为未知, 于是把x轴、y轴旋转θ角后, 在新坐标系x′oy′中沿x′ , y′方向划分网格, x′方向为假定的主滑方向。此时边坡条柱划分情况如图4所示 。
采用遗传算法搜索出最小安全系数对应的滑动方向, 该滑动方向就是边坡的最危险滑动方向。
由于本算例滑坡体是均质对称的, 所以在θ=0°的方向是最危险滑动方向。采用作者编制的三维剩余推力法程序计算得到θ=0°方向的安全系数为1.251。椭圆滑坡滑动角度对安全系数的影响见图5。
采用遗传算法对椭圆滑坡体的最危险滑动方向进行搜索计算得到最小安全系数为1.252, 对应的滑坡体最危险滑动角度θ=1.23°。图6显示了遗传算法的进化过程, 大约进化到100代时计算收敛。本算例说明采用遗传算法搜索椭圆边坡的滑动方向时虽然存在一定的误差, 但是基本可靠。
4 工程实例
三板溪崩塌堆积体分布于电站进水口右侧VI号冲沟上游大支沟内。分布高程为375.0~657.0 m, 坡体厚度为5.0~40.0 m, 平均厚度为15.2 m, 堆积体方量约44万m3。堆积体自然地形高陡, 地表坡度32°~38°。崩塌堆积体与基岩之间的接触滑带为灰黄至黄色角砾夹黄色可塑至软塑状黏土, 厚度约为0.5 m。在自然条件下, 地下水分布于滑面以下, 因此不需考虑水体对于崩塌体的稳定性的影响作用。三板溪滑坡三维透视图见图7, 岩土体的基本物理力学指标见表2。
采用本文方法进行搜索计算, 大约进化到10代时计算收敛。三板溪崩塌体最危险滑动方向为40.2°, 得到最小安全系数1.02。安全系数与滑动角度的具体关系见图8。
采用有限元法计算边坡在天然状态的整体安全系数为1.05~1.10[8]。另外, 有限元计算边坡整体位移。如图9所示, 可以看出其变形趋势与本文搜索的最危险方向较为接近。
5 结 语
本文在三维剩余推力法基础上, 提出了一种采用遗传算法搜索三维边坡最危险滑动方向的方法, 并将其应用于工程实际, 取得了与实际较吻合的成果。
摘要:提出一种应用遗传算法确定三维边坡滑动方向的计算方法。首先把边坡用铅直面离散为柱条, 假定边坡沿某一方向滑动, 用三维剩余推力法原理, 推导出边坡沿这个滑动方向的安全系数。然后将滑动方向作为变量, 安全系数的倒数作为适应度函数, 应用遗传算法搜索出边坡的最危险滑动方向。通过算例考核了方法和程序的正确性, 并应用于三板溪水电站进水口滑坡, 取得较好成果。
关键词:三维边坡,安全系数,遗传算法,最危险滑动方向
参考文献
[1]Hovland H J.Three-dimensional slope stability analysis ofslope[J].Journal of Geotechnical Engineering, 1977, 103:971-986.
[2]Hunger O.An extension of Bishop's simplified method of slopestability analysis to three-dimension[J].Geotechnique, 1987, 37:113-117.
[3]Hunger O, Salgado F M, Byrne P M.Evaluation of a three-di-mensional method of slope stability analysis[J].CanadianGeotechnical Journal, 1989, 26:679-686.
[4]Xing Z.Three-dimensional stability analysis of concave on planview[J].Journal of Geotechnical Engineering, 1977, 103:971-986.
[5]陈胜宏, 万娜.边坡稳定分析的三维剩余推力法研究[J].武汉大学学报 (工学版) , 2003, 38 (3) :69-73.
[6]王小平, 曹立明.遗传算法理论、应用与软件实现[M].西安:西安交通大学出版社, 2002.
[7]肖专文, 张奇志, 梁力, 等.遗传进化算法在边坡稳定性分析中的应用[J].岩土工程学报, 1998 (1) :44-46.
[8]李同录, 王艳霞, 邓宏科.一种改进的三维边坡稳定性分析方法[J].岩土工程学报, 2003, 25 (5) :611-614.
[9]冯道雨.边坡稳定分析的自适应有限元法研究[D].武汉:武汉大学, 2004.
[10]陈祖煜.土质边坡稳定分析原理、方法、程序[M].北京:中国水利水电出版社, 2003.
方向搜索 篇4
关键词:信息检索,中文搜索引擎,存在的问题,发展方向
随着Internet信息资源的迅速增长, 如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息, 成了迫切需要解决的问题, 从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎, 特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进, 本文旨在分析目前中文搜索引擎存在的主要问题, 并为解决此类问题提出一些建议和方法。
一、搜索引擎的概念和及类型
搜索引擎又称检索引擎, 是指运行在Internet上, 以信息资源为对象, 以信息检索的方式为用户提供所需数据的服务系统, 主要包括信息存取、信息管理和信息检索三大部分。
目前, 中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎 (又称全文搜索引擎) 和元搜索引擎。
1. 目录式搜索引擎。
目录式搜索引擎是以人工或半人工方式收集信息, 建立数据库, 由编辑人员在访问了某个web站点后, 对该站点进行描述, 并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与, 其搜索的准确度较高, 导航质量也不错。但因其人工的介入, 维护量大, 信息量少, 信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。
2. 机器人搜索引擎。
这是一种目前运用较广泛的搜索引擎。国内以百度, google、天网为代表。它是使用自动采集软件Robot, 搜集和发现信息, 并下载到本地文档库, 再对文档内容进行自动分析并建立索引。对于用户提出的检索要求, 通过检索模块检索索引, 找出匹配文档返回给用户。
机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大, 范围广, 较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构, 检索结果重复较多, 需要用户自己进行筛选。
3. 元搜索引擎。
元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面, 帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少, 较成熟的则更少, 万纬搜索是目前有一定影响的中文元搜索引擎。
二、现阶段中文搜索引擎存在的主要问题
1. 信息覆盖面有限。
现阶段搜索引擎所覆盖的数据库的规模是非常有限的, 据美国科学期刊Natures一篇报告中称, 全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小 (只占全部网络信息的5%) 等原因在这方面尤为突出。
2. 查全率不高。
查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比, 是判断检索系统质量的度量之一。
国内绝大多数的网站组织的信息大多都是通过浏览方式获得内容。即使是经过精心组织、编排非常合理的网站, 也会有70%~80%的网页不能被搜索引擎检索到。中文目录式搜索引擎因需人工介入、维护量大, 在这方面表现较明显。
3. 查准率较低。
查准率更是判断检索系统质量的重要尺度。是指系统所检索到的真正与查询内容相关的文档占检索出的所有文档数的百分比。
造成查准率低的原因是, 部分搜索引擎的分类体系与科学知识体系之间缺乏内在联系;类目之间逻辑关系模糊, 导致检索路径与搜索引擎类目错位;信息加工深度不够;检索功能单一;检索词的专指性较差;大部分的检索结果是题录式而非全文式, 其内容简单等等。机器人搜索引擎的分类和索引缺乏人工的参与, 其查准率不如目录式搜索引擎, 且检索结果中还含有大量的重复、虚假的信息。
4. 专业性的搜索引擎发展迟缓。
专业性的搜索引擎是为专门收录某一行业, 某一主题的信息而建立, 能够提供专题信息查询服务的搜索引擎。目前中文搜索引擎大多是综合性的, 能同时收录各行业、各学科的多种信息, 但在反映某一行业或某一专题的信息方面很难做到全面、精确, 不能给用户提供特定的信息服务。这就使得专业人员, 特别是某一领域的学者、专家不愿意利用中文搜索引擎去查询资料。
5. 检索功能方面存在缺陷。
一是检索中符合布尔逻辑运算符的搜索引擎极为有限;二是关键词检索输出的结果相关度排序方式杂乱, 不能根据用户需要来选择信息输出的方式;三是多数的搜索引擎是面向主题搜索不是面向用户搜索, 不能重复利用用户检索过的成果, 更不能对特定的用户进行定题跟踪服务;四是检索网站的主页不规范, 有些太简, 有些又太繁, 而且广告内容太多, 无法进行有效检索。
三、中文搜索引擎的发展方向
1. 提高查全率。
首先是需要开发分布式的系统。这种系统可以把各个接点当作是新的信息资源, 扩大数据库的规模, 正在兴起的元搜索引擎属于这种系统, 它在接受了用户的查询命令后, 可同时用多个搜索引擎进行查询;二是把专业数据库资源纳入自己的检索范围。除了Web信息资源外, 网上还有大量的非Web信息资源, 如联机检索系统、光盘检索系统、专业数据库系统。如中文搜索引擎能把这些Web和非Web资源结合起来使用, 即使有的只能查到题录、文摘等内容, 也大大扩展了检索范围, 能为用户提供较全面的检索需求。
2. 提高查准率。
需解决以下几个难关:首先需提高搜索引擎的信息过滤功能。在对网络信息进行集中的搜集之后, 搜索引擎还需对这些信息进行鉴别和过滤, 即剔除大量的无用信息, 而把有效的信息提炼出来并加以聚集;第二则是需对专家过滤后的信息进行一定的检索标引, 并给予相关的标识符号, 如关键词、分类号、主题词等各种标识, 其关键是利用智能检索技术, 提高准确性;把检索的结果存储在相应的数据库中, 并由URL与Internet建立链接供用户使用;还需注意信息定期更新, 以保证信息的新颖性和链接的可靠性。
3. 建立垂直化专业领域的搜索引擎。
网络用户所从事的职业千差万别, 不同的用户对信息搜索往往有不同的要求。综合性的搜索引擎收录的范围太广、太大无法满足某一特定的需求。垂直化专业搜索引擎则可解决这一难题。它只面向某一特定的领域, 专注于自己的特长和核心技术, 能保证对该领域的信息的收录齐全与更新迅速。在提供专业信息方面有着大型综合搜索引擎无法比拟的优势, 所采用的技术都是些较成熟的技术。
中文垂直化专业搜索引擎的发展已取得了一定的成功, 如新浪的新闻搜索, 博客搜索、雅虎的个性化旅行路线搜索、百度的MP3搜索、Google的学术搜索, 航班搜索等都为用户提供了较好的搜索功能, 为今后的继续发展奠定了基础。
4. 搜索引擎的智能化发展。
智能搜索引擎是未来搜索引擎的发展趋势。可以通过自然语言与用户交互, 最大限度地了解用户的需求。智能检索一是表现在搜索引擎技术的智能化, 研究重点放在自然语言处理技术和人工智能技术的研究上;另一表现是体现在搜索引擎面向检索者的智能化, 它致力于通过分析检索者的检索和浏览行为来学习检索者的需求, 利用搜索引擎现有的服务有选择地为检索者提供个性化的服务。
5. 加强搜索引擎的检索功能。
首先需强化全文检索功能。利用Robot实现对站点页面文字内容的全面检索技术。比起目录检索, 全文检索提供了全新的检索功能, 可以直接根据文献资料的内容进行检索, 支持多角度、多侧面地综合利用信息资源, 全面、准确、快速是衡量全文检索系统的关键指标;同时改善用户检索界面, 设计简洁、明白的界面引导用户进入检索状态;更方便、实用的检索技巧的利用, 中文搜索引擎需简化和统一语法规则, 如布尔逻辑检索符号的利用:空格或“*”代替“与”、“+”代替“或”、“-”代替“非”, 规范语法符号, 节省用户的检索时间;还需研发查询图像、声音、图片和电影的搜索引擎。
6. 完善元搜索引擎。
元搜索引擎弥补了独立搜索引擎不全的特点, 提高了检索的全面性。现开发出的中文元搜索引擎的数目很少, 还有诸多缺陷, 需在各方面进一步改进。
元搜索引擎要对各独立的信息特色进行较细致的调查, 以确定自己要收录的范围;在对目标搜索引擎的组织中突出独立搜索引擎的检索特色, 并设计各搜索引擎之间的检索方式的转换算法, 提高用户检索行为的针对性;建立更为灵活的, 面向用户的信息检索服务。检索界面要统一和友好, 检索方法的设置要提供给用户更多的自由空间, 使用户可以按照自己的意愿合理的组织检索式;在检索结果的显示中要开发出一个有效的检索结果去重、选择、排序和优化算法, 这是中文搜索引擎开发中的一个重点和难点。
参考文献
[1]孙建军 成 颖:信息检索技术[M].北京:科学出版社, 2004
方向搜索 篇5
未来的搜索应满足:用户需求变化,搜索将随需而变,朝着开放式搜索、社会化搜索及移动化搜索三个方向发展,最终将成为一个智能化的搜索工具,为全球网民带来全面、便捷、丰富、生活化的搜索体验。搜索在“变脸”的同时,其商业价值也将迸发出新的活力。
智能化搜索的三个方向
最初,互联网的出现解决了人们获取信息、资讯问题,大量的信息通过搜索框分配给网民。但如今的互联网已今非昔比,网民被各种创新式的应用所包围,团购、视频、移动位置服务、社区、微博、论坛、博客、知识分享,以及各种贴近人们生活、工作、日常需求的工具、娱乐、商务应用插件,可以说,网民对互联网的依赖度会大大提升,但也对互联网提出了苛刻的要求。在大变局的前夜,搜索引擎不会一成不变,应该适应新的环境。
人们都在想,面对数量和种类持续膨胀的互联网,谁能成为全球互联网的新入口,去将零散的应用和产品串接在一起?搜索引擎无疑担当起这一重任。在中国,这一趋势已经显露出来。CNNIC的数据显示,搜索引擎用户规模在2010年达到3.75亿,使用率达到81.9%,超过邮箱、IM、音乐等跃居网络应用第一位。但同样也面临着挑战。沈皓瑜表示,搜索引擎将变得更加智能化,开放式搜索、社会化搜索及移动化搜索是未来发展的三大方向。
过去搜索检索信息的工具特征明显,但随着网民需求的转变,在百度每日数十亿次的检索请求响应中,搜索娱乐、工具、阅读等各种应用产品的比例已经超过30%,“框计算”技术将各种优质应用聚拢在一起,通过海量计算、语义分析、智能匹配等技术,根据网民检索的关键词匹配对应的应用,这是开放式搜索的方向;社会化搜索趋势也很明显,网民正在编织一个社会化网络,并制造出了大量的动态行为数据,搜索也会增加更多的社会化元素和功能,去发现、跟踪消费行为,百度已有25%来自“社会化搜索”的贡献;再者,移动互联网的成熟将催生移动化搜索市场,人们通过平板电脑、智能手机等移动终端设备接入,更及时的购物比较,随时随地挑选餐厅、价格、好评、预订,便捷地获取应用,与现实生活贴合更紧密。
网民行为数据挖掘及价值
未来的搜索将更智能化、跨平台、跨应用,成为消费者接入网络生态的中心。广义上的互联网将融入人们的生活、工作及社会经济发展的各个环节,中国4.57亿网民活跃在这张虚拟与现实合而为一的网络中,将产生海量的行为动态数据,这也对搜索引擎的数据处理、挖掘、分析能力提出了挑战,也决定了网民的搜索体验和搜索背后的商业价值。
数据中蕴藏着智慧,这种智慧不仅能满足网民的需求,更能给企业借助搜索平台推广产品和品牌提供了广阔的空间。通过数据跟踪,捕捉用户需求和意愿,为不同用户提供不同的信息和应用体验,将大大改变以往应用碎片化发展的迷茫,为用户节省时间,最便捷地获取信息和应用;另一方面,通过深层数据挖掘,洞悉消费需求和真实意愿,不断构架消费者与企业间的桥梁,缩短企业与消费者间的接触路径,助力企业商业决策,获得更高ROI效果回报。
互联网正处于一个变革的时代,搜索也正被赋予新的使命和定义。在瞬息万变的互联网大潮中,搜索引擎处于用户行为和庞杂应用的核心中枢地带,管理和分配、发现和挖掘新的应用和价值,以用户为中心的技术和产品创新是驱动力,去延伸搜索引擎的未来世界。