图片搜索(通用12篇)
图片搜索 篇1
1 引言
近年来, 互联网技术、云计算技术、移动计算、大数据存储技术飞速发展, 已经成为人们网络购物、在线教育、移动医疗的重要信息来源。网络资源信息众多, 从简单的文本到视频、图像和声音等多媒体资源, 增加了人们获取资源的难度[1]。搜索引擎是随着Web信息资源的迅速增加而诞生的一种技术。搜索引擎可以按照既定的搜索策略, 在互联网中搜集、发现信息, 并且对信息进行理解、提取、组织和处理, 根据用户需求反馈搜索结果, 从而达到快速导航的信息服务目的[2]。由于搜索引擎主要是输入文字等关键词进行查询, 如果图像内容无法通过关键词描述或描述不精确时, 搜索引擎就无法准确搜索到客户期望的图片内容[3]。为了提高图片搜索质量, 人们提出了基于内容的Web图像搜索技术, 该技术可以直接分析图片内容, 根据特征进行分类, 搜索引擎通过对网络上的多媒体图像进行比对和分析, 输出检索的图片资源[4]。
2 基于内容的Web图片搜索关键技术研究
在设计与实现过程中, 基于内容的Web图片搜索引擎的关键技术主要包括图片特征提取和表示、特征向量的比对技术、网络海量图片的分析和信息存储等。图片特征提取和表示是基于内容的Web图片搜索最为核心的技术, 只有准确提取图片中隐含的内容信息, 才可以正确地理解、分析和辨别图像[5]。目前, 图像特征主要包括低级特征和高级特征两类, 低级特征包括图片颜色、形状、纹理, 高级特征主要包括图片中物体名字和图片主题等语义特征。低级特征可以通过图片分割等自动分析技术获取, 高级特征需要人工获取。图片特征提取之后, 可以使用向量形式进行表示和描述, 建立一个良好的图片特征数据库。图片特征向量建立完毕之后, 需要采用先进的图片比对技术, 图片分析与比对技术主要包括神经网络、遗传算法、支持向量机等算法, 可以将用户期望搜索的内容与Web图片信息库进行比对, 选择用户期望的图片内容。互联网中的图片资源较多, 因此如何组织图片资源, 将其保存在一个有效的数据库中, 以便人们能够快速地提取图片并且对其进行分析, 将特征信息存储到向量特征数据库中, 已经是图片搜索的挑战问题。目前常用的图片存储数据库主要采用智能分级网络数据库, 可以实现动态添加图片资源、描述图片资源特征、快速搜索等。
3 基于内容的Web图片搜索应用趋势探索
目前, 基于内容的Web图片搜索技术将会在数字图书馆、Web图片搜索、家庭电子相册和电子商务等领域得到广泛的应用, 以便提高人们获取图片信息资源的能力。
(1) 数字图书馆建设。近年来, 数字图书管理收录的信息资源越来越丰富, 传统的文字搜索已经无法满足需求。基于内容的Web图片搜索引擎可以帮助数字图书馆用户直接搜索多媒体资源, 以便能够快速的获取图书资源, 为用户提供高可靠性服务。
(2) Web图片搜索。目前, 多媒体数据资源在Web内容中占据的比例越来越高, 出现了Flash动画、视频图像等新兴多媒体类型, 因此, 为了能够满足人们的需求, 基于内容的图片搜索可以应用在Web多媒体图像搜索过程中, 满足人们获取多媒体信息的需求。
(3) 家庭电子相册。目前, 智能手机、数码相机、数码摄像机、扫描仪等多媒体录入设备越来越多, 越来越多的家庭重视日常生活的留念, 使用数字设备拍摄、录制、保存和管理家庭照片和视频资源, 但是目前所有的设备都不支持基于内容的检索, 必须为每一个照片或视频资源赋予准确的概括的名字, 管理工作复杂。因此, 基于内容的Web图像搜索技术可以应用于家庭相册软件中, 实现自动化、内容式搜索。
(4) 电子商务。目前, 随着淘宝网、天猫网、京东商城、国美商城、蘑菇街等电子商务网站的快速发展和进步, 电子商务已经如雨后春笋般出现在人们的生活过程中。为了能够保证商品的畅销, 许多商品都设计和制作了美丽的电子图片、录制视频资源和动画向人们展示。因此, 为了能够更好地向用户推广商品, 需要根据用户的需求, 基于内容直接实现电子商务图片、视频和动画资源搜索, 为用户提供直观的购物体验。
4 结语
基于内容的Web图片搜索技术可以采用图片分割、特征提取、特征描述、特征匹配等技术直接搜索图片资源, 有效提高人们使用互联网多媒体资源的效率。但是, 基于内容的Web图片搜索研究尚处于探索阶段, 并没有得到广泛的应用, 其研究前景是非常广阔的, 未来必将得到广泛的推广。
摘要:移动互联网、云计算、大数据技术的发展和应用使人类社会进入“互联网+”时代, 人们可以通过互联网搜索引擎查询自己期望的信息资源, 实现网络购物、在线教育、移动医疗等。目前, 互联网容纳了海量的多媒体图片资源, 基于内容的Web图片搜索已经成为搜索引擎的研究热点之一, 搜索引擎已经引入了神经网络、遗传算法、支持向量机等搜索算法, 提高了Web图片搜索的成功率和效率, 具有重要的作用和意义。
关键词:Web,图片搜索,搜索引擎,特征提取
参考文献
[1]方爽, 殷俊杰, 徐武平.基于相似图片聚类的Web文本特征算法[J].计算机工程, 2014, 32 (12) :121-122.
[2]阿斯艳·哈米提, 阿不都热西提·哈米提.基于文本的图像检索与基于内容的图像检索技术的比较研究[J].首都师范大学学报:自然科学版, 2012, 33 (4) :116-119.
[3]王伟蔚, 张国鹏, 邱顶等.基于DICOM文本与内容的医学图像检索系统研究[J].计算机工程与设计, 2011, 32 (3) :1014-1018.
[4]刘颖, 范九伦.基于内容的图像检索技术综述[J].西安邮电大学学报, 2012, 17 (2) :111-118.
[5]刘铝.基于内容的图像检索方法的研究与实现[D].湖南大学, 2011:2-21.
图片搜索 篇2
搜索引擎是搜集互联网上的信息,汇总整理后,为大家提供方便的信息查询系统,如今搜索引擎以成千万网民上网必用的工具之一,方便了广大生活、学习、娱乐,怎么能更好的使用搜索引擎,下面Seoer惜缘列出了部分搜索引擎查询命令,让我们更好的使用搜索引擎:
intitle命令:
intitle的含义在于搜索网页标题中含有的关键词,例如想搜索标题中含有“it”的内容,就搜索intitle:it ,就会搜索到网页标题中含有it关键词的网页.
“”命令:
“”的含义在于搜索含有关键词内的网页(网站推广www.51hlht.com),例如想搜索标题中含有“baidu”的内容,就搜索“baidu” ,就会搜索到网页中含有关键词baidu的网页.
搜索号码命令
例如想在搜索引擎输入手机号、ip地址、都能查询到手机号的注册地址,ip所在的地址,
site命令:
site的含义在于检索查看设定的网站在搜索引擎中收录抓取内容的数量,例如搜索“site:www.noseo.org.cn“就能查询到搜索引擎收录noseo多少页内容。
+命令与domain命令
+命令与domain命令的含义在于检索网站在搜索引擎中反面链接页面,例如想搜索有什么网页链接到www.51hlht.com的页面,就可以输入domain:www.51hlht.com或者+ www.51hlht.com
mp3命令
mp3命令在查询音乐的下载试听地址,如想搜索歌曲“我和你”的下载试听地址,就可可以输入“mp3:我和你”查询,
inurl命令
inurl命令在于查询网址中含有的关键词,如搜索网址中含有关键词“baidu”的词语,就可以输入“inurl:baidu”查询。
其它铺助搜索命令:
利用-来限定关键词一定不要出现在结果中。 例如:键入seo-网站,会找出包含seo但除了网站的网站。
利用*代替所有的字母,模糊检索那关键词或者是不能确定的关键词。 例如:键入“爱*”后的会查询到包含爱字的相关内容。
利用可以把多个关键词划分为一组,并进行优先查询。 例如:键入“(seo+网络)”来搜索包含“seo”与“网络”的信息.
利用and 表示前后两个关键词是“与”的逻辑关系。 例如输入关键词:聊城 and 江北水城 会找出将包含聊城和江北水城有关的网站。
利用or(|)表示前后两个词是“或”的逻辑关系。 例如输入关键词:聊城 or 出口,会找出将包含聊城 或者出口 的网页。
以上信息在最实用的百度搜索引擎中均可使用。
百度查询页关于网址中代码的含义:
如搜索关键词“知识”第二页,网址如下:www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd=%D6%AA%CA%B6&pn=10&ver=0&cl=3
其中:
wd代表查询关键词
cl=3代表网页搜索
ie=gb2312代表查询输入关键词的编码
tn代表
pn代表显示搜索结果的页数
rn代表页面显示搜索结果的数量
梁冬求索:搜索不等于搜索 篇3
这个世界,也许我们可以通过匹配去有效率地帮助别人,帮助这个人和那个人彼此联结,满足各自需求,而非单个去帮助别人,因为这样反倒吃力不讨好。
竞价排名也是匹配的产物。竞价排名这个模式是否可行在于它能否进行有效匹配,如果找信息的人和拥有信息且想被找到的人能匹配在一起,对双方都会有很好的效果。事实上,往往是提供信息的人(竞价排名客户)比找信息的人(搜索引擎的使用者)更在意这个匹配度,因为他需要为别人的点击买单。很多人指责竞价排名,但很少有人投诉其结果会让他找不到他的东西或给他造成困惑。一个搜索“联合国”的人不大可能看到“压路机”的链接,卖“压路机”的人也不会要求其链接在这个时候显现。当找信息的人和提供信息的人门当户对的时候,谁给谁钱并不是重要的事情。
搜索引擎商业模式中的核心是匹配,而不是搜索。搜索表达的只是这其中的一半环节。搜索引擎真正的价值并不是提供搜索引擎服务给某个人,其价值是提供了一种合适的匹配关系,让在互联网两端的人能够自由寻找到对方。运用搜索,不光是寻找到答案,而是寻找到能给答案的人。
搜索不等于搜索,就有如娱乐不等于娱乐一样。中国人是一个象形文字思考的民族,看见“娱乐”二字,第一感觉是“乐”,是“好笑”,其实,绝大部分娱乐的东西不是好笑。比方说,以前一个说相声的人的工作是把人逗乐,但后来,他的工作是把人逗哭,但这并不妨碍他做娱乐这一行,这个人叫朱军,其主持的《艺术人生》同样也是个娱乐产品。再比如说,当我们从露台上往下跳,如果没有绑绳子,那叫自杀;如果绑了绳子,那叫蹦极,你还要付钱给提供这种服务的人,这也是一种娱乐。我觉得,娱乐的本质是一种体验,而这种体验是安全的,在娱乐产品中所体验到的悲欢离合乃至生离死别,都可以让人们或喜或悲、有所触动,但对于体验者都是无害的。
回到“匹配”的话题上来,其实对于人的职业生涯,“匹配”也是很关键的。一个人工作得快乐不快乐,不在于自己能干不能干,重点是他和他干的工作是否匹配。最好的情况是一个人的能力比他的位置需求高一点点,因为能力高太多他就会郁闷,不够就会吃力,高一点点就能做起事情来游刃有余。同时,一个人在职业生涯中需要不断历练,找到合适的位置并努力去胜任它。随着公司的成长,对位置的需求是不断变化的,人必须保证自己比所处的位置成长得更快。
手机搜索:百度搜索 篇4
百度搜索在搜索过程中可以自动记录搜索历史、提供搜索建议, 大大简化了搜索输入, 同时支持文字、语音两种搜索方式, 提供更加快捷的搜索服务。作为中国的本土产品, 无论是使用方式还是语言上都切合中国人的习惯。
该应用集成百度贴吧、百度新闻、百度风云榜、百度小说、hao123等常用服务, 同时可以将搜索结果中的百度数据开放平台信息添加到应用首页的Ding, 即时跟踪日常信息, 提供更加高效的搜索。
图片搜索 篇5
新功能一:改进的补充工具栏
Google桌面搜索的安装很简单,安装完毕后,需要重启系统。运行后,我们可以看到补充工具栏与以前有一些变化,它可以会根据你的桌面墙纸或主题的颜色,而进行自动采样,使得侧边栏显得更协调。从下图我们可以看到,模拟时钟的背景为半透明效果,与桌面背景融合比较好。
除了改进补充工具栏外,还对绝大多数现有官方小工具进行了新设计。我们可以按照自己的需要添加各种小工具,比如电子邮件、新闻、天气、照片等方面的内容。具体操作如下:
点击侧边栏上方的“添加”按钮,在打开的“添加/删除小工具”窗口中,选择你需要的小工具,然后点击“添加”即可。这里你可以先通过“详细信息”链接来了解该小工具的用途,然后再安装。
比如添加“天气”小工具,添加完毕后,在侧边栏中将显示天气情况,默认显示北京的天气,我们可以在“选项”中进行设置,选择你所在的城市,以后就可以随时查看当地的天气预报了。
热门推荐:Win Vista试用过期“惨状”图集压缩大作战!流行压缩软件评测
点击阅读更多学院相关文章>>
分享到新功能二:即时预览搜索结果
搜索一个关键词后,通常会得到很多相关的搜索结果,这时,对搜索结果的筛选就比较麻烦了,新版的google桌面搜索具备了预览搜索结果的功能 ,允许用户在浏览器右侧预览搜索结果,用户无需逐个结果进行点击就知道它到底是不是你要搜索的内容,
比如我们搜索“桌面”,在搜索结果中,有些图片文件是在桌面中的某个文件夹中,也被纳入了搜索结果,这时,通过预览功能,我们就可以轻松剔除这部分内容,从而快速找到我们需要的搜索结果。
新功能三:增加安全性提示和快速搜索框
除了以上两个方面的改进外,新版的google桌面搜索还能自动识别IM软件、文档、Email以及网页上出现的恶意链接,如果有恶意链接,用户点击时会发出警告提示,从而增强了操作的安全性。
此外,在桌面搜索中还可以快速切换到网页搜索,具体操作是点击两次“Ctrl”键即可打开网页搜索的快速搜索框功能,按两下“Ctrl”键即可显示或隐藏。这在一定程度上方便了大家的操作。
评测总结:
经过以上我们的试用,可以看出新版的google桌面搜索主要是在易用性方面做了很大的改进,比如改进的补充工具栏和网页快速搜索框,同时在安全性方面有所增强,但最大的特色还是可以预览搜索结果。总的来看,没有脱胎换骨的更新,但是却能让用户感受到其体贴和用心,推荐大家升级使用。
热门推荐:Win Vista试用过期“惨状”图集压缩大作战!流行压缩软件评测
上一页 1 2
点击阅读更多学院相关文章>>
图片搜索 篇6
搜索结果整合化
用雅虎360度全能搜索进行搜索后,在返回的搜索结果页面中不再是单一的网页链接,而是增加了更多的相关内容和工具选项,使搜索更细致和全面。比如在进行网页搜索时,在搜索结果页面提供了“相关搜索”列表,提供与关键词相关的其它热门候选词链接,方便你快速进行相关搜索。在右侧则会根据搜索内容动态显示其它类型的搜索结果,比如关键词是歌手名时,就会在右侧显示该歌手最热门的歌曲链接,点击即可播放,还有歌手图片和博客链接等,这样在一个页面中就可以获取比较全面的搜索内容,大大减少了搜索过程。其它在资讯、图片和音乐搜索中都提供了很实用的工具选项。比如资讯搜索可以按照时间信息来过滤搜索结果,音乐搜索则可以按照文件格式或文件大小来过滤搜索结果等,从而大大提高了搜索速度和准确性。
一步登录网站
当你想快速查找或登录某个常用网站时,一般只要在搜索框中输入网站名称或是该网站常用的中英文简写即可一步登录。比如你想查找并登录腾讯网站,只须在搜索框中输入QQ,在下方会立即弹出一个浮动菜单,上面第一项就是QQ网站的链接,点击即可直接登录。这样就省去了查询时间,很方便。
快速获取表情图
你想给QQ找几个有趣的表情图片?很简单,把雅虎360度全能搜索切换到“图片”类型,输入表情关键词,比如“生气”,点击“全能搜索”后会返回很多与生气相关的图片。不过这些图片太大,不适合在QQ上使用,不要着急,在页面左侧选中“聊天表情”选框,即可自动对图片过滤,剩下的就全是百分百的QQ聊天表情图片了,尽情挑选吧,让你乐个够。
股票查询直通车
如果你是个股票玩家,想快速查询某个股票的走势,只须在搜索框中输入该股票的股票名称、股票代码、公司名称或者特定的股票标志性词汇,点击“全能搜索”按钮在返回的搜索结果页而中就会显示出该股票的走势图、股市行情以及该股相关资讯报导等,使你能快速直观地全面了解该股票的当前信息,相当实用。
明星搜索玩八卦
图片搜索 篇7
1.1 宽度优先策略或深度优先搜索策略
这两种策略是基于图的遍历思想的策略, 它没有考虑到页面间的相关性, 目的只是为了搜索整个互联网。基于整个Internet搜集的Robot目的只是搜集到尽可能多的Web信息, 没有特定的要求, 一般选用这两种策略。
1.2 聚焦搜索策略
聚焦搜索策略只关注某一个特定主题的页面, 根据"最好优先原则"进行访问, 快速、有效地获得更多的与主题相关的页面, 主要通过内容和Web的链接结构来指导进一步的页面抓取[1]。
1.3 基于内容评价的搜索策略
基于内容评价的搜索策略[2], 主要是根据主题 (如关键词、主题相关文档) 与链接文本的相似度来评价链接价值的高低, 并以此决定其搜索策略。链接文本是指链接周围的说明文字和链接URL上的文字信息, 相似度的评价通常采用以下公式:
其中, q代表主题关键词集合, p代表页面链接文本集合, wkq代表集合q中单词k对某一主题的重要程度, wkq通常采用tf*idf公式计算[3]。
1.4 基于链接结构评价链接价值的搜索策略
由于Web页面不同于传统的文本, 它是一种半结构化的文档, 包含许多结构信息;Web页面不是单独存在的, 页面中的链接指示了页面之间的相互关系, 因而有些学者提出了基于链接结构评价链接价值的策略。这种是通过对Web页面之间相互引用关系的分析来确定链接的重要性, 进而决定链接访问顺序的方法。通常认为有较多入链或出链的页面具有较高的价值。PageRank[4]和HITS[5]是其中具有代表性的算法。
1.5 基于巩固学习的搜索策略
考虑到巩固学习 (reinforcement leaning) 在预测远期回报方面具有优势[6], Rennie和McCallum将其引入网络爬虫的学习过程。在其提出的模型中, 将网络爬虫看作代理体, 面对的Web环境代表状态, 对链接的访问代表行动。搜索过程中, 经过若干无关页面的访问之后才能获得的主题相关页面称为未来回报, 对未来回报的预测值称为未来回报价值。
1.6 基于"语境图"的搜索策略
基于巩固学习的搜索策略能够通过计算链接的Q价值确定搜索方向, 但它却无法估计距离目标页面的远近。为此, Diligenti提出了基于"语境图" (Context Graph) 的搜索策略[7], 它通过构建典型页面的Web"语境图"来估计离目标页面的距离, 距离较近的页面较早得到访问。
2、中文搜索引擎Robot搜索策略
2.1 基于首页优先搜索的策略
这种搜索策略使中文搜索引擎Robot在运行过程中生成了一个较为完整的中文域名表, 在匹配过程中提供新站点识别的功能。新站点识别的过程:一个URL, 提取其域名部分, 使用域名过滤时若在中文域名表中匹配成功, 则该URL所在的域名已经处理过, 若匹配不成, 说明该域名为新出现的域名, 域名代表的站点为新站点。在搜索过程中一旦发现一个新站点, 那么系统将基于它的首页优先搜集信息。
2.2 基于链接深度的搜索策略
给定这样三个URL:http://www.lytu.edu.cn/xuexiaojianjie.htm、http://www.lytu.edu.cn/cupnews/a/200505/20060221140941.shtml、http://www.lytu.edu.cn/。我们定义它们的链接深度分别为1、4、0。URL的链接深度为它的路径的深度, 域名的链接深度定义为0, 根据路径的深度依次增加。
基于链接深度的搜索策略就是根据URL链接深度和URL重要度的某种关系, 对链接深度进行排序, 优先搜集重要度高的URL。例如:对于一个链接深度为5的网站, 链接深度的重要度排序为0、1、2、5、4、3。那么在搜集过程中优先处理链接深度的重要度排在前面的URL。
2.3 基于发现深度的搜索策略
这是一种动态的启发式搜索策略, 发现深度为基于首页的发现深度。规定所有首页的发现深度为0, 那么解析首页提取的URL的发现深度为1, 在深度为1上提取的URL的发现深度为2, 依次增加。由于互联网上存在的大量的重复链接, 一个URL要被解析出很多次, 使它有多个发现深度值, URL的发现深度值取其最小值。
基于发现深度的搜索策略规定:发现深度值越小, 它的优先级别越高。这种策略在首次搜集中适用性不强, 因为URL之间复杂的链接, 使得发现深度值的计算量非常大, 而且一些URL发现深度值的最终确定前, 此URL可能早就搜集过。但可以基于此策略计算出所有搜集到的URL的发现深度值, URL的发现深度值可以作为URL重要度的一个参数, 应用于信息更新和返回结果的排序上。因此也可以叫做基于发现深度的更新策略。
2.4 基于信息变化度的更新策略
基于信息变化度的更新策略是对周期性更新策略的一种改进, 它依据每个URL信息变化度来调整其更新周期, 是一个动态学习的过程, 最终为每个URL设定一个较为合理的更新周期。信息变化度的定义:URL更新时, 当前的信息与上一次信息的差异值。该策略的难题是采用什么方式计算URL的信息变化度。本文给出基于关键词的计算模型。
定义:用表示URL的当前文档的关键词集合, dn表示URL的下一次文档信息的关键词集合。用dci表示dc的关键词集合第i个关键词, pci表示dci出现的频率;用dni表示dc的关键词集合第i个关键词, pci表示dni出现的频率。若令t表示文档中关键词的数量, 关键词集合dc={dc1, ..., dct}, 频率集合pc={pc1, ..., pct}。用wi表示权值, 这个权值表示第i个关键词与文档的相关度。若关键词dci没有出现在文档关键词集合dni中, 则wi=0, 若出现在关键词集合dni中的第j个位置, 则wi=min (pci, pcj) 。
S (c, n) 为dc与dn的相似度, 其定义如下:
V (c, n) 为dc与dn的变化度, 其定义如下:
由公式可以获知V (c, n) ∈[0, 1]。
基于变化度更新策略的文档周期的调整:最初设定所有的文档更新周期为q, 若一个URL经过第i-1次基于变化度的调整, 更新周期为qi-1, vi-1为该URL的第i-1次更新的变化度, vi为该URL的第i次更新的变化度, 其具体调整如下:
若vi>vi-1, 则qi的定义如下:
若vi<vi-1, 则qi的定义如下:
基于变化度更新策略可以根据实际的变化度动态的调整每个URL的更新周期, 它使得每个URL都有自己的更新周期, Robot根据每个URL的更新周期对URL进行更新, 减少了更新的盲目性, 争取使更新达到最好的效果。为了某些URL的更新周期过于短, 给更新周期q设定最小值qmin, 也为防止某些URL的更新周期太长, 给更新周期设定最大值qmax。
3、小结
本文详细介绍了搜索引擎Robot的搜索策略, 针对中文搜索引擎Robot, 给出了基于首页优先搜索的启发式搜索策略, 并对基于链接深度的搜索策略和基于发现深度的搜索策略进行了分析, 最后, 提出了一种新的更新策略基于信息变化度的更新策略, 并给出了一种计算模型。
参考文献
[1].Focused Crawling:A New Approach to Topic-Specific Web Resource Discovery.S.Chakrabarti, M.van, B.Dom.In Proceedings of the 8th Inter-national WWW Conference, Toronto, Canada, 1999
[2].Cho J, Garcia-Molina H, Page L.Efficient crawling through URL order-ing.Computer Networks, 1998;30 (1~7) :161~172
[3].Srinivasan P, Pant G, Menczer F.Target seeking crawlers and their topicalperformance.In:Proc of SIGIR Conference on Research and Developmentin Information Retrieval, ACM press, 2002
[4].Page L, Brin S, Motwani R, et al.The PageRank Citation Ranking:Bringing Order to the Web.Stanford Digital Libraries Working Paper, 1998
[5].Bharat K, Henzinger M R.Improved Algorithms for Topic Distillation ina Hyperlinked Environment.In Proceedings of the ACM-SIGIR, 1998
[6].Sutton R S, Barto A G.Reinforcement leaning:an introduction.MA:MITPress, 1998
图片搜索 篇8
1 垂直搜索引擎
1.1 垂直搜索的概念
垂直搜索是针对某一个行业的专业搜索引擎, 是搜索引擎的细分和延伸, 是对网页库中的某类专门的信息进行一次整合, 定向分字段抽取需要的数据进行处理后再以某种形式返回给用户[1]。
垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取, 也就是将网页的非结构化数据抽取成特定的结构化信息数据, 好比网页搜索是以网页为最小单位, 基于视觉的网页块分析是以网页块为最小单位, 而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库, 进行进一步的加工处理。
1.2 垂直搜索的现状与应用领域
目前垂直搜索从技术角度来说, 实现起来比较容易, 而且很多网站做的非常好, 对综合搜索带来了极大的挑战。“细分市场, 从垂直搜索切入。”这可谓是垂直搜索领域新进者的标志性口号。现在的垂直搜索能够在键入关键词后, 用户获得的非相关信息量大大减少, 极大地提高了查准率, 给用户查找信息节省了时间。
2 国内常见人才搜索比较
在国内, 关于人才市场方面的网站有成千上万, 如果想在很短的时间内知道一个地区的招聘信息, 犹如大海捞针, 尽管像google、百度这些综合性网站提供这方面的搜索, 但是搜索结果往往让用户大失所望。随着垂直搜索引擎的发展, 一些专业门户网站开始出现, 并在各个行业覆盖, 在人才搜索方面典型的网站有如下几个: (1) 深度搜索; (2) 职友集; (3) 职通车; (4) 搜职网; (5) 托托搜索, 下面对这几个网站进行简单的分析比较。
2.1 检索界面 (表1)
一个提供检索的网站的好坏, 检索界面是一个重要的因素, 一个好的检索界面会更加受到欢迎, 毕竟每个网站面对各种用户群, 检索界面就要变的简洁易用, 如“帮助”能够使不会使用该系统的用户很快熟悉并顺利完成检索任务。
2.2 高级搜索
(1) 深度搜索:搜索关键词、显示条数、搜索范围、工作时间、工作地区、职位分类、学历要求、工作经验、工作性质。
(2) 职友集:职位、公司、地区、发布时间、工作经验、学历要求、公司规模等。
(3) 职通车:职位、公司名称、职位要求、工作地区、发布时间。
(4) 搜职网:职位类别、职位、工作地区、公司、学历要求、工作年限、发布时间。
(5) 托托搜索:无。
几乎大多网站都提供“高级搜索”功能, “高级搜索”能让用户获得更加准确的检索结果, 也就是高的查准率, 有的网站如深度搜索还提供“显示条数”选项, 让数出结果的条数由用户决定, 把更多的权力让给用户, 这也符合Web2.0发展的要求, 更加体现其交互性。
2.3 信息来源
(1) 深度搜索:卓博人才、前程无忧、中华英才、智联招聘、51job等。
(2) 职友集:中华英才、智联招聘、首都人才热线中国人才热线、南方人才网等。
(3) 职通车:数字英才网、前程无忧、中华英才、智联招聘、台湾104人力银行等。
(4) 搜职网:前程无忧、智联招聘等;托托搜索:智联招聘、南方人才、51job等。
以上可以看出, 这几个网站的信息来源有所不同, 但是主要来源还是国内有名的几个人才网 (如前程无忧、智联招聘、卓博人才等) , 对小型人才网的忽视 (如地方人才市场) , 会影响查全率, 有可能让用户失去一次好机会, 这点应该值得考虑。
从使用这5个人才搜索网站情况来看, 只有托托搜索能够通过普通搜索获得相关信息, 其他几个网站都要进行高级搜索才可以得到相关信息, 而且, 深度搜索的检索效果不是太理想, 虽然用时间进行限定, 但是检索出来的结果还是有在这个时间段之前的招聘信息, 这对求职来说, 是“搜索噪音”。
3 人才搜索网站不足与发展趋势
从这5个比较典型的人才搜索网站来看, 它们存在如下问题。
(1) 查全率考虑较少, 许多网站就重点集中在几个大型人才网 (如智联招聘、前程无忧等) , 而对那些地方性的小型人才网搜集较少, 这也将导致查全率较低。有些网站没有提供精确检索, 可能导致很多相似但不是求职人员需要的信息, 如检索“软件工程师”, 深度搜索的检索结果里有许多诸如“软件”、“工程师”等无关信息出现, 影响了查准率。
(2) 聚类检索使用较少, 职友集提供了聚类检索, 可以将检索结果按时间、职位类型、工作经验、学历要求、薪酬水平等进行聚类, 方便用户进行查看, 节省查找时间, 但是许多网站却没有提供聚类检索, 这一点有所欠缺。
(3) 推送服务 (SDI) 几乎见不到, 面对海量求职信息, 求职人员如果获得推送服务, 那么就可以省去好多查找职业信息的时间, 推送服务就是从这个角度出发, 根据记录求职人员搜索过的职位及个人简历, 进行分析, 将相关职业送到求职人员的邮箱中, 如托托搜索做的就很成功。
人才搜索未来发展趋势如下。
(1) 收录的信息来源更加全面, 覆盖全部人才网提供的求职信息, 让求职人员使用一个人才搜索就可以找到所有相关信息, 即在提高查全率和查准率方面下功夫。
(2) 推送服务 (SDI) 虽然在一些网站出现了, 但是没有达到预期效果, 未来的趋势还是需要推送服务, 不光是邮件推送, 还可以通过手机推送, 关键还是搜集用户的职业要求, 能够给用户提供适合的招聘信息。
(3) 简历在线投递服务进一不提升, 提供人才搜索的站点建立自己的数据库, 用于保存用户的个人资料, 包括简历、证书等, 能够实现一键发送效果。
(4) 个性化服务有待发展, 随着Web2.0的发展, 个性化服务越高的搜索引擎网站越能赢得并留住更多的用户, 如语意网的发展, 它在垂直搜索里的应用将使个性化搜索发展的越成熟。
摘要:综合搜索如Google已经发展比较成熟, 同时也面临一些新的问题, 面对快速增长的海量信息, 专业搜索承担了重任。本位介绍了专业搜索的概念及应用, 并简重点介绍了专业搜索在人才搜索中的应用。
关键词:专业搜索,垂直搜索,人才搜索,比较分析
参考文献
图片搜索 篇9
一、获取容易, 记住困难
在这个信息爆炸的时代, 用户能够轻而易举地获取各类信息, 互联网变成了一个“秀才不出门, 便知天下事”的世界。在这个世界中, 搜索引擎变身为一辆“直通车”, 可以让用户随时随地到达他想去的“地方”。
如此快捷简便的生活是古人所不曾拥有的, 古代的人想了解其他地区的消息极不方便, 但因有书籍供他们阅读, 其生活较为充实。因为他们阅读的每一本书都来之不易, 他们所得知的知识、信息都会铭记在心。白岩松说过:“今人虽有百度、谷歌软件, 获取资讯与知识极容易, 但是有识无智, 只有知识却少有智慧。古人获取知识不易, 但多智少识。”[1]用一句很通俗的话来解释, 今人获取信息, 就类似于狗熊掰棒子, 掰一个扔一个, 最后什么都没有留下。
搜索引擎的用户中有极大一部分是学生用户, 这是他们获取“答案”的方便渠道, 尤其是大学生群体, 搜索引擎可以为他们提供作业范本, 甚至现在很多小学生都开始使用搜索引擎来写作业。但是, 他们真正理解了这些搜索得来的答案么?面对唾手可得的信息, 很多时候我们不愿意花费更多的时间去理解消化这些信息, 因为它就在那里, 想要的时候再动一动手指就行了。这种便捷的搜索渠道容易使学生产生懈怠的学习心理, 对信息和知识的理解也越来越浅显化。
搜索引擎必然有其存在的价值, 它可以帮助我们快速、直接、有效地获取我们需要了解的全部信息内容。搜索引擎就好像是哆啦A梦的任意门, 通过这扇门, 世界上所有的信息都轻而易举地获得。我们似乎拥有了超乎想象的检索能力, 但这并不意味着我们是全能的。在这个信息爆炸、知识廉价的时代, 很多时候我们仅仅是满足于获得答案所带来的快乐, 却缺少了像古人那样温故而知新和举一反三的学习态度。
互联网确实为人类提供了储备知识的空间, 可是信息的容易获取并不意味着对知识真正的理解、消化、记忆和对自我知识储备能力的认知。我们应该进一步思考的是如何利用信息、如何探索信息真正的意义。
二、竞价排名, 拼实力还是拼财力
前不久发生的魏则西事件给笔者留下了深刻的印象, 这一事件引发了全民对搜索引擎和涉事医院的集体关注。魏则西在生前发表的博文中说道:“百度, 当时根本不知道有多么邪恶, 医学信息的竞价排名, 还有之前血友病吧的事情, 应该都明白它是怎么一个东西。”百度的这种发布行为属不属于广告?百度的行为是否应当承担相应的责任呢?
“这种搜索引擎发布的广告属于竞价广告, 竞价排名 (又称关键字广告) 是一种按效果付费的网络推广方式。竞价排名是百度国内首创的一种按效果付费的网络推广方式。它是按效果付费, 同时可以竞价搜索引擎里的排位的推广方式, 主要是企业在搜索引擎购买关键词, 当用户搜索这些关键词信息时, 企业的推广内容就会呈现在用户面前。提供这类产品的服务商国内主要是百度, Google提供类似的产品叫‘Ad Word’。”[2]在这个案例中, 魏则西在百度搜索“滑膜肉瘤”后, 在百度第一页便出现了武警北京总队第二医院, 这就是百度推广所推荐的结果, 并且这样的医疗虚假广告数不胜数。
作为中文第一大搜索引擎网站, 我们不禁要发问, 面对基数如此之大的受众群体, 百度是否应该强化属于自己的社会责任呢?在百度推广的官网上, 百度公司对自己的推广行为作出了免责声明。搜索引擎中的竞价广告为互联网企业谋取一定的利益无可厚非, 但是对这些竞价广告的信息应该进行严密的资格审查, 确保竞价广告发布的真实有效。
目前, 搜索引擎广告还存在如下弊端:第一, 搜索引擎根据不同企业竞价推广广告, 拼的是投放企业的财力而非实力, 没有为网民的切身利益考虑;第二, 竞价广告的虚假会降低用户对搜索引擎网站的信任度;第三, 竞价广告会助长不正当竞争的风气。
中国人民大学新闻学院教授陈力丹认为:“搜索引擎已不仅是一项网络应用技术和一个提供信息的平台, 它已成为一种具有广泛影响力的新型媒介, 能够控制信息流动, 起到舆论导向作用, 进而直接影响人们认识世界的方式。此次百度事件暴露出了这一行业的职业操守缺失, 严重损害了信息筛选机制的独立性和公正性, 也损害了这一媒介的公信力。”除了企业自身的自律不足外, 当前我国涉及的互联网安全方面的相关法律法规还极不完善, 这让很多网站钻了空子。有关部门必须尽快制定更完善的法律制度, 搜索引擎企业也要促进行业自律, 规范自己的行为, 作为用户的广大网民要进行事实监督, 正确发挥社会舆论的作用。
Web2.0的快速发展促进了搜索引擎技术的迅猛发展, 它是用户通向网络世界的重要工具, 同时在信息获取、信息传播与信息构建上的重要作用也在不断增强。搜索引擎对我们日常生活的影响不断扩大, 更多的现实问题也日益凸显。搜索引擎企业在发现问题后应及时进行解决, 不断提升自身在用户心中的地位, 创造更持久的价值。因此, 不论是用户自身还是政府、企业, 都应针对搜索引擎的弊端和问题提出积极合理的解决办法, 让搜索引擎更好地为用户服务。
摘要:在这个新闻自由、信息共享的时代, 搜索引擎作为输出信息的重要窗口, 在网民生活中的地位也越来越重要, 但在使用搜索引擎时, 也暴露出了各种弊端。本文从信息获取便利却难以让人记住和竞价广告的弊端两个方面来分析搜索引擎目前存在的一些现实问题, 以期能够引起广大用户和企业等对搜索引擎安全问题的关注, 共同营造良好的网络环境。
关键词:搜索引擎,信息获取,竞价广告
参考文献
[1]白岩松.白说[M].武汉:长江文艺出版社, 2015:113.
图片搜索 篇10
1 VBA简介
VBA (Visual Basic for Applications) 是由微软开发的新一代标准宏语言, 有要能用来扩展Windows的应用程式功能, 特别是Microsoft Office软件。它提供了面向对象的程序设计方法和相当完整的程序语言, 并采用与Visual Vasic完全相同的编程环境。VBA以其强大的开发功能与易用性相结合, 体现了独特优越的编程思想, 已有来自23个不同行业的一百余家独立软件厂商宣布, 将VBA集成到他们开发的应用程序中, 包括著名的Autodesk、Adobe等[1~2]。
2 操作方法
2.1 基本思路
首先新建一个文件夹存放所有的图片, 再利用PPT的“相册”功能将该文件中的图片导入到PPT, 最后用VBA程序实现批量修改图片大小和位置。
2.2 具体流程
1) 新建一个文件夹 (本例中命名“示例图片”) , 用于存放所有的图片 (图片名称不必按一定顺序命名) 。
2) 打开Power Point (本例中PPT版本为2010) , 选择“插入/相册/新建相册”, 显示“相册”对话框, 如图1所示。
3) 用鼠标点击“相册”对话框中的“文件/磁盘”, 出来“插入新图片”对话框, 找到“示例图片”文件夹所在文件目录, 用鼠标框选所有图片 (或按ctrl+A) , 再用鼠标点击“插入新图片”中的“插入”按钮 (图1) 。此时界面如图2所示 (在此对话框可以对图片进行前后顺序、图片亮度、灰度、图片版式等的简单操作) , 然后点用鼠标点击“相册”对话框中的“创建”。随后会自动创建一个新的相册PPT (图3) , 将相册PPT中第一张幻灯片删除, 此时实现了批量插入图片。
4) 选择“视图/宏”, 显示“宏”对话框, 输入宏名 (本例中为Image Edite) , 然后点击“创建” (图4) , 此时会显示VBA窗口 (按Alt+F11也可以调出VBA窗口) 。
5) 在VBA代码窗口中输入以下程序 (图5) 。可以根据自己的实际需要修改里面的大小位置参数值。
6) 选择菜单栏上“运行/运行子过程/用户窗体”运行程序 (或按F5运行程序) 。运行后, 实行了批量修改图片的大小和位置 (图6) 。
3 结束语
Power Point在用户的使用过程中, 加上VBA的协助, 效果十分明显, 能大幅度提高用户的工作效率, 并降低了人工错误出现的概率。对于不会VBA程序的用户, 只需按照文中程序操作即可实现本例中的功能。此处只介绍了PPT与VBA相结合的一个很小的示例, 相信大家如果深入学习编程技术, 会在实际运用中能想到更多更实用性的与VBA相结合的实例。
摘要:Microsoft PowerPoint是微软公司的办公软件Microsoft Office的重要核心组件之一, 在日常的工作中被广泛的使用。VBA作为一种宏语言, 可以扩展PPT的功能, 大大提高了用户的工作效率, 该文介绍通过PPT的相册功能实现批量导入图片并用VBA批量设置图片大小和位置。
关键词:PowerPoint,相册,VBA,批量修改图片
参考文献
[1]孙敬杰.Excel VBA入门与实例演[M].北京:中国青年出版社, 2005.
图片搜索 篇11
一、嗅觉灵敏搜影片——狗狗影视搜索
二、免费下载正版电影——百度影视搜索
三、影视BT种子搜索群
——BT@China搜索引擎
四、又一个BT种子搜索站
——飞客BT搜索引擎
五、分类直达式视频搜索
——Movie34电影搜索引擎
六、专做电影搜索的引擎
——搜影免费电影搜索
七、全国影院信息早知道
——Mtime时光网
八、BT资源搜索一网打尽
——SOWANG BT搜索引擎
九、热搜影视在线观看
——SOWANG免费在线影视搜索
FLV电影如何下载?
图片搜索 篇12
1.1 研究现状
目前有论文对我国大学生的信息素养做详细的研究, 绝大部分在定性的基础上得出我国大学生信息素养需要极大提高的结论。鲜有调查报告和评价研究特定在大学生的网络信息搜索行为上;同时, 对搜索引擎的评价体系的研究也有很多, 但是由于出发点不同, 评价标准多种多样, 也没有形成一致的结论。本文借鉴已有的网站和搜索引擎的评价体系, 结合大学生自身的搜索行为来构建评价指标体系。
1.2 大学生搜索行为现状
根据CNNIC的2009年1月发布的第24次中国互联网发展统计报告, 中国的网民年龄构成中, 18—24岁的网民占据了31.5%;职业构成中, 学生占据了33.2%;由此可见, 中国大学生群体是网民中的生力军。根据《中国青年报》2008年8月的一份调查报告, 80后群体, 尤其是大学生群体, 对搜索引擎已经有了一定程度的依赖, 但是搜索方法和效率普遍存在问题。如学术检索使用频率较低, 相当一部分大学生仅用百度和谷歌来下载论文, 对数字图书馆等权威的网络文献数据库却几乎没有概念。
2. 基于大学生网络信息搜索行为的搜索引擎评价体系的设计
2.1 基于大学生搜索行为的搜索引擎评价指标的选取
1) 针对性本研究评价体系是基于大学生的网络信息搜索行为, 所以大学生这个群体就是本次评价体系构建的“专家”和“问卷对象”, 所有指标的设定都要和大学生的搜索行为相关联。
2) 系统性指标体系要能够全面反映被评价对象的综合情况。
3) 科学性每个指标都要有明确的含义和目标导向;层次划分要有逻辑性, 避免出现范围相交, 越界;注重客观评价和主观评价相结合。
4) 实用性指标体系的内容要操作简单, 易于理解, 易于实施。
5) 定性与定量相结合在赋值的时候我们将运用AHP的相关数学方法进行计算和校验。
根据上述原则, 选取评价指标如下:
查全率:检出的相关文献量与系统文献库中相关文献总量的比率。在网络检索阶段, 系统文献库中的相关文献是个不定值, 难以测量, 故在网络信息检索中, 查全率可以等同于搜索的广度。该数据在大学生群体中运用问卷调查法取得。
查准率:检出的相关文献量与检出文献总量的比率。
权威性:引擎结果提供的内容必须是科学的, 包括信息的编著者是否为该学科的权威, 内容是否规范, 信息的发布或转载是否已获得版权许可等。
新颖性:链接信息能否保持最新状态, 更新周期是否有正确标识。
用户界面友好程度:关注引擎界面是否友好, 是否有利于用户操作。
帮助信息:是否有帮助菜单以协助用户了解搜索引擎的服务和使用。
网站的交互性:是否提供入口接受用户提问、请求或建议。
检索方式的多样性:是否提供高级检索或二次检索、站内搜索引擎检索功能的完备性程度, 是否提供布尔检索、截词检索等。
对用户要求:用户是否需要具备复杂的检索技能, 是否具有普遍适用性。
检索的响应速度:从发出检索命令到显示结果的等待时间。
安全过滤:检索结果是否有安全过滤, 是否可以屏蔽非法信息和病毒 (包括竞价排名合理程度) 。
访问量:反映搜索引擎被用户重视的程度和使用频率。
人链网页数:是指研究对象以外的网络信息资源指向该对象的页面数。
2.2 基于大学生搜索行为的搜索引擎评价体系的构建
1) 我们运用层析分析 (AHP) 方法进行评价体系的建立, 这种方法的基本思想是将定量与定性相结合, 将客观数据和人的主观判断按照数值的比例关系进行表示, 从而对对象进行评价。
我们采用广泛使用的1—9标度, 将两个指标之间的比值用1—9以及1—1/9进行表示, 若两个指标之间比例为1, 则说明这两个指标的重要性相同, 若两个指标之间的比例为9, 则说明两个指标之间的重要性相差极大, 而数字2—8就相应表示指标之间的重要性差异。
我们在建立评价体系时将搜索引擎分为学术和生活两个种类分开考虑, 二者的评价指标相同而相应的权值不同。评价的一级指标为:信息内容、用户服务、技术支持、访问情况。其中信息内容对应的二级指标为:查全率、查准率、权威性、新颖性;用户服务对应:用户界面友好度、具备帮助信息、交互性、搜索方式多样性、对用户的要求;技术支持对应:响应速度、安全过滤;访问情况对应:访问量、入链数。
根据各级指标建立相应的矩阵, 并通过matlab软件计算各个矩阵的最大特征值。已知一致比例系数其中, n为矩阵阶数。已知只有当CR<0.1时, 关系矩阵的一致性才能够通过并作为最后的指标参考, 若CR>0.1, 则说明矩阵的一致性不佳, 需要重新建立矩阵。
2) 学术类搜索引擎的评价体系建立
通过查询资料和专家访问法, 在学术方面, 一级指标的关系矩阵为:
信息内容、用户服务、技术支持和访问情况二级指标均按照上述方法计算, 均通过一致性检验。
3) 生活类搜索引擎评价体系建立和学术类搜索引擎方法相同。
4) 利用一级指标和二级指标权重相乘可得到最终指标权重。学术和生活方面的指标权重值如下:
生活类搜索引擎
一级指标:信息内容0.350, 用户服务0.190, 技术支持0.110, 访问情况0.350。分别所属二级指标:查全率0.102, 查准率0.078, 权威性0.033, 新颖性0.138, 界面友好度0.045, 帮助信息0.016, 交互性0.035, 搜索方式多样性0.078, 对用户要求0.015, 响应速度0.055, 安全过滤0.055, 访问量0.21, 入链数0.14。
学术类搜索引擎
一级指标:信息内容0.528, 用户服务0.195, 技术支持0.117, 访问情况0.160。
分别所属二级指标:查全率0.103, 查准率0.103, 权威性0.260, 新颖性0.061, 界面友好度0.018, 帮助信息0.028, 交互性0.021, 搜索方式多样性0.095, 对用户要求0.034, 响应速度0.047, 安全过滤0.070, 访问量0.080入链数0.080。
3. 结论及建议
本文通过层次分析方法构建了基于大学生网络信息搜索行为的搜索引擎评价指标体系。该体系指标的选取和权重的赋值均特定在大学生群体。具有较强的针对性。后期可进行实证分析, 如选取百度、谷歌、雅虎、腾讯搜搜和CNKI知识搜索等最为测评对象, 将量化的指标带入该评价指标模型中, 从而筛选出最适合大学生学习、生活使用的网络搜索引擎, 指导大学生更为合理、充分地利用网络信息资源。
摘要:近年来搜索引擎技术发展迅猛, 大学生是网民的重要组成群体, 也同时是搜索引擎的主要使用者。文章首先分析了大学生网络搜索行为的现状, 进而提出了基于大学生搜索行为的搜索引擎评价指标体系的设计构建, 从而对大学生合理选择搜索引擎提供参考价值。
关键词:大学生,搜索行为,搜索引擎,评价体系
参考文献
[1]乔冬梅.搜索引擎现状与发展研究[D].郑州大学硕士学位论文.
[2]叶鹰.信息检索:理论与方法[M].北京:高等教育出版社, 2004.
[3]沈固朝.网络信息检索:工具-方法-实践[M].北京:高等教育出版社, 2004.