搜索优化

2024-05-18

搜索优化(共12篇)

搜索优化 篇1

1 问题重述

在某次大地震中, 为确定需要救助的人员的准确位置, 救灾指挥部紧急派出一支20人的小分队。在紧急情况下需要解决的重要问题是:制定搜索队伍的行进路线, 对预定大小为11 200米×7 200米的矩形区域进行快速的既全面又高效的搜索。已知每个人搜索时的可探测半径为20米, 搜索时平均行进速度为0.6米/秒, 不需搜索而只是行进时, 平均速度为1.2米/秒。

2 问题分析

对于一组搜索队员在特殊形状面积中进行搜索问题, 经实践证明队员同时出发同时到达用时最短。将队伍排成一列, 并将大的矩形区域划分为126个以800米为边长的正方形小区域, 根据图论中的一笔画问题, 探究不同起始点对搜索时间的影响程度, 关键在于队伍的搜索路径的确定。

另外在不影响问题求解的前提下, 为简化问题, 做以下基本假设: (1) 假设搜索区域地面状况不影响搜索速度; (2) 搜救人员发现、汇报、处理问题所需时间不作考虑; (3) 假设搜索必须完全, 不存在遗漏情况。

3 模型建立与求解

3.1 单个人在小方格内的行进路线及所用时间

(1) 情形1, 直线走完

若直线行走完一个40×40小方格 (如图1) , 所用时间:40÷≈66.7s。队伍直线行走时如图1所示。

(2) 情形2, 若遇到转弯

我们有如下两种方案进行搜索。

方案一:如图2, 先横向直走A到C点后, 再斜向扫角到D, 再回到C点。所用时间为:

方案二:如图3, 180°转角直线行走, 搜索原直线沿着AB边向右移动, 当到达CD边时, 整体向上移动, 使得原CD边与DE或BD边重合, 然后DE边继续向左边运动, 搜索遇难人员。所用时间为:t3=40/0.6+40/1.2=100s。

3.2 整个队伍在经过800×800的方格时, 队伍内成员的行进路线及所用时间

情形1, 直线走完:队伍在该方格内直行通过时, 每位队员所用时间为:。

情形2, 需要转弯:队伍在该方格内转弯时, 每位队员的转角方式我们给出以上两种方案, 经分析可知方案一为最佳。但对队伍而言, 只有当内转弯与外转次数相同时, 所有成员才能同时到达, 具体分析如下。最内侧的人转弯用时为tmin=t=43.69s最外侧的人转弯用时为tmax=2× (40×20/0.6+tmin) =0.743 3h。因此, 连续转4次90°弯, 队伍步伐达到一致时间为:t1=2 (tmin+tmax) =1.51h。

3.3 对整个区域进行划分

在一块矩形区域进行全境搜索问题, 在保证全部搜索到的情况下, 使搜索时间最短。我们将20人看成排成一排的整体, 并将大的矩形区域划分为126个以800米为边长的正方形小区域, 把矩形区域划分为如下小块, 并且标号为Ai, 如表。

3.4 建立搜索路线模型

3.4.1 模型一, 固定起点和终点

(1) 队伍并排行走, 以这种转弯方式搜索完整个区域, 以1号格为起点, 126号格为终点, 过程如下图所示:

由图可知整个路线可实现90°转弯16次, 内转外转次数相同, 故队伍同时到达终点。即所用时间为:直线用时t11=40.741h, 转弯用时t12=4t1=6.04h, 总时间为:t11+t12=46.79h。

(2) 以66号为起点, 57号为终点。根据图论中关于奇顶点个数为偶数能不重复走完全程的原理, 判断出所用方格可以用一条不重复的线路走完。

由于出发点在A66处, 设定搜索队首先进入A66区域, 然后在搜索完全部区域后, 最后回到A57, 过程是一笔画成的, 无重复区域。而经上述计算直走用时比转弯用时少, 所以, 转弯次数达到最少, 该问题得到最优解答。

如表1可以看出:矩形中的各个小区域在前后左右有另外的小区域与其相邻 (边界的区域较特殊, 可能某个方向没有相邻的区域) 。把各个小区域看成一个点, 如果要进行一笔画, 则除了开始点A66只有一个出口和结束点A57只有一个入口, 每个点均有两个接口与其他区域连接。故:。

(1) 一个点有上下左右四个方向, 用字母Ai, j表示Ai这个点在j方向上是否与其他点连接, 1为连接, 0为不连接, j=1, 2, 3, 4分别表示上下左右四个方向。

以两个特殊的点为例, 如:A1点, 由于在顶角, 则其上边和左边必定没有连接, 所以, A11=0, A13=0。A114点:由于在下边沿, 则其下边必定没有连接, 所以A114, 2=0, 全面地表示出这些点的特征, 表达式为:

(2) 由于每个点的连接个数只能为2个 (A57A66除外) , 所以

(3) 如果有2个点, 一个点的左边与另一个点连接, 则另一个点的右端必定与该点连接。基于这个原则, 得到如下表达式:

(4) 点A66只有一个出口, 结束点A57只有一个入口, 故:

(5) 为了判定在一个点处是否转弯, 只要判定该点的2个接口是否为上和下, 或者左和右, 当一个为上, 一个为下, 可以说明该点处不转弯;当一个为左, 一个为右, 也可以说明该点处不转弯。用表达式来表示:当Ai, 1×Ai, 2+Ai, 3Ai, 4时, 为不转弯。根据以上 (1) (2) (3) (4) (5) 四点, 可以转化为一个优化问题的求解。

用LINGO编写程序, 可以得到Ai对应的上下左右四个方向是否有连接的数据, 根据数据可以表示出其路线图。为了方便观看, 用线路图表示路线, 如图4所示。

图4所示该路线经过了所有的区域, 一共需要转弯17个。在上述分析可得转弯次数为偶数时可同时到达, 因此在最后一个弯道采用方案三的方式转角用时t23=0.185h, 其余16次转弯所需的时间为t21=4t1=6.04h, 直线行走时间t22=40.7h, 则总共搜索时间为:t21+t22+t23=46.97h。

3.4.2 模型二, 变动起点和终点

4 模型推广与应用

当遇到不规则图形时, 同理将其划分为整支队伍搜索的方格, 不足于的区域进行规则化。由微积分思想可得:根据所剩地面不规则区域面积, 安排相应人数进行区域划分, 其人数的安排由转弯方法三确定, 再根据上述原理安排搜索人数与路径。以上模型可以广泛应用于大规模农业播种收割, 以及广场的大扫除等。

摘要:近来, 由于自然灾害频发并造成较大损失, 地面搜索问题得到了广泛的关注。为确定出最优搜索方案, 以一个队在一已知区域类搜索为研究对象, 通过讨论分析队伍的前进方式, 来提高队伍的搜索效率。其中包括讨论每位队员的转角方式, 以及整个队伍的行进路线, 通过建立0-1模型, 根据一笔画模型思想使用lingo编程求解, 模型可以推广到不规则面积中, 进而应用于一般搜索问题。

关键词:地面搜索,0-1规划,一笔画模型

参考文献

[1]安霞, 刘艳艳, 王福昌.震区地面搜索路线模型[J].廊坊师范学院学报, 2011, 11 (6) , 13-16.

[2]马翠玲.浅谈矩形地面搜索区域搜索路径的优化方案[J].科技资讯学术论坛, 2012, 3.

[3]刘晓妍, 吕濯缨, 高国成.地面搜索路径的”S”式折线模型和螺线模型[J].河南教育学院学报 (自然科学版) , 2011, 20 (1) :7-9.

搜索优化 篇2

【摘要】最有价值的搜索引擎优化诊断工具正是搜索引擎本身!用搜索引擎检验网站的搜索引擎优化状况是最直接、最有效的方式,因为搜索检索结果可以带给我们大量有价值的信息!通过搜索引擎检索结果的分析,是研究网站搜索引擎优化状况的有效方法之一,

搜索引擎优化是搜索引擎营销的组成部分,搜索引擎优化现在受到很大关注,因此如何了解和评估一个网站的搜索引擎优化状况也就成了一个热门的话题,相应地,那些用来检验网站搜索引擎优化状况的各种“搜索引擎优化工具”也成为被关注的对象。现在出现了多种搜索引擎优化工具,其主要功能包括:检查网站链接数量、网站被搜索引擎收录网页数量、网站的PR值等等。但实际上,任何一种搜索引擎优化工具都不能完全反映所有的搜索引擎优化问题,只能在一定范围内反映出某些指标的状况,这是因为每个搜索引擎对网页的索引和排名算法不同,而且搜索引擎的算法也不不断变化之中。那么,什么样的搜索引擎优化工具才最有效呢?

作为搜索引擎优化工具的搜索引擎有哪些作用?

以下我们以搜索引擎google为例,通过google,至少可以获得一个网站搜索引擎优化相关的如下基本问题:

(1)有多少个网页被google收录;

(2)在被收录的网页中,有多大比例属于低质量网页(网页质量低的最主要原因包括:(1)网页标题中的关键词与网页内容中的关键词相关性不强;(2)网站目录层次结构不合理,使得搜索引擎难以判断网页所属的栏目层次;(3)复制的网页,即同样内容的网页出现在超过一个目录之下;(4)明显与网站主题内容(网站核心关键词)不相关的网页内容等,

这些网页很容易被视为低质量网页,无论动态网页还是静态网页,这些现象都是存在的,其中尤其以动态网页比较明显。);

(3)被搜索引擎认为是低质量网页的原因(通过逐个分析或者抽样分析来判断);

(4)网站被多少个外部网站链接,以及这些链接的URL;(这样的友情链接有意义吗?)

(5)在用设定的关键词进行检索时,某个网站在搜索结果中的排名状况如何;

(6)在用同一关键词检索时,同行中竞争者的网站的表现如何;

(7)通过对竞争者和行业领先者的网站在搜索引擎检索结果中的表现,获得竞争者和行业领先者的搜索引擎优化状况;

(8)通过检索结果中的摘要信息判断搜索引擎收录网页的原则和规律。

……

如果对某些类别网站进行长期跟踪,并且与网站访问统计分析数据,以及其他第三方数据相结合分析(如alexa全球网站排名系统提供的相关信息等),还可以发现更多有价值的信息,例如:哪些网站的排名不断靠前,这些网站的特点是什么?在利用某些关键词检索时排名靠前的网站中,哪些是利用自然优化而获得的效果,哪些是垃圾SEO(垃圾SEO的定义和说明)作弊形成的?在某个阶段排名不断前移的网站中,访问量是否也得到相应的增长?……

有待商榷的搜索引擎优化 篇3

Wendy: Thanks, Vern. As you all know, Delcom has decided to throw a lot of 1)green into internet marketing. We’re here today to 2)brainstorm ways to increase internet traffic to their various sites and hopefully expand their target base. So everyone put their thinking caps on and let’s get to it. Ideas?

Fran: Why don’t we take a look at SEO?

Vernon: SEO?

Wendy: Search engine optimization.

Fran: Right.

弗农:好了,大家伙,是不是每个人都准备好了?好的。温迪,何不从你开始呢?温迪:谢谢,弗恩。正如你们都知道的,Delcom公司已经决定在网络营销上投入大量资金。我们今天在这里来集体讨论为他们的网站增加数据流量的方法,希望藉此来扩展他们的目标市场。那么大家都好好想一想,然后我们就开始着手准备。有什么想法吗?

弗兰:我们为何不考虑看看SEO?

弗农:SEO?

温迪:搜索引擎优化。

弗兰:没错。

Vernon: I’m not quite with you.

Wendy: Go ahead, Fran. ②Give him the basics.

Fran: Basically the concept revolves around figuring out how search engines work, what people search for, which search engines are the most popular, and what terms or keywords are used most often. Then we put two and two together and try to optimize a company’s website to meet those criteria.

Vernon: I’m still not clear on how this benefits anyone.

Fran: Ah, sorry. The point is this: the higher and more frequently a website shows up in the search results, the more traffic that site will get from search engine users.

Vernon: This sounds like it has a lot of promise.

Wendy: ③The only problem is that it hasn’t got a snowball’s chance in hell in the American market.

Vernon: What? Why?

Fran: Wendy’s got a point. What with Google having something 3)akin to a 4)monopoly over there, ④this kind of marketing is just walking the green mile.

Vernon: How so?

Wendy: Google personalises search results now.

Vernon: Ah. And there’s no point discussing how a site is ranked if the ranking is potentially different for every user. Wendy: Bingo.

Vernon: ⑤So SEO is essentially pushing up the daisies? Fran: In the US market, yes. But Google hasn’t cornered the market in China yet, and I believe we could still utilize SEO to our advantage.

Vernon: Wendy, you’re the expert here. Do you want to add your two cents?

Wendy: I think Fran may have something. ⑥But let’s take this nice and easy so that this doesn’t turn into a poisoned 5)chalice.

Fran: I’ll get a team to look into whether it’s even a 6)viable option.

Wendy: Perfect. Alright, next on the agenda…

弗农:我不太明白你的意思。

温迪:继续说说看,弗兰,给他“科普”一下。

弗农:总的来说,这个概念围绕搜索引擎如何工作,人们上网搜索什么,哪种搜索引擎最受欢迎,以及什么样的短语或者关键词最常用为主要内容。然后我们据此推理,努力优化一家公司的网站,就能达到(Delcom公司的)那些标准了。

弗农:我仍然不是很清楚这如何从中获利。

弗兰:啊,对不起。问题的关键是这个:一家网站在搜索结果里出现得(排位)越高、(次数)越频繁,这家网站从搜索引擎用户那里得到的流量就越多。

弗农:这听起来似乎很有前景。

温迪:唯一的问题是这在美国市场根本不可能发生。

弗农:什么?为何呢?

弗兰:温迪说的有道理。因为谷歌在(美国)那里有些类似垄断着,所以这种营销手法只会是死路一条。

弗农:怎么会呢?

温迪:谷歌现在将搜索结果个性化了。

弗农:哈。那么就没有意义去讨论一个网站的排名怎样了,如果排名对每位用户来说都可能不同的话。

温迪:对极了!

弗农:那么SEO根本就是行不通的?

弗兰:对美国市场来说,是这样。但是谷歌还没有垄断中国市场,因此我相信我们还是可以利用SEO来达到我们的目标。

弗农:温迪,你是这里的专家。你想说说你的意见吗?

温迪:我认为弗兰说的有些道理。但是让我们慢慢来,这样它才不会变成圣杯里盛着的毒酒。

弗兰:我会让一个组去调查一下这是否是一个可行的选择。

温迪:很好!好吧,接下来讨论一下议程……

Smart Sentences

① Wendy, why don’t you get the ball rolling?温迪,何不从你开始呢?

get / set the ball rolling: get a process started, begin sth.(开始某项活动)。例如:

We’ve been trying to get the ball rolling on the construction of a new playground.

我们一直努力想启动新操场的施工。

② Give him the basics. 给他“科普”一下。

give sb. the basics: give sb. the basic training(让某人学点初级知识)。例如:

As part of the training, Leslie will give you the basics on how papers are made.

作为培训的部分内容之一,莱斯利会把制纸的基础知识告诉你们。

③ The only problem is that it hasn’t got a snowball’s chance in hell in the American market. 唯一的问题是这在美国市场根本不可能发生。

not get a snowball’s chance in hell: sth. impossible, sth. that will never happen, always used negatively(不可能的事,常以否定形式出现)。例如:

With those sales figures, she hasn’t a snowball’s chance in hell of getting a bonus.

她的那些销售数字根本不可能让她得到奖金。

④ This kind of marketing is just walking the green mile. 这种营销手法只会是死路一条。

walk the green mile: head towards the inevitable(走向灭亡)。例如:

Few people would agree that radio is walking the green mile.

很少人会认为收音机正在消亡。

⑤ So SEO is essentially pushing up the daisies? 那么SEO根本就是行不通的?

push up (the) daisies: dead and buried(葬在地下)。例如:

I believe that letter writing is pushing up the daisies, as people are using telephone, email, social media, etc.

我觉得写信已经成为历史,因为大家都在用电话、电子邮件和社交网络等等。

⑥ But let’s take this nice and easy so that this doesn’t turn into a poisoned chalice. 但是让我们慢慢来,这样它才不会变成圣杯里盛着的毒酒。

poisoned chalice: an apparently very attractive opportunity, but one that will lead to failure(金杯毒酒,看似诱人实为有害的事物)。例如:

搜索引擎优化技术研究 篇4

随着互联网的发展, 网络已成为我们生活和工作的重要组成部分, 网民数量急剧增加, 网络资源丰富多样。对于开发人员而言, 增加网站的访问量、获得客户资源, 是建设网站尤其是企业类网站的初衷。事实表明, 一个设计优秀的网站, 用户对网站的访问量上有六到八成的访问是通过搜索引擎自然检索而访问的。每个企业都想将自己的产品在搜索引擎中排在同类产品的前面, 以便更多的潜在客户点击访问。通过各种方法对网站的搜索引擎优化可以使得网站的自然排名提前。

2 搜索引擎的定义 (Definition of search engine)

搜索引擎是一个对互联网上的信息资源进行搜索整理[1,2], 对数以亿计的网页中的每一个文字 (即关键词) 进行索引, 建立索引数据库, 提供用户查询的系统。当用户在搜索引擎中输入某个关键词进行探索时, 搜索引擎通过复杂的算法分析, 将包含了用户输入的关键词的网页都搜索出来。将这些搜索出来的网页按照一定的顺序依次排列。当用户需要通过网络了解某一方面的信息时, 只需要在搜索引擎中输入自己需要查找的内容, 搜索引擎就可以方便的帮用户搜索到结果, 而且搜索引擎也为信息提供者提供了一种高效的发布途径。常用的搜索系统有谷哥 (Google) 、百度 (Baidu) 、雅虎 (Yooho) 等。

搜索引擎通过探测器在互联网上抓取网页, 并对这些网页进行存储、分类、整理、压缩, 再根据搜索引擎的算法对网页进行编目与索引, 并在这个过程中对网站进行质量评估, 将有价值的网页进行索引, 质量差的网页排除。当用户通过搜索引擎进行搜索时, 搜索引擎根据一定的标准将搜索到的结果显示给用户, 在搜索结果的排名中, 搜索引擎会最有价值的推荐在首位, 较次的排在其他, 以此类推。

3 搜索引擎优化的定义 (Definition of search engineoptimization)

搜索引擎优化, 又称为SEO, 即Search EngineOptimization, 它是一种通过分析搜索引擎的排名规律, 了解各种搜索引擎怎样进行搜索、怎样抓取互联网页面、怎样确定特定关键词的搜索结果排名的技术。搜索引擎采用易于被搜索引用的手段, 对网站进行有针对性的优化, 提高网站在搜索引擎中的自然排名, 吸引更多的用户访问网站, 提高网站的访问量, 提高网站的销售能力和宣传能力, 从而提升网站的品牌效应。可以简单的将搜索引擎优化理解为一种让某产品或某服务在百度、谷歌、雅虎等搜索引擎中获得良好的排名而赢得更多的潜在客户的技术, 它是进行网站推广、提高网站排名的重要手段之一。

搜索引擎优化公式:SEO=∫CLOCK=∫C1+L2+K3+O4, 其中, ∫是一个积分符号, C=content (内容) , L=link (链接) , K=keywords (关键字) , O=others (其他因素) , 数字表示重要程度。因此, SEO就是一个长期的对“时间”积分的过程, 内容是首要核心, 其次是合理、有效、丰富的内部链接和PR值高的外部链接。PR (PageRank) 值是用来标识网页的等级和重要性, 是搜索引擎排名运算法则 (排名公式) 的一部分。PR分1-10个等级, PR值检查链接该网站的网站个数以及链接该网站的网站是否优秀, 这个值越高说明网站越重要, 在搜索排名中就会靠前。另外关键字是影响网站自然排名的第三个因素。影响搜索引擎自然排名的因素还包括域名、网站架构、服务器、排版等其他因素的影响, 因而对搜索引擎的优化设计是多方面的。

4 搜索引擎优化技术 (Search engine optimizationtechnology)

搜索引擎加强了企业与客户的沟通, 搜索引擎的优化技术有以下几个方面:

4.1 主题要明确, 内容要丰富

在设计制作网站之前, 要清晰设定网络的主题、用途和内容。根据不同的用途来定位网站特性, 可以是销售平台也可以是宣传网站, 网站主题须明确突出, 内容丰富饱满, 以符合用户体验为原则。对于一个网站来说, 优化网站的主题与实际内容才是最为重要的。一个网站需要有鲜明的主题, 丰富的与主题相关的内容, 专注于某些领域的变化的, 及时更新。

4.2 引出链接要人气化

搜索引擎判断网站的好坏的一个标准是外部链接的多少以及所链接的网站质量。创建有人气化的、有意义的引出链接, 提高链接广泛度, 既能提高在搜索引擎的排名, 同时也可以起到互相宣传的作用。研究表明:当一个网站的链接PR值达到4-6, 那么这个网页的访问量比较好;当链接PR值达到7以上, 那么网站的质量与知名度都很优秀了。如果一个网页被其他网页链接得越多, 那么该网页越有可能有最新和最有价值的高质量网页。

尽可能增加与行业网站、地区商务平台和合作伙伴网站之间的链接, 被PR高的网站引用能更快地提高本站的PR, 同时开发人员可以在访问量较大、PR值较高网站上发表与网站主题以及业务相关的信息, 用户在别的网站看到这些信息, 进而访问该网站, 即通过外部链接来提高该网站的访问量。

4.3 关键词设定要突出

网站的关键词非常重要, 它决定网站是否能被用户搜索到, 因此在关键词的选择上要特意注意。关键词的选择必须突出, 遵循一定的原则, 如:关键词要与网站主题相关, 不要一味的追求热门词汇;避免使用含义很广的一般性词汇;根据产品的种类及特性, 尽可能选取具体的词;选取人们在使用搜索引擎时常用到与网站所需推广的产品及服务相关的词。5至10个关键词数量是比较适中的, 密度可为2%—8%。要重视在标题 (Page Title) 、段落标题 (Heading) 这两个网页中最重要最显眼的位置体现关键词, 还须在网页内容、图片的alt属性、META标签等网页描述上均可不同的程度设置突出关键词。

4.4 网站架构层次要清晰

网站结构上尽量避免采用框架结构, 导航条尽量不使用FLASH按钮[3]。首先要重视网站首页的设计, 因为网站的首页被搜索引擎检测到的概率要比其他网页大得多。通常要将网站的首页文件放在网站的根目录下, 因为根目录下的检索速度最快。其次要注意网站的层次 (即子目录) 不宜太多, 一级目录不超过两个层次, 详细目录也不要超过四个层次。最后, 网站的导航尽量使用纯文字进行导航, 因为文本要比图片表达的信息更多。

4.5 页面容量要合理化

网页分为静态网页与动态网页两种, 动态网页即具有交互功能的网页, 也就是通过数据库搜索返回数据, 这样搜索引擎在搜索时所费的时间较长, 而且一旦数据库中的内容更新, 搜索引擎抓取的数据也不再准确, 所以搜索引擎很少收录动态网页, 排名结果也不好。而静态网页不具备交互功能, 即单纯的信息介绍, 搜索引擎搜索时所费时间短, 而且准确, 所以愿意收录, 排名结果比较好。所以网站要尽量使用静态网页, 减少使用动态网页。

网页容量越小显示速度越快, 对搜索引擎蜘蛛程序的友好度越高, 因而在制作网页的时候要尽量精简HTML代码, 通常网页容量不超过15kB。网页中的Java.script和CSS尽可能和网页分离。应该鼓励遵循W3C的规范使用, 更规范的XHTML和XML作为显示格式。

4.6 网站导航要清晰化

搜素引擎是通过专有的蜘蛛程序来查找出每一个网页上的HTML代码, 当网页上有链接时就逐个搜索, 直到没有指向任何页面的链接。蜘蛛程序需要访问完所有的页面需要花费很长的时间, 所以网站的导航需要便于蜘蛛程序进行索引收录。可根据自己的网站结构, 制作网站地图simemap.html, 在网页地图中列出网站所有子栏目的链接, 并将网站中所有的文件放在网站的根目录下。网站地图可增加搜索引擎友好度, 可让蜘蛛程序快速访问整个站点上的所有网页和栏目。

4.7 网站发布要更新

为了更好的实现与搜索引擎对话, 将经过优化的企业网站主动提交到各搜索引擎, 让其免费收录, 争取较好的自然排名[4]。一个网站如果能够进行有规律的更新, 那么搜索引擎更容易收录。因而合理的更新网站也是搜索引擎优化的一个重要方法。

5 结论 (Conclusion)

企业网站为了提高在电子商务中的竞争力会使用很多网络推广的方法, 针对不同的搜索引擎进行合理的搜索引擎优化是网站维护中的重要工作。在搜索引擎中会经常更新对网站排名的规则, 而规则的改变也会影响到网站的排名, 使得网站的排名发生变化。所以在网站的维护中应该根据搜索引擎排名算法的变化而更新自己网站的搜索引擎优化, 以适应变化。

参考文献

[1]Bing Liu, 著.俞勇, 等, 译.WEB数据挖掘[M].北京:清华大学出版社, 2009.

[2]赖雯雯.浅议电子商务网站的搜索引擎优化[J].科技创新导报, 2011, 21:21.

[3]刘芳.电子商务网站营销初探[J].中小企业管理与科技, 2011, 24:282.

搜索优化 篇5

搜索引擎优化及其表现

所谓搜索引擎优化,也就是针对各种搜索引擎的检索特点,让网站建设和网贞设计的基本要素符合搜索引擎的检索原则(即搜索引擎友好),从而获得搜索引擎收录并在检索结果中排名靠前。如对于基于META标签检索的搜索引擎,在META标签中设置有效的关键词和网站描述,对于以网页内容相关性为主的蜘蛛型搜索引擎,则通过在网页中增加关键词的密度,或者专门为搜索引擎设计一个便丁检索的页面.

一个搜索引擎友好的网站,依靠适合搜索引擎的方式来设计网站,注重每个细节问题的专业性,以真实的信息和有效的表达方式赢得搜索引擎的青睬,方便搜索引擎检索信息.并且返回的检索信息让用户看起来有吸引力,从而获得更好的搜索引擎营销效果,达到搜索引擎营销的目的。搜索引擎优化可以从以下几个方面进行考虑。

(1)为每个网页设置一个相关的主题

网页标题中的关键词在搜索引擎排名中具有重要的作用,如两个同时做DVD的厂家都建立有自己的网站,都在相同的网站上注册了,可是一个厂家网站的搜索排名却比另外一家靠前多了。原因是那个排名靠后的厂家把自己网站上所有网页的标题都设为厂家的名称,而另一家在标题中加上了DVD关键词。其实当用户用某种商品名进行搜索时,关心的首要问题是商品,而不是厂家。因此,在设计网页的标题时,尽量体现网页中的核心词汇,这些桉新词汇应该是有较大被检索可能的,而不是一些冷僻同汇,也不是一些太常见的词汇。

(2)尽量使用静态网页

目前能够像Google一样对动态网页进行索引的搜索引擎还比较少,而同样内容的动态网页其权重比静态网页要低很多。因此,无论从效率上讲还是方便搜索引擎收录,使用内容发布系统将网站内容发布成静态网页都是非常必要的。搜索引擎对动态URL不太友好。如动态网页的常见形式以“php”后缀,而静态网页往往以“thml”或“htm”结尾,静态的URL通常在搜索引擎结果页面上能获得更好的排名,

(3)在网页中以文字为主

目前搜索引擎只分析HTML页面里头的文字(动态页面如ASP,PHP也行,不过优先级会比较低),尽管flash动画内容比起一般的文字加图片的HTML.网页有更好的视觉效果和艺术效果,但纯粹的flash网站里头的文字很难被一般的搜索引擎捕捉到。虽然6月20日,G00me和Adobe公司共同宣布了一套新的算法,力求能充分抓取到flash的内容,但至今还有很多需要解决的问题。

(4)重视外部网站链接的数量和质量

被外部网站链接的数量称为“链接广度”,它是影响网站排名的一个重要指标。在注重外部链接数量的同时,更要重视外部链接的质量。经验表明,对于新网站有一种有效的获得高质量链接的方法,就是在付费分类目录中登记网站,并且优先登录分类目录,等到获得收录后再向机器手搜索引擎提交,因为主要搜索引擎的分类目录的链接通常可以作为链接广度来计算。被已经登录于搜索引擎的网络链接,对于新网站来说,另外一个价值在于:即使没有主动向搜索引擎提交网站,搜索引擎也会根据原有网站的链接路径来发现这个新网站。

(5)为搜索引擎访问网站提供方便

当有用户开始搜索时,搜索引擎的机器手要到网站上发现有价值的网页,要到每个网页检索有效的关键词,但这些信息有时并不一定能被机器手顺利发现,因此,为搜索引擎提供方便是提高网页被搜索机会的有效方法。为此,需要专门设计一个名为simemap.htm的网页,存放在网站的根目录下,称为“网站地图”,在这个网页中列出网站所有子栏目的链接。

为搜索引擎提供方便,最终也是为网络营销提供方便,我们总是希望搜索引擎能够方便地检索整个网站的所有网页,并发现我们所希望被检索的所有关键词。这是设计“网站地图”网页的基本原则。

(6)正确处理各种关键词的优化关系

浅议高职院校网站搜索引擎的优化 篇6

一、高职院校网站的功能

随着国内高职规模扩张格局的逐步到位,综合势力竞争态势的日益激烈,各高校对高职教育内涵建设的挖潜就成为了培植核心竞争力的重要途径,因此各大高校在强化对双证书制度、工学交替方式、产学研结合、双师队伍建设等方面的同时,急需一个平台来展示其高职教育模式的探索成果,招生就业的各种举措,从而被社会认同和推崇。整体来说高职院校网站具有如下三项主要功能:

1.窗口功能。通过极富职业教育特色的招生、教学、科研、就业等频道来向社会传递学校的内部信息,推介高职教育的进展和优势,从而展示对高职教育模式的探索和教学成果。这是高职院校网站的最重要的功能之一。

2.纽带功能。网络时代的到来使得沟通变得更为全面和自由,通过高职院校网站这一纽带链接起职业教育的多个参与者:考生、学校、家长、学生、教师、学者、用人单位等,使他们通过网站消除信息的落差。达到某些默契和谅解,从而更好地促进产、学、研、教等各方面互动。

3.引导功能。信息系统的建设强化了网站平台的功能,教务管理系统引导教、学两条线的正常运作;学生工作管理系统引导德育、个性塑造方面的进行;OA办公系统引导学校各部门的高效运转;图书系统、科研系统、学籍管理系统各司其职,引导校园内外各种信息的健康沟通与良性渗透。

二、搜索引擎优化含义及其对高职院校网站的推广作用

搜索引擎,英文为Search Engine,是一个对互联网信息资源进行搜索、整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。自1990面世以来先后经历了分类时代、数据库时代、关键词时代、全文搜索时代,由于其数据的博大、界面的友好、信息整理的科学、结果搜索和反馈的高效,使得无序的网络迅速进入了搜索时代。2007年7月发表的第20次中国互联网络发展状况统计报告显示:74.8%的网民在使用搜索引擎服务,仅比第一大服务项目网页浏览少2个百分点。随着搜索引擎使用频率的提高、网民对其依赖性的增强,对搜索结果呈现的方式和次序变得日益敏感,从而诞生了搜索引擎优化技术。

搜索引擎优化(search engine optimization,简称seo)。指遵循搜索引擎的搜索原理,对网站结构、网页文字语言和站点间互动交换链接等进行合理规划部署,以改善网站在搜索引擎的搜索表现,进而增加客户发现并访问网站的可能性的这样一个过程。具体表现为:通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网站结构、网页链接、标签与内容进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力。经过近十年的发展,S EO逐步形成了站内网站推广和站外链接推广两种方式,并在优化过程中秉承如下三个原则:

1.搜索引擎收录原则,严格遵从搜索引擎蜘蛛(googlebot,baiduspi-der,yahooslurp)超文本链接索引规则。即外部链接引导索引与直接提交网址给搜索引擎。拒绝收录色情、赌博等非法类内容。

2.搜索引擎排名原则(网站内部因素+网站外部因素)(1)网站内部因素,包括网站结构优化与网页内容优化及关键词优化;(2)网站外部因素。

3.严禁抵触搜索引擎降权原则(SEO作弊手段)包括关键词堆砌、虚假关键词、隐形文本/链接、偷换网页、复制站点或内容、桥页/门页、隐形页面、垃圾链接、链向作弊网页。

依托搜索引擎优化技术,将高职院校网站从内容到框架进行处理,使得其对搜索引擎更具亲和力和吸引力,将有利于网站在搜索结果排名中的位置,从而更好地实现对高职院校网站的推广,使得高职院校网站的窗口、纽带、引导功能得到更大的发挥,进而推广高职院校内涵建设中的成果,从总体上面促进整个高职教育全体的发展。

三、高职院校网站进行搜索引擎优化的方法

1.网站内容的优化。第一,对于网站来说带给访问用户最重要的信息就是网站的相关内容,每位访问用户都意味着是—位对高职教育的关切和支持者;用户进入你的网站就是为了寻找信息,而只有找到他所需的信息才会停留在你的站点上。所以,经常更新并丰富校园网站的相关内容,让访问用户和搜索引擎“蜘蛛”感觉这是一个很有“生气”的网站。第二,加强网站内容的可读性。可读性差的网站很容易失去访问用户的兴趣,从而会大大降低用户在网站上的浏览时间。可读性差通常是由于静态图片等不被蜘蛛识别的格式太多,字体较小、颜色搭配单一、句子冗繁、背景图片重复及不恰当的标题所致。所以,高职院校网站要尽力避免使用静态的重复的图片作为背景图片;合理使用恰当的网页标题,合理安排链接;保持网页内容融会贯通,并保证要点清晰突出。第三,确保网站及相关内容保持良好的下载速度。保证站内所有链接可以在短时内完全下载完毕。从而利用畅通留住和吸引新的访问者。

2.网站结构优化。第一,使用文本浏览器来检查网站,使得网站结构对搜索引擎更具亲和力。因为绝大多数的搜索“蜘蛛”察看网站的方式与文本浏览非常相似。如果像Javascript,cookies,session IDs,frames.DHTML或者flash 这样的特性使你的网站在文本浏览器中显示不正常的话,那么搜索蜘蛛在抓取网站内容时也会碰到相同的困难。第二,登陆Google提交网站的SiteMap文件。在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于Google网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括连接地址、更新时间、更新频率和索引优先权。第三,网站文件名优化。由于绝大部分搜索蜘蛛的英文化,因此网站文件名最好用英文,并且尽量包含英文关键词,这样有利搜索引擎“蜘蛛”对相关搜索的页面抓取。

3.网站页面优化。第一,首页优化。首页对一个网站很重要,在首页的设计上原则上严禁纯图片或者FLASH动画。并且尽量地直接进入主界面,在主界面上提供友好的分类和相关地图。高职院校网站通常要陈列校名、相关就业、招生、学科、科研等相关链接。第二,图片优化。目前,大多搜索引擎都有了图片搜索功能,但主要是通过注释词来体现,因此我们可以适当地添加一些新闻图片,但得想法添加如职业教育、职教之类的包含有关键词的注释,这样使得文字和图片蜘蛛都能双重收集。

4.网站标签的优化。对于网页标签的优化,主要遵循如下途径:首先确保每张页面都拥有title,并尽量使每个页面的title各不相同,在title中准确表达该页面的主要内容,如首页title可以为“某某高职院校”,部门页面title为“某某高职院校一某某部门或院系”;其次是页面的meta标签尽量描述清楚关键字、词和网站描述,不要随意堆放不相关的关键词;第三为每一个链接标签link尽量加上注释,注释词可为链接的文字本身或相关关键词。

5.网站关键词优化。第一,如何确定网站的关键词。网站关键词的选择很大程度上取决于学院的定位。核心关键词通常限定在七个以内。在关键词的选择上,可分三个方面进行:首先是学院名称,其次是职教类别,最后是行业简称。如:广东轻工职业技术学院网站,其核心关键词应该是:广东轻院、职业技术教育、轻工职业技术教育、轻工业、广东。第二,如何确定网站的关键字密度。关键字密度(Keyword Density)是指在一个页面中,关键字(keyword)或关键字段(keyphrase)占所有该页面中总的文字的比例,该指标对搜索引擎的优化起到关键的作用。为自然提高在搜索引擎中的排名位置,您网站中页面的关键字密度不能过高,也不要过低,一般在2%到8%较为合适。如果要达到2%的比例,那么您在平均100个文字中最好包含2个关键字或关键字段,如果在1000个文字中仅仅只包含1-2个关键字或关键字段,那么关键字密度就被稀释了。因此坚决拒绝关键字或关键字段的堆积。

网络主题搜索策略优化研究 篇7

1 关键词优化

随机取一篇网页的源文件(例如通过浏览器的“查看源文件”功能),可以看到其中的情况纷乱繁杂。除了从浏览器中能够正常看到的文字内容外,还有大量的HTML标记。根据天网统计,网页文档源文件的大小(字节量)通常大约是其中内容大小的4倍。另外,由于HTML文档产生来源的多样性,许多网页在内容上比较随意,不仅文字不讲究规范、完整,而且还可能包含许多和主要内容无关的信息(例如广告、导航条、版权说明等)。

关键字、关键词和关键短语是Web站点在搜索引擎结果页面(也称为SERP)上排序所依据的词。根据站点受众的不同,可以选择一个单词、多个单词的组合或整个短语。为简化起见,本文将使用关键词这个术语表示以上三种类型。有关关键词的重要概念有关键词位置和关键词密度。关键词位置是指关键词出现在页面文件的哪个部分及先后顺序,这对网页出现在SERP页面中排名影响近来逐步降低。关键词密度(Keyword Density)也叫关键词频率(Keyword Frequency),所阐述的实质上是同一个概念,它是用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示。相对于页面总字数而言,关键词出现的频率越高,那么关键词密度也就越大。简单地举个例子,如果某个网页共有100个词,而关键词在其中出现5次,则可以说关键词密度为5%。

关键词的优化对整个网络主题的搜索起到重要作用,以下是一些基本策略:

(1)通过数据挖掘算法,尽可能找出与关键词相关的词,除了找出主题直接相关的词,也要找出与其相联系的词

(2)要多对社会行为习惯做研究,从用户的角度出发,找出符合现时流行的相关关键词,使得找到的关键词符合社会习惯。

(3)除了给出与主题相关的通用性词汇外,还要紧密结合关键词相关的专业领域,提出专业术语词汇。

(4)不要用意义太平凡的词。为了准确找到需要的信息,搜索用户倾向使用具体词汇及组合寻找信息(尤其是二词组合),而不是使用那些大而泛的概念。此外,使用意义太泛的关键词,也意味着更多的网络信息呈现,难以精准选择。

2 搜索引擎优化

主题相关的关键词优化完成后,就是如何利用关键词进行搜索,这个主要由搜索引擎来完成。搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。搜索引擎主要有以下搜索方式:全文索引、目录索引元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎等。

所谓搜索引擎优化(Search Engine Optimization,SEO),也就是根据上述搜索方式,使得站点和网页设计的方式方法适合该类搜索引擎的主题搜索原则(即搜索引擎友好),从而得到搜索引擎的收录并在用户的检索结果中排名靠前。目前不少SEO设计者对此理解过于狭隘,于是出现了SEO行业为了争夺首页有限的10个排名而各使奇招的现象,但是笔者认为SEO搜索引擎优化的最终目的不是网站排名靠前,而是良好的用户体验,这也是SEO的生存之道。结合个人体会,主要有以下的优化策略:

(1)了解域名对SEO影响有多大。从实践中会发现,域名对于网站的排名的影响很微小,但也并不能忽略不计,选择常用的域名应该按com-net-cn-com.cn次序。

(2)理解SEO中最重要的是什么。搜索引擎的发展应该更偏向于对内容相关性、专业性的考核和判断,更注重网站内容的原创性和时效性。所以,SEO最重要的就是做关键词分析、关键词定位、网站内容编辑和部署。

(3)领会搜索引擎收录站点的依据。一般情况,网站正常,不违规的站点都是会被收录的。不收录往往是站点本身的问题,比如全站采集、SEO作弊等。虽然某些作弊的方式可以在短时间内快速提高排名,但这种做法最直接的后果就是网站被封,导致整个SEO行业恶性发展,用户将因为搜索体验变差而对SEO行业产生反感。所以SEO没有捷径,努力更新网站,写软文是必要的。

(4)学习SEO该从哪里开始。简单的代码可以看懂基本就可以做SEO。一般新手应该采用开源的网站程序,自己做几个小站,学会基本的SEO操作方式如:关键词定位、关键词分析、标签书写等等。三个月下来观察自己站点在搜索引擎的表现,总结经验发现问题,基本可以对SEO把握五分。

(5)搜索引擎收录一个网站大概需要的时间。其实这个问题只能说个大概,笔者做的网站正常都是一个月以内,有的更快,只要一天。这其中需要做多发外链。

SEO是未来网络营销最重要的部分,因为它确实可以帮助网站优化,这种优化方便各种使用者,行业前景看好。目前情况下,大型网站如B2B行业网站、B2C电子商务网站的SEO需求比较旺盛。相对于企业网站,大型网站对SEO的投资回报率更高。

3 网页评分策略

搜索引擎利用关键词在各类网页中进行搜索,实际上就是对各种网页进行操作,面对浩如烟海的网页,如何提高命中率和节省时间,这是个值得研究的问题。关于对网页的优化主要是通过网页引用计数和网页等级评分来实施的。

3.1 引用计数(Hit number)

搜索系统的搜索器在搜集网页的时候,在任何一个网页数据库中都有一个引用该网页的其他网页的总数,这个数称为命中数(Hit Number)。系统搜集器每当搜索到一个新的网页时,就会逐一检查这个网页的所有引用链接,如果发现这些链接里面存在指向已经访问过的网页,那么这个已经访问过的网页的Hit Number将会被自动地加1。由上分析可见,当搜索器已经搜索过的网页数量足够大的时候(极限情况是整个网络),Hit Number也就越大,这就表示该网页被其他网页引用得越多,因此根据引用计数评估这个网页的重要程度。该类网页无论是在搜索器搜索网页方面,还是在检索器最后给用户返回结果方面,都应该放在优先排名和处理的位置。

但是,如果只是比较两个网页各自的引用计数,有时候并不能评估出这两个网页谁更重要。例如存在两个网页,它们在互联网上都只是被引用了一次。其中一个网页是显示了一份已经过期的personal resume,该网页被一个求职网站所拥用,除了求职者本人外可能没有其他人关注;另一个网页显示的是当日发生的重大国内新闻,被雅虎网站所引用,无时无刻不被世界各地操持不同语言的数以千万计的人浏览。这时就不能根据两个网页的引用计数是一样(都是1),就得出两个网页在互联网上同等重要的结论。

根据以上分析,在评估网页的重要性时,需要找到更加深入的指标来评估网页的重要性,这就是下节用到的网页评分。

3.2 网页评分

搜索引擎搜索到一个网页被另一个网页链接的时候,并不只是简单地将被链接的网页的Hit Number值加1,而是将链接该网页的链接数作为权值,同时将该链接网页的重要程度也考虑进来,就可以得到改进后的网页评分。最早提出网页评分的计算算法的是Google。通过研究和实践的总结,Google的排名运算法则主要使用了两个部分,第一个部分是它的文字内容匹配系统。Google使用该系统来发现与搜索者键入的搜索词相关的网页;第二部分也是排名运算法则中最最重要的部分,就是Google的专利网页级别技术—Pagerank的作用。从上述可以得知,Google对不同网站首页的评价方式,其实,同一个网站的页面评价也是不一样的。首先,首页的权重是大于一级页面的,一级页面的权重相对地大于二级页面的,以此类推。当然,也有个别的例子存在,那就是首页的图片过多,或者结构不够好的话,文字比较多的一级页面的权重高了。因为Google是按照从首页进行抓取的,依次到二级三级页面上,所以,如果首页的页面的信息无法被搜索引擎识别的话,那么Google就依次到二级页面或者更下的页面进行爬行。一般的网站还是首页的权重相对地占据优势的。

4 结语

主题搜索策略优化是一个较复杂的问题,在此只是对其相关的基本策略进行了研究,有关权威网页、中心网页以及网页链接优化等问题还需进一步研究,通过综合运用不同主题搜索优化策略可以达到主题搜索的准确、快速。

摘要:针对日新月异的互联网的发展特点,分析了网络主题搜索的基本概念和策略,重点对关键词及其权值的配置策略、搜索引擎的优化方法和网页的评分机制等进行了研究,对网络主题的搜索策略的优化会有一定借鉴作用。

关键词:主题搜索,策略,关键词,搜索引擎,网页评分,优化

参考文献

[1]Danny Sullivan.Fifth Annual Search Engine Meeting Report,Boston,MA,Apr.2000.

[2]CNNIC.中国互联网络发展状况统计报告.北京:2001,1.

[3]雷鸣,王建勇,赵江华,单松巍,陈葆珏.第三代搜索引擎与天网二期.北大学报,2000.

[4]北京大学计算机系网络与分布式实验室.天网中英文搜索引擎概要设计书,2000:4-8.

搜索引擎排序技术的优化 篇8

随着互联网的不断发展和日益普及, 网上的信息量在爆炸性的增长。当用户大致上知道自己要关心的内容, 但不清楚哪里能够找到相关信息 (即不知道哪些URL能给出这样的信息) 的时候, 搜索引擎能够为用户提供一个相关内容的网址及其摘要的列表, 由用户一个个试探看是否为自己需要的。搜索引擎通常指的是一种在Web上应用的软件系统, 它以一定的策略在Web上搜集和发现信息, 在对信息进行处理和组织后, 为用户提供Web信息查询服务。如下图1, 搜索引擎通常会提供一个网页界面, 让用户向浏览器提交一个词语或者短语q, 然后很快返回一个可能和用户输入内容相关的信息列表L。

这个列表中的每一条目代表一篇网页, 至少有3个元素:标题 (以某种方式得到的网页内容的标题) , URL (该网页对应的“访问地址”) 和摘要 (以某种方式得到的网页内容的摘要) 。通过浏览条目上的这些元素, 用户对相应的网页是否真正包含他所需的信息进行判断。

2 Google采用的Page Rank技术原理

2.1 Page Rank概念

众所周知, 目前Google搜索引擎是现在世界上最流行的搜索引擎, 也是最成功的搜索引擎。Google的排名运算法则主要使用了两个部分, 第一个部分是它的文字内容匹配系统, 也就是网页的相关性。Google使用该系统来发现与搜索者键入的搜索词相关的网页;第二部分也是排名运算法则中最重要的部分, 就是Google的专利网页级别技术 (Page Rank) 。

Google的核心技术称为Page Rank, 即网页级别。Page Rank技术能够快速的计算出网页的级别 (Rank) 。这个级别的依据是:当从网页A连接到网页B时, Google就认为"网页A投了网页B一票"。Google根据网页的得票数评定其重要性。然而, 除了考虑网页得票数 (即链接) 的纯数量之外, Google还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重, 并且有助于提高其他网页的“重要性”。为了得到更好的搜索结果, 尤其是使搜索引擎自动抵制那些基于对详细等级标准页面 (入口页) 内容的分析而自动生成的网页, 链接人气值的概念开始被开发了。因此, 一般地, 如果从其他网页链接到一个网页的数量越多, 那么这个网页就越重要。与链接人气值向比较, Page Rank的概念并不是简单地根据入站链接的总数。

Page Rank的原理类似于科技论文中的引用机制:谁的论文被引用次数多, 谁就是权威。在互联网上, 链接就相当于“引用”, 在B网页中链接了A, 相当于B在谈话时提到了A, 如果在C、D、E、F中都链接了A, 那么说明A网页是最重要的, A网页的Page Rank值也就最高。即越是重要的文件链接一个文件, 则这个文件就越重要, 但那些入站链接并不是被平等计算的。首先, 如果其他高等级的文件连接到它, 那么根据Page Rank的规则, 此文件的等级也高。如此, 在Page Rank概念中, 文件的等级由与它连接那些文件的等级决定的。它们的等级再由与他们连接文件的等级决定。因此, 文件的Page Rank由其他文件的Page Rank总递归之和确定。总而言之, Page Rank的等级是由整个网的连接结构决定的。

2.2 Page Rank算法描述

Lawrence Page和Sergey Brin在个别场合描述了Page Rank最初的算法。这就是PR (A) = (1-d) +d (PR (T1) /C (T1) +...+PR (Tn) /C (Tn) ) 式中:

PR (A) :网页A页的Page Rank值;

PR (Ti) :链接到A页的网页Ti的Page Rank值;

C (Ti) :网页Ti的出站链接数量;

d:阻尼系数, 0

于是可知, 首先, Page Rank并不是将整个网站排等级, 而是以单个页面计算的。其次, 页面A的Page Rank值取决于那些连接到A的页面的Page Rank的递归值。PR (Ti) 值并不是均等影响页面PR (A) 的。在Page Rank的计算公式里, T对于A的影响还受T的出站链接数C (T) 的影响。这就是说, T的出站链接越多, A受T的这个连接的影响就越少。PR (A) 是所有PR (Ti) 之和。所以, 对于A来说, 每多增加一个入站链接都会增加PR (A) 。最后, 所有PR (Ti) 之和乘以一个阻尼系数d, 它的值在0到1之间。因此, 阻尼系数的使用, 减少了其它页面对当前页面A的排序贡献。

3 搜索引擎的优化

3.1 优化Page Rank

虽然Page Rank技术在实践的检验中被认为是很成功, 但不代表Page Rank就不存在不足之处。从根本上说, Page Rank只是一种基于bake-link的算法, 它不能给页面的具体分类提供任何帮助, 细化检索范围。有分析统计表明, 用户平均察看返回结果不超过2页。据此, 笔者认为Google可采用某种反馈机制实现根据用户的需求、行为的反馈进行检索结果的Page Rank值的重新组织排序, 使一些较准确的、满足用户要求的记录, 能较为全面的显示在检索结果前面部分, 从而为用户提供更为有效的信息服务, 提高客户满意度。针对用户信息行为特征以及Page Rank技术的优点, 本文建议采用一种基于C/S模式的行为反馈再排序机制。如图2所示:

该机制在Server端继续运行Page Rank, 在Client端建立一系列跟踪反馈器, 记录下用户的所有行为操作并进行反馈, 根据这些行为操作, 系统可进行再次的行为分析描述, 产生与用户需求密切相关的特征量以及附加Rank值。最后, 系统根据收集的行为特征量, 进行再次的文本匹配, 产生一系列检索结果项, 同时Page Rank系统会在对附加Page Rank值进行Page Rank值复合的基础, 实现结果项的重排序, 使准确、有效、满足用户需求的记录项能充分全面地集中地显示在前面位置, 从而使用户能更容易地获得所需的各种信息。

3.2 添加个性因子

上面我们所说搜索引擎排名与Page Rank的关系是搜索引擎结果Ranking (排名列表) 是“Page Relevance” (页面因子) 与“Page Rank”因素综合承继的结果

Ranking= (Page Relevance) x (Page Rank)

但是这样的排名方式是同样的搜索引擎对不同的任何人输入同样的查询值都会返回相同的结果, 但是我们每个人查询的目的都不同, 很有可能自己所关心的内容在前面2页都没有返回。这样就导致搜索效率的低下和用户的流失。作者认为可以在排名技术上再加上新的因子, 即除了页面因子和Page Rank值之外有一个新的因子来对排名进行一定的影响, 即针对用户行为来制定个性化搜索服务的相关因子。本文暂时命名为个性因子 (Personality) 。即把上述的公式扩展为:Ranking= (Page Relevance) x (Page Rank) x (Personality) , 本文假设对个性因子值的确定可以有个初步的假设公式为:Personality= (times) +relevance) , 而之所以采用加的方式, 因为若用户对某一个网页进行点击很多的次数时, 即使该网页的其他判定值不是很高, 但是由于该用户足够喜欢该网页, 搜索引擎没有理由不为这个用户把该网页放在第一位。这样得出一个合理的排序值是由若干方面的因素综合而成的, 排序算法的关键在于确定这些因素并求解, 最终依据系统需求形成一个综合的值供查询时排序显示。

4 总结

随着互联网上信息量和信息种类在不断增加, 并且上网人数剧增以及网民成分的变化, 搜索引擎要覆盖所有的网上信息查找需求已出现困难, 因此各种主题搜索引擎, 个性化搜索引擎, 问答式搜索引擎等纷纷兴起。这些搜索引擎虽然还没有实现如通用搜索引擎那样的大规模应用, 但随着互联网的发展, 我们相信它们的生命力会越来越旺盛。而为了进一步满足个人的需要, 个性化的服务将会是一种必然的趋势, 通用的检索系统不可能满足不同背景、不同目的和不同时期的查询请求。我们衷心的希望在不久的将来出现交互式个性化的新型搜索引擎技术的出现为用户的信息检索带来更大的帮助。

摘要:搜索引擎面临的一个主要问题就是如何使得用户所关心的网页能在搜索后的结果能够排序靠前或者说是重要的网页能够获得较好的排序位置。这个就涉及到本文所提到的搜索引擎技术中的一种——搜索结果排序技术。本文提出了一种在原有的排序机制中加入新的排序因子, 即个性因子。这是根据个人的查询习惯来影响查询结果的排序情况。

关键词:搜索引擎,排序技术,PageRank,个性因子

参考文献

[1]蔡国民, 王雅琳.搜索引擎的相关排序算法分析与优化[J].吉首大学学报 (自然科学版) , 2006, 27 (5) :17-19.[1]蔡国民, 王雅琳.搜索引擎的相关排序算法分析与优化[J].吉首大学学报 (自然科学版) , 2006, 27 (5) :17-19.

搜索引擎优化的作弊与防范 篇9

一、搜索引擎优化作弊的概念

搜索引擎作弊,或SEO作弊是指为了在搜索引擎中提高排名的目的而欺骗搜索引擎的行为。它与搜索引擎优化最大的区别在于,搜索引擎优化是一种利用搜索引擎的搜索规则来提高网站在有关搜索引擎内的排名。

二、搜索引擎优化作弊的常见形式

1、隐藏文本或隐藏链接

一般指网页专为搜索引擎所设计,网页内含的文字不能被人们所看到,但是却能被搜索引擎看到。在形形色色的隐藏技术中,最常见的就是把文本或链接文字的字体颜色设置为与背景色相同或十分接近。

2、恶意更换页面内容

一般发生于先向搜索引擎提交一个网站,等该网站被收录后再以其它页面替换该网站。“诱饵行为”就属于此类偷梁换柱之举:创建一个优化页和一个普通页,然后把优化页提交给搜索引擎,当优化页被搜索引擎收录后再以普通页取而代之。

3、关键词堆砌

关键词堆砌是指在页面上堆放大量与页面主题相关或无关的关键词,这样做是为了增加某些关键词的词频以提高页面相关性。它通常分为误导性关键词和重复性关键词两种形式。

4、域名重定向

简单的说就是通过各种方法,例如使用刷新标记、CGI程序、JAVA等将各种网络请求重新定个方向转至其他位置。常见的重定向包括301 redirect,302 redirect和meta fresh三种。

5、门页

门页是指针对搜索引擎而进行特别优化的页面,当用户访问门页时,会自动或被引导至另外一个内容完全不同的页面上。门页可能是针对一个搜索引擎,也可能是针对多个不同的搜索引擎。由于每个搜索引擎的算法会存在或多或少的差异,不同的搜索引擎会有不同的门页,在对不同的搜索引擎蜘蛛程序返回相应的门页。

6、镜像网站

广义上的镜像网站是指那些复制或者抄袭其他网站内容的网站。常见的镜像网站有三种:克隆网站,数据采集网站,多域名网站。

7、作弊链接技术

指由大量网页交叉连接而构成的一个网络系统。这些网页可能来自同一个域或多个不同的域,甚至可能来自不同的服务器。这种方法在建站初期的时候可能影响不会太大,毕竟搜索引擎要发现这些网站群的关系是需要一定的时间的。假如这些网站的链接超过了半年,依旧大量的相互链接,,很有可能这几十个网站都会被察觉。

三、搜索引擎优化作弊的防范措施

1、搜索引擎要反作弊的重要性

搜索引擎是各大搜索公司的生命。因此,对于上述提到的搜索引擎作弊行为,谷歌,百度这些知名公司总是想方设法防范的。搜索引擎作弊不仅直接破坏了搜索引擎网站赖以生存的关键,而且也破坏了搜索引擎网站获得收益的来源。近几年来谷歌、百度等已经在反作弊上做了很大的工作,并对这些作弊行为给出了相应的惩罚措施。

2、搜索引擎反作弊方法

像谷歌,百度等这样的知名公司,总是不断的运用各种技术提高自己的搜索质量。因为作弊具有共性,只要抓住这些共性就可以解决一类问题,一类类问题的解决,作弊的影响就可以降到最低点。

(1)基于网页特征分析的方法

从大规模的网页实验集中提取网页特征,然后通过统计的方法对特征进行分析,得到作弊网页和正常网页的不同特征。根据这些特征建立一个网页分类器来实现自动的把网页分成作弊网页和正常网页。最常见的方法是建立常用的spam列表并对其分类和分级,通过常用的spam列表分析相关词汇重复使用率,密度,分布等情况,进而判断是否存在恶意重复现象。

(2)基于页面链接结构分析的方法

通过分析网页的链接结构来判断某网页是否是作弊页面,这种方法主要通过算法来实现,主要的思路是从正面出发的hilltop算法、trustrank算法和从反面出发的badrank算法。通过不同的算法对作弊进行防范,不同的排序算法会有不同的排序依据,不断的寻找作弊者不能控制的排序依据使其无法进行作弊行为。

(3)检测隐藏技术的方法

通过分析使用隐藏技术的网页的特征,一些简单的隐藏技术很容易被检测出来。例如:对于隐形页面作弊如果发现页面内部大量文本采用和背景相同的颜色设置,则确定为作弊页面;对于重定向、伪装页面可以使用网络爬虫来检测。搜索引擎可以让一部分爬虫伪装成普通用户来访问站点,对网站进行测试,看网站对用户和搜索引擎返回的内容是否一致,如果不一致则很大可能是在作弊。

(4)加强人工审查

虽然通过技术手段反作弊的精准度接近于100%,但也不可能完全的消除,只能有效的减少。当技术手段不能解决问题,就用人工来解决。人工审核是最后的补充,前面的技术方法可以将需要审核的作弊网站范围大大缩小,人工审核是判断搜索引擎作弊的最后方法,也是最准确的方法。

四、总结

如今,反作弊技术已经日趋成熟,搜索引擎在对付网页作弊的工作上取得了不错的效果。但是,商业利益的诱惑让作弊技术不断的更新和改进,所以搜索引擎很难从根本上消除网页作弊现象。因此,作弊和反作弊的斗争将是一个长期的反复的过程,同时也变相的推动了互联网搜索行业的不断创新和发展。我们相信,随着反作弊技术的发展和成熟,在识别和对付作弊网页上一定可以取得更好的成绩。

参考文献

[1]网利刚,赵政文,赵鑫鑫。搜索引擎中的反SEO作弊研究[M].计算机应用研究.2009.

[2]张兴华.搜索引擎技术及研究[J].现代情报.2004.

[3]格拉夫,库辛.搜索引擎优化[M].清华大学出版社.2007.

AVS编码算法全搜索方案优化 篇10

1 传统全搜索算法

传统全搜索算法先分别计算目标宏块与mvp和 (0, 0) 点所对应的参考宏块的代价值, 选二者中较小代价值的为搜索对象, 在扩展range=32个像素范围内搜索。在搜索范围内先以16×16模式在前两个恢复帧中搜索出代价值较小的一帧做为整个宏块的参考帧, 然后在确定的参考帧中搜索其余模式 (顺序为8×8, 16×8, 8×16以及帧内模式) 。在确定8×8模式代价值后与16×16模式代价值比较, 若高于16×16模式代价值则结束搜索;否则抛弃16×16模式继续搜索16×8和8×16模式, 根据最小代价值原则确定该宏块最佳搜索模式。

一般在码率相同情况下全搜索方案可以获得最好的信噪比, 但是计算复杂性太高导致帧率降低。一些改进的搜索算法不做全搜索, 针对特定情况设计特殊搜索路径以便缩小搜索范围, 但是不具有通用性。降低全搜索方案计算复杂性主要采用两种措施:只搜索16×16模式或缩小各个搜索区域尺寸, 对于大多视频序列这种全搜索的改进方案将会导致信噪比下降和码率增高的现象。事实上, 基于块匹配原理的各种不同搜索模式所包含的相关性信息有着紧密的关联性, 但是传统全搜索方案没有充分利用不同模式搜索结果中蕴含的图像相似性信息来降低计算复杂性。本文提出一种新的全搜索方案, 其信噪比和码率与传统全搜索方案具有相同的水平, 但计算复杂性仅略高于16×16搜索模式。

2 SMS全搜索方案

本论文提出一种新的基于子模式拼接 (Sub-Model Stitching, SMS) 的高效运动矢量全搜索方案, 充分利用既有搜索模式的代价值和位置信息, 通过子模式拼接来确定后续搜索模式和缩小搜索范围, 把全搜索的计算量降低到相当于只作16×16模式搜索。由于SMS算法包括了所有模式的更加精细搜索, 在处理运动剧烈的视频序列时有较好效果。SMS基本流程如图1所示。

2.1 SMS方案的搜索流程

SMS的基本流程是:先在两个恢复帧中搜索8×8模式得到4个最佳匹配子宏块和相应的mv={mv0 (i0) , ..., mv3 (i3) }, 其中ik=0或ik=1, k=0, 1, 2, 3是参考的恢复帧索引值, 并用它们指导后续模式的搜索。若相应的4个恢复帧索引值有3个以上相同, 则将其定为唯一的参考帧, 否则确定2个参考帧。确定参考帧后, 若是唯一的参考帧且含有3个以上相邻mv, 则将这4个子宏块直接拼接生成一个16×16的最佳模式, 并且不进行其余模式的搜索;若不存在3个以上相邻的mv或者参考帧不唯一, 则在一个参考帧或两个参考帧中进行判断:是否有2个相邻的8×8子宏块可以拼接组合成为一个16×8 (或8×16) 块;如果有则完成拼接并且只在包含该块的小范围内进行相应16×16最佳模式的搜索;如果没有则在4个8×8块的mv周围扩展进行小范围16×16最佳模式的搜索。将搜索的16×16最佳模式代价值与综合后的8×8最佳模式代价值进行比较并确定16×16最佳模式是否为最终模式, 若是则搜索过程结束;否则进行16×8 (或8×16) 模式搜索, 此时若在4个mv中可以进行拼接组合则实现拼接并作如下判别, 如果存在一组16×8拼接, 判断是否存在另一组16×8拼接;如存在另一组16×8拼接则实现拼接并终止搜索, 以16×8为候选模式;否则不存在另一组16×8拼接, 在余下的2个8×8块周围扩展成16×8块进行搜索, 并且不进行8×16模式搜索。如果不存在一组16×8拼接则按上述原则进行8×16模式的处理。若不存在任何可以拼接的情况, 4个8×8块的mv周围扩展分别进行16×8模式和8×16模式的搜索, 最后比较它们的代价值确定此宏块的最佳模式。

当存在可拼接模式时, 前期搜索结果蕴含了图像之间的相关性, 表明当前搜索的图像块成为最佳模式的概率大大提升, 在此周围扩展搜索的范围可以大大减少。有关搜索范围的讨论将在下文涉及。

2.2 模式的可拼接性

传统全搜索方案中所有宏块必需经过8×8模式和16×16模式的搜索, 大部分模块要经过16×8模式或8×16模式搜索。所以若能不经搜索便直接确定这些模式的mv和参考索引, 则可以大量节约搜索时间。表1是对新的全搜索方案拼接组合成功比率的测试结果, 选取AVS官网提供的5个视频序列, 其中cif格式有Foreman, Children和Football, D1格式有Ice和Soccer。

表1的每个模式项下, 总数是经过该模式搜索的宏块数目, 命中数目指的是可以进行拼接的宏块数目。由表1可知经过8×8模式搜索之后, 除了运动较为剧烈的Football码流之外, 其余序列可以直接拼接组合生成16×16模式的宏块占比超过60%以上, 剩余的宏块中有48%~70%可以经过组合拼接成为16×8块或8×16块, 不经搜索直接与其他模式代价值比较。由此可知, 新算法主要通过拼接组合而不是搜索获得最佳模式, 可以大大降低计算复杂性。

2.3 确定搜索范围

进行8×8模式搜索后, SMS的mv值所对应的像素块最有可能包含在最佳模式中, 因此在其周围区域搜索其余模式, 搜索范围可以相应地缩小。在传统全搜索算法中加入测试语句, 记录各模式最佳搜索结果的mv与8×8模式mv之间的距离, 以其距8×8模式的4个mv中最小者为准。以8×8模式的mv为中心作圆使其覆盖其他各个模式的mv, 半径分别取 进行统计, 考查不同半径覆盖圆的覆盖效率。取5个cif格式的视频序列, 测试结果如表2所示。

矩形搜索的覆盖率并没有大幅降低, 权衡处理速度和搜索精度后将16×16模式、16×8模式、8×16模式的搜索范围定为在8×8模式的mv上下左右扩展8像素比较合理。

确定8×8模式的搜索范围是range=32和range=16, 即对原始数据上下左右都扩展16和32, 主要考察其对PSNR、码率和帧率3个参数的影响。表4是新的全搜索方案对搜索范围的测试结果, 其中范围 (1) 和 (2) 分别是range=16和range=32, 在进行其余模式搜索时均采用上下左右扩展8像素。

由表4的实验数据可知, 对于新的全搜索算法, 搜索范围 (1) 比范围 (2) 的PSNR和帧率都高且码率小, 因此将全搜索新算法的8×8模式搜索范围定为上下左右扩展16个像素。

3 实验与结果

测试的4个全搜索方案分别是原全搜索方案、原方案1 (上下左右扩展32像素, 仅16×16搜索) 、原方案2 (上下左右扩展16像素, 仅16×16搜索) 和SMS搜索方案。新的全搜索方案中8×8模式的搜索范围为扩展16像素。实验程序用pentium (R) Dull-wre cpu处理器, 型号是E5500, 主频2.80 GHz, 内存2 Gbyte。测试序列采用IPPPP…结构, 测试结果列在表5~表8中。

d B

f/s

kbit/s

%

由表5~表7可知, 新搜索方案的PSNR与原搜索方案基本保持一致, 表明图像质量保持不变;仅16×16搜索的两个原方案出现PSNR下降的现象, 尤其是对运动剧烈的视频序列PSNR下降尤为明显, 原因是仅作16×16搜索对图像细节描述粗糙。在帧率方面, 原全搜索方案由于搜索模式多、范围大所以搜索时间长、帧率低;新全搜索方案通增加模式拼接, 比较原全搜索算法帧率大大提升, 几乎能够达到仅16×16搜索的原方案水平。新全搜索与原全搜索两种算法的PSNR和码率基本相同, 而仅作16×16搜索的原方案, 对运动剧烈的视频序列码率相对较低, 而对运动稍微平缓的视频序列码率反而要高, 原因是缺少16×8、8×16和8×8模式的精细描述, 导致帧内模式比例提高, 详见表8。

由上述各表可知, 新的全搜索方案与原方案比较, 码率基本没有变化, PSNR基本保持不变, 帧率提升300%左右, 与原方案2的处理速度相当。可见新的全搜索方案码率得到提升, 对cif序列和D1序列都有效。

4 结束语

本文将AVS帧间运动矢量搜索算法采用模式拼接新的理念在C语言程序实现。新全搜索方案可以处理cif (352×288) 、D1 (704×576) 的4∶2∶0的视频图像, 对视频序列的处理在帧率有大幅提升。本论文的研究内容对AVS帧间运动矢量搜索算法的实现有着实际的参考价值。

参考文献

[1]毕厚杰.视频压缩编码标准——H.264/AVC[M].北京:人民邮电出版社, 2005.

[2]肖敏连.一种快速整像素运动估计算法研究[J].湖南人文科技学院学报, 2011 (10) :129-141.

[3]张子敬, 张志华, 霍家道.基于运动矢量分散度的增强型MVFAST搜索算法[J].科学技术与工程, 2012 (12) :9216-9220.

[4]王荃, 鲍卫兵, 张永智.搜索模式自适应快速运动估计算法[J].电视技术, 2009, 33 (7) :16-17.

[5]包国兴, 谌德荣, 胡宏华, 等.一种快速H.264帧间模式选择算法[J].博士论坛, 2010 (26) :1-2.

[6]刘海华, 雷奕, 谢长生.基于块匹配的运动估计搜索算法研究与实现[J].计算机应用, 2006 (6) :1354-1356.

搜索优化 篇11

关键词 搜索引擎优化 SEO 公共图书馆网站

分类号 G250.72

Investigation of Public Library Website Search Engine and Optimization Study

Yao Shun

Abstract With the escalation of search engine users over the recent years, it has become increasingly popular to apply search engine optimization to websites. This paper conducts an investigation and analysis on 27 public libraries’ website collection amount, keywords, page content and off-site SEO, discovers the status quo and problems of the current public library websites in term of search engine optimization, and proposes recommendations for improvement.

Keywords Search engine optimization. SEO. Public library website.

搜索引擎优化(SEO)是网站的一种营销手段,它通过一些方法和技术手段使网站关键词排在搜索引擎结果的前面,让用户主动访问自己的网站。近几年,随着搜索引擎用户的不断增加,SEO变得越来越流行。有些商业公司想尽一切办法优化自己的网站以获得更好的搜索排名,提高企业的知名度和获取更多的客户。与商业公司的网站相比,公共图书馆网站虽然不用来营利,但同样希望能提高图书馆知名度和吸引更多的读者。因此,SEO对于公共图书馆网站也十分重要。笔者对国内部分公共图书馆网站的搜索引擎优化情况进行了深入的调查和分析,并提出网站优化改进的建议。

1 调查对象和方法

本文以省级和副省级公共图书馆的网站作为主要调查对象,按照地区和现代化程度的差异从中抽取了26家作为样本。另外还增加了东莞市图书馆作为样本,该图书馆在2013年5月的AlEXA排名中位于全球网站的87 155位,是国内公共图书馆(国图除外)排名最好的。因此,这27家样本的调查结果能够反映国内公共图书馆网站搜索引擎优化的整体情况和最高水平。调查过程通过网络进行,采用多种方法和查询工具,如通过浏览各家图书馆网站得到网站内容,采用查看源文件的方式得到网站的代码,采用爱站和站长网站工具得到网站的基本信息,采用Xenu工具检查死链,采用百度指数工具查询网站关键词的检索情况,采用ahrefs.com网站外链查询工具获得网站的外链情况等等。本次调查时间为2013年10月5日。

2 调查结果分析

2.1 站收录量

网站收录是指搜索引擎对网站页面的收录,它是网站进行搜索引擎优化的基础。在国内,百度是绝大多数网民首选使用的搜索引擎,在网民中的首选率占85.7%[1]。因此,调查国内公共图书馆网站的收录情况主要是查询其在百度中的收录量。表1是笔者对27所公共图书馆进行网站收录量的调查结果。

从表1可以看出,大部分公共图书馆网站收录量在1万以下,有的甚至只有几百条,只有5家收录量超过10万,显然绝大多数图书馆网站的大部分内容没有被搜索引擎收录。被调查的这些图书馆网站域名年龄基本都在十年左右,这么久的域名年龄却没有积累比较高的网站收录量,说明公共图书馆对网站的搜索引擎优化与营销理念缺乏。在网站收录的内容上,主要是网站新闻、特色资源、购买电子资源、书目信息等页面,其中购买的电子资源和书目信息占网站收录的主要部分。如:东莞图书馆收录量198 000条,其中栏目“东莞学习中心”收录150 000条,占总收录量的76%;上海图书馆收录211 000条,其中主要是OPAC收录114 000条,占总收录量的54%;江西省图书馆收录469 000条,其中OPAC收录464 000条,占总收录量的99%。在特色资源方面,百度只收录了很小一部分。其中广州图书馆的特色资源收录最多,达到8740条,其次是广东省图书馆被收录了6990条。其他图书馆的特色资源收录很少。笔者分析其原因主要有两个方面:一是部分图书馆网站没有建设或没有发布特色资源库;二是特色资源的链接不友好,搜索引擎无法收录到。

表1 公共图书馆网站收录与排名

2.2 关键词

关键词是用户使用搜索引擎检索信息时在搜索框里输入的检索词。在网站里,关键词存在于每个网页的keywords标签中,它不仅是对网站主题的描述,也是对用户上网行为习惯的分析。在搜索引擎排名中,关键词是一项重要参数,因此对关键词的优化是SEO中关键的一环[2]。笔者对27家公共图书馆网站首页关键词进行调查,发现大部分图书馆网站首页没有设置关键词,只有上海图书馆、东莞图书馆、辽宁省图书馆、重庆图书馆等六家网站首页包含关键词(见表2)。对这六家图书馆网站的关键词进行分析后发现存在一些问题。第一,关键词的数量不合理。有的图书馆网站首页有20余个关键词,这么多的关键词会让搜索引擎认为是关键词堆砌,不利于关键词排名。一般首页keywords标签选择2-3个关键词。第二,关键词的选择上欠考虑。如“电子书看书”“民主与法制”“中外文摘”等,这些关键词在搜索引擎中搜索量几乎为零,不适合作为首页关键词。第三,关键词出现次数不合理。页面中出现关键词是必要的,也是必然的。可调查发现有些关键词(如:学习网、古籍保护)在首页甚至整个网站页面的正文中都未出现一次,这显然是不合理的。第四,大部分关键词的百度排名不高。从表2中可以看出虽然部分关键词的百度排名在10以内,但大部分的关键词排名在100名以外。

nlc202309040929

表2 公共图书馆网站首页关键词调查

2.3 页面内容分析

2.3.1 标题信息

网站的标题常用来表达网页的主题内容,是搜索引擎优化中最重要的因素。在首页里,27家公共图书馆网站都设置了标题标签,并将本馆的馆名作为标签内容。这能让搜索引擎明白这就是图书馆的首页;在内容页(图书馆新闻、书目信息)内,有17家图书馆将馆名或栏目名作为标题,其他10家图书馆以新闻标题或书名作为标题。以新闻标题或书名作为标题的页面容易让搜索引擎分析到页面主题,在检索相关内容时有好的排名,而那些以馆名或栏目名作为标题的内容页面却很难被检索到。

2.3.2 框架

框架(Frame)在网页中表现为一个网页中嵌套显示另外一个网页的内容。有些浏览器不支持这种结构。大多数搜索引擎无法识别框架,也不会收录其中的内容。调查发现目前有11家图书馆网站首页中使用框架,主要有检索框、读者登陆框、外网数据调用和友情链接等,虽然这些框架没有什么值得收录的内容,但却会给用户带来浏览的不便。

2.3.3 URL地址

URL地址的设计应该规范、简单。笔者在调查中发现9家图书馆网站的URL地址中包含了公网IP地址,还有5家网站的部分内容页面的URL太长且没有规律。这样的URL地址既不利于搜索引擎优化,也不便于用户记忆。

2.3.4 Flash文字描述和图片ALT信息

Flash和图片在网页设计中应用非常广泛,被调查的图书馆网站页面都插入了Flash或图片,有的甚至整个页面都是Flash构成,如安徽省图书馆网站首页和福建省图书馆的自建专题数据库。这样的网站表现非常漂亮且有创意,但无法让搜索引擎识别所表达的信息。常见的解决办法是在Flash和图片中加入描述信息或ALT标签,方便搜索引擎采集和收录。调查发现有20家图书馆网站没有对Flash和图片进行注释处理,显然大多数的网站管理员没有注意这方面的问题。

2.3.5 网站导航

网站导航对网站逻辑结构和用户体验有很大影响,清晰的导航也容易让网站页面被搜索引擎抓取。调查发现所有的图书馆网站都有导航功能,但只有22家网站的导航功能是完整的。导航功能不完整主要在以下几个方面:(1)使用script脚本设计导航,这种脚本搜索引擎是不进行收录的;(2)栏目页或内容页中缺少导航;(3)导航链接地址错误。

2.3.6 网站地图

网站地图是展示网站结构的网页,它将网站结构以树状目录的方式展示给用户,方便用户寻找某些栏目页面,同时也有利于搜索引擎对网站更全面的抓取。调查发现在27家图书馆网站中只有9家有网站地图。

2.3.7 死链接

搜索引擎蜘蛛对网站的收录是通过链接来完成的,如果网站存在死链接,不仅会使收录页面数量减少,还会使网站在搜索引擎中的权重降低,同时大大损伤网站在用户心中的整体形象。调查发现有17家图书馆网站存在死链接,其原因有以下几方面:(1)图书馆网站改版后有部分链接地址未及时更新,使得这些链接无法访问;(2)图书馆网站上有些链接是测试地址或试用资源地址,这些地址取消测试或试用后没及时删除链接;(3)图片被删除或移动了位置,造成图片无法显示;(4)程序员疏忽大意使得URL地址写错。

2.4 站外SEO分析

站外SEO,也可以说是脱离站点的搜索引擎技术,源自外部站点对网站在搜索引擎排名的影响,主要从外部链接、链接源数量和外部链接质量上进行分析[3]。经统计,在外部链接数量和链接源域名数量上,上海图书馆远远高于其他图书馆,其外部链接数量达到97万条,链接源域名数量6千余条。其他图书馆网站的外部链接数量在几千到几万之间,链接源域名数量在4千以内。对被链接的页面进行分析,上海图书馆网站被链接的页面前三位是“上海图书馆馆藏”(65%)、“知识导航”(8%)和“上海图书馆首页”(8%),可以看出上海图书馆及其联合知识导航平台在网上知名度很高。其他图书馆网站被链接的页面主要集中在图书馆首页,约占总数量的90%以上。由此可见,大部分图书馆网站对外部链接不够重视,缺乏对特色资源的网上推广。

网站外部链接的质量比数量更重要。Google提出使用PR(PageRank,网页级别)值表示,PR值的大小由外部链接数量与质量决定。调查显示,几乎所有的公共图书馆网站的PR值都在6以上,说明其外部链接数量虽然少但质量还是比较高的。这主要是由于公共图书馆网站的外部链接很多都是来自政府类网站之间的链接,如东莞图书馆的外部链接中含有来自东莞阳光网、陕西文化信息网、广东数字文化网、中国图书馆学会等网站的链接。政府类网站具有信息的权威性,在搜索引擎中的权重很高,从而影响了图书馆网站的PR值。

3 改进建议

3.1 重视网站的搜索引擎优化

通过调查发现,国内公共图书馆网站在搜索引擎优化方面做得远远不够,还有很大的改进空间。图书馆应当重视网站的搜索引擎优化,特别是得到图书馆领导的重视,因为搜索引擎优化不仅是技术部门的事情,还需要与网站内容相关的多部门配合,这需要领导的协调和支持。另外,SEO是一项复杂而长期的工作,需要我们对网站不断进行优化、更新与推广。公共图书馆应当组建专门的搜索引擎优化团队负责网站页面优化、内容编辑、外链推广和流量分析,并将这个工作作为一项长期的任务来执行[4]。

3.2 对网站进行技术改进

(1)对URL地址进行规范与统一。无论静态页面还是动态页面,其URL地址都应该统一和简洁,减少复杂冗长的地址。不要使用含有IP的URL地址,将IP地址转换成二级域名或者子目录,让一个页面只对应一个地址。(2)设置网页标题与关键词。每个页面必须设置网页标题,首页以图书馆的馆名作为标题,栏目页面和内容页面分别用栏目名称和文章标题作为网页标题。在关键词的设置上需要技巧,既要体现图书馆的特色,又要在搜索引擎中有较高的搜索量。在首页,笔者建议既可采用热门通用词,如图书馆、电子书、图书等,也可采用馆藏特色名称,如湖南人物、徽派建筑等,还可采用直接需求词,如免费电子书、电子书下载、手机电子书等。在内容页可采用文章关键词作为页面关键词,文章没有关键词的则可使用文章标题代替。(3)减少对搜索引擎不友好的网页设计。在页面中应减少或不使用Iframe框架结构,避免使用图片或JS程序做链接,对页面中的图片和flash添加alt属性或描述[5-6]。(4)拥有清晰的导航。无论首页还是内容页都应该有导航系统,首页可以采用“菜单”式导航,栏目页和内容页可以采用“面包屑”式导航。导航应使用文字导航,不要采用图片或flash做导航,并且能正确地表示用户现在所处的网站位置。(5)制作网站地图[6]。网站地图采用HTML或XML格式制作,应能清晰地反应网站架构,既让用户通过地图能找到网站的每个栏目,也让搜索引擎收录网站的全部内容。

nlc202309040929

3.3 加强网站的外链推广

图书馆网站的外链建设在重视数量的同时更要重视质量,与一些流量大、权重高和内容相关的网站合作,在对方的网站上建立本馆的网站链接。笔者建议可通过以下几种方式建立本馆的网站外链。(1)加强网站之间的交换链接。这种方式比较简单,也可以获得不少的用户访问,但一定要注重对方网站的排名与相关性,不建议与一些排名低或毫不相关的网站交换链接[7]。(2)与媒体合作,在网络宣传图书馆活动的同时建立网站的外链。图书馆会定期和不定期地举办一些活动,不少媒体会对活动进行报道。我们可以建议他们将图书馆的首页或活动的页面地址写进报道中,增加图书馆网站的曝光率。(3)增加网站页面的网络分享功能。图书馆网站上的新闻动态、新书推荐、讲座预告和数字资源等页面能让用户分享到自己的微博、微信、贴吧、空间上进行宣传。如果信息被多次转发,图书馆网站将会获得大量外链。(4)建立引导式外链。百度知道、腾讯问问、新浪爱问等知识问答网站非常受欢迎,原因是其反应了人们的真实需求。这些提问中有些是直接与图书馆相关的,如咨询图书馆地址、借阅权限等,还有一些提问是间接与图书馆相关的,如询问是否有2013年英语“四级”考试模拟试卷等。图书馆应当重视这些咨询,及时回答,引导用户访问图书馆网站并成为图书馆的持证读者。

3.4 重视用户体验

搜索引擎优化是我们提高网站排名和进行网站推广的方法。我们不能以搜索引擎优化为目的去建设图书馆网站,而应该将用户体验作为网站建设的目标。用户体验好的网站自然会受到搜索引擎的喜欢,其排名也会不错。改善用户体验主要包括以下几个方面:其一,增加互联网带宽和提升服务器配置,减少用户访问页面等待时间和服务器故障频率;其二,删除或替换网站页面中的死链,确保网站上的每个链接都是可用的;其三,除了购买商业数据库外,还要建设本馆原创的资源,让用户觉得图书馆网站不仅资源丰富,还有一些独有的东西;其四,定期对网站内容进行更新,让用户觉得本馆网站充满活力。

参考文献:

[ 1 ] 中国互联网络信息中心.2013年中国网民搜索行为研究报告[R/OL].[2014-02-10].https://www.cnnic.cn/hlwfzyj/hlwxzbg/ssbg/201308/P0201308283311533761

73.pdf.

[ 2 ] 欧朝晖.SEO智慧—搜索引擎优化与网站营销革命[M].北京:电子工业出版社,2010:100-101.

[ 3 ] 佚名.SEO_百度百科[EB/OL].[2014-01-01].http://baike.baidu.com/link?url=mosR_k3C-IAMbl-vWWR

UdBJxxg909JbnMQVXtbEzbPFXtbLCNJLFSU_wzE0h

RiNF.

[ 4 ] 昝辉.SEO实战密码[M].北京:电子工业出版社,2011:366-378.

[ 5 ] 张建军.网站设计和SEO优化策略的融合[J].北京工业职业技术学院学报,2013(2):14-17.

[ 6 ] Jaimie Sirovich;Cristian Darie.搜索引擎优化高级编程(PHP版)[M].北京:清华大学出版社,2008:

145-146.

[ 7 ] 杨帆.SEO攻略[M].北京:人民邮电出版社,2009:100-111.

姚 舜 湖南图书馆现代技术部副主任。湖南长沙,410011。

(收稿日期:2014-07-08 编校:方 玮)

中小企业网站搜索引擎优化策略 篇12

搜索引擎优化 (简称“SEO”) 是一种利用搜索引擎的搜索规则来提高网站在搜索结果排名的方法。企业认为通过SEO获得网站目标搜索词排名, 能够更多展现产品, 使企业赢得利润, 实现企业目标。针对这一目标, 本文重点论述企业如何实施SEO, 提升SEO效果。

一、企业实施SEO的原因

(一) 用户搜索体验分析。

2006年4月, 美国著名网站设计师Jakob Nielsen发表了一项眼球轨迹的研究报告, 报告指出, 多数情况下浏览者都不由自主的以“F”型的模式浏览网页, 这种基本恒定的阅读习惯决定了网页呈F形的关注热度。

F型网页浏览模式告诉我们:在搜索结果页面, 用户的浏览习惯也是F型, 人们的眼光普遍关注自然排名的最前面的搜索结果。

(二) SEO的目标。

SEO的目的是以最小的投入获得最大的访问量, 并产生商业价值。因为网站排名在搜索结果的位置直接决定了网站受关注的程度, 所以这也是为什么众多企业力图把自己的网站优化到首页的原因。

二、优化策略

笔者从以下几个方面来分析如何优化网站的站内结构给搜索排名带来影响:

(一) 网站结构优化。

在建站之初, 一定要制定好网站的栏目结构, 重点考虑通过哪些技术手段可以让网站每个页面能够有机地联系起来。合理的网站结构建议采用扁平的树形网状结构。所以网站中每一个网页, 都应该是网站结构的一部分, 都应该能通过其他网页链接到, 在实际操作中, 具体表现在以下几个方面:

1、网站导航优化。

网站应该有清晰的结构和明晰的导航, 这能帮助用户快速从网站中找到自己需要的内容, 也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。树形扁平结构通常分为以下三个层次:首页—栏目页—文章页。树形结构的扩展性更强, 网站内容变多时, 可以通过细分栏目来轻松应对。扁平是指从首页到内容页的层次尽量少, 这样搜索引

2、次导航优化。

次导航条又称“面包屑导航”, 一般位于网站内页之后, 如分类页、内容页等, 都是在内容的上方。例如“当前位置:首页>新闻中心>公司新闻”。次导航的作用一方面是能够让用户知道这篇文章所在整个网站的位置;另一方面是引导搜索引擎抓取, 提示从首页开始到当前位置的抓取路径。

3、底部导航。

一般程序都不会自带底部导航, 大部分拥有底部导航的原因是站长为了增加关键词密度及提示用户可以通过底部导航返回相应的栏目而设置的。

4、其他结构优化方法。

为了使每个页面能够和其他页面进行互联, 网站还可以添加一些功能, 如“上一篇”与“下一篇”文章、“相关文章”、“热点文章”、“点击排行榜”、“最新文章”等等, 也可以根据某个关键词做成一个专题页面。

(二) 网站关键词优化。

用户通过搜索引擎 (如百度) 输入关键词到达搜索结果页面, 根据用户查阅习惯, 网站排名越靠前用户越容易检索到, 所以SEO核心工作就是尽可能多的挖掘关键词, 尽可能多地将关键词排名靠前, 这样就会获得越多的流量。如, 一家液压机械企业, 主打产品为“金属液压打包机”, 核心关键词为“打包机”, 通过站长工具进行挖掘, 如表1所示。表1为企业主打词“打包机”按照搜索量进行排序从大到小的排名结果。根据企业产品属性进行筛选, 可以选出, “打包机”、“液压打包机”、“金属打包机”作为网站的核心关键词。 (表1)

网站关键词对于网站运营起着重要的作用, 根据重要性与搜索指数, 分为“核心关键词”、“次关键词”、“长尾关键词”。其中“核心关键词”一般布局在网站首页, 搜索指数比其他要多;“次关键词”布局在网站的栏目频道页面或者专题页面, 搜索指数略多;“长尾关键词”布局在网站内容页面, 这类词搜索指数较少, 一般布局在文章页面, 不能因为搜索量少就小看这类词, 一个以万级别的内容页面累计的搜索量是很可观的, 所以一些中大型网站, 更多优化的是长尾关键词。

(三) META标签优化。

按照挖掘“关键词”形成的表单, 我们能够很快地制定出网站的首页和栏目页面。关键词的布局最关键的是网站的META标签的优化。META标签由三个部分组成, title标签、keywords标签、description标签。

1、title标签。

页面的标题用于告诉用户和搜索引擎这个网页的主要内容是什么, 搜索引擎在判断一个网页内容权重时, title是主要参考因子。网站标题的一般写法是包含关键词, “关键词1_关键词2_关键词3_公司名称”。如“打包机”企业, 按照这类标题的写法, 可以写成“打包机_金属打包机_液压打包机_XXX液压机械有限公司”, 优化建议标题的字数不要超过80个字符。网站栏目标题和网站首页标题类似。内容文章页面可以根据长尾关键词扩展出文章标题, 比如:“打包机坏了如何修理”, “金属打包机设计原理”这些词是由搜索指数的, 只不过搜索量较少, 但类似的文章如果达到一定量级的话, 带来的流量是非常可观的。

2、keywords标签。

keywords标签又称“关键词”标签, 就是在标签内写入网页相关的关键词, 让搜索引擎抓取页面的时候, 能够直接提示网页的关键词是什么, 这种快速的识别能够让搜索引擎更加容易抓取页面的信息, 对页面的收录提供直接的帮助, 一般keywords标签内填写不超过100个字符, 需要注意的是不要堆砌关键词。

3、description标签。

description标签又称“描述”标签, 就是用一段话来概况页面的内容, 是对关键词标签的扩展, 让搜索引擎进一步了解页面信息, 有利于页面内容的收录、优化、建议description标签内的内容不要超过200个字符, 并且在内容中出现页面关键词。

(四) 关键词密度优化。

为了让页面的核心内容更容易被搜索引擎抓取、收录、给予更高的权重, 有些站长会在页面中堆砌关键词, 这种堆砌关键词的做法反而起到相反的作用, 所以页面关键词布局到底多少合适, 就是要对关键词密度进行优化。优化建议, 3%~8%之间, 5%最为合适。

(五) 页面优化

1、404页面设置。

404页面是网站优化中比较重要的一个方面, 当你输入一个错误的网址时, 就会跳到404页面, 这时候返回的状态码是404。搜索引擎在碰到类似的问题时, 就不会抓取该页面。如果没有404页面, 不仅会失去浏览者, 而且搜索引擎也一样, 抓取了很多无效的页面, 如果类似的页面数量很大, 这种搜索引擎的体验是非常糟糕的, 对搜索引擎优化非常不利。

2、网页静态化。

动态网页是以.asp、.jsp、.php等形式为后缀, 并且在动态网页网址中有一个标志性的符号“?”。随着SEO的重要性提升, 动态网址不利用SEO, 因为搜索引擎认为, 动态网页的内容一般说都会和数据库相关, 所以搜索引擎就会放弃抓取, 如http://www.xxx.com/news.php?lang=cn&class=1&id=1。所以就产生了网页静态化的功能需求, 将页面网址变成:http://www.xxx.com/a/1.html, 这类页面是真实存在于服务器中的, 静态化页面优点是:一是有利于搜索引擎的抓取;二是有利于网站的稳定性;三是有利于提高速度。

三、结语

搜索引擎优化是一个复杂的系统工程, 涉及的算法众多, 需要不断的加强实践。笔者认为, 搜索引擎的不断优化升级都是为了让用户更好地找到目标内容, 那么在网站设计的时候, 考虑SEO过程中, 站在用户角度考虑, 就能更好地满足搜索引擎优化目标, 因为搜索引擎就是为用户提供优质产品服务的。

参考文献

[1]李福良, 张辉.企业网站SEO技术研究[J].合肥工业大学学报 (自然科学版) , 2004.27.1.

[2]昝辉.Zac.SEO实战密码:60天网站流量提高20倍[M].北京:电子工业出版社, 2011.1.

上一篇:环境作用下一篇:资本和劳动