链接分析法——情报学研究新方法论文

2024-07-08

链接分析法——情报学研究新方法论文(通用2篇)

链接分析法——情报学研究新方法论文 篇1

【内容提要】本文认为链接分析法是网络信息计量学的重要研究方法,是情报学研究的新领域。它完善了情报学方法论体系,丰富了情报学理论,是情报学逐渐成熟的一个重要标志。文章简单介绍了网络信息计量学,并对链接分析法进行了分析。

【摘要题】理论纵横

【正文】

20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(WebmetricsorCybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。网络信息计量学

网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。链接分析法研究现状

2.1 链接分析法的内容

链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。

2.1.1 链接分析法在网络信息组织方面的作用

网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。

2.1.2 链接分析法在网络信息检索方面的作用

链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(AuthorityPage)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(NeighborGraph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。2.1.3 链接分析法在网络信息资源评价方面的作用

传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的。目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大大方便了用户在浩

翰的信息海洋中迅速准确地获得有用的信息,易于操作、实用且可以节省用户的时间,在一定程度上可以弥补同行评议等定性方法的缺陷。

2.2 链接分析法对情报学研究方法的意义

苏联科学家巴甫洛夫说过:“科学是随着研究方法所取得的成就向前的。研究方法每前进一步,随之我们面前也就开拓了一个充满种种新鲜事物的更辽阔的远景。”情报学是一门新兴的综合性边缘学科,是一个开放的综合性知识体系,它善于吸收其它相关学科的知识和研究方法。上世纪60年代后,随着科学的日益发展,科学研究中应用研究、实用研究和开发研究比重逐渐增大,情报学研究方法体系取得了长足进步,表现在:一是情报研究的领域、对象、内容等的扩大和深化;二是现代科学学科与方法的创立和发展。情报学研究方法体系是动态的、发展的。情报学科要想在原有的基础上实现学科研究模式的更新、学科结构的变革和学科体系的拓展,就必须研究和采用新的思维方式和新的研究方法,及时反映最新的学科学术动态和最新的理论学说,移植、借鉴其它学科的研究方法,如哲学方法、数学方法、社会学方法、经济学方法、信息技术方法等来丰富自己的研究方法,并加以创造和大胆创新,不仅引起自身学科结构的变革和深化学科前沿的研究,而且不断发展新的分支学科,促使学科研究充满时代气息。

链接分析法大大拓展了信息计量学在网络环境下的应用,充实了网络信息计量学的内容,是情报学研究的新领域,完善了情报学方法论体系。它是情报学逐渐成熟的一个重要历程碑,标志着情报学理论方法的一个新的飞跃。

2.3 链接分析法目前存在的问题

在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,但是在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(InformationOverload)和信息污染(InformationPollution)现象严重;引用与被引用关系也变得十分复杂;链接分析法的适用范围也是有限的;Internet是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。因此,在使用链接分析法时要充分考虑以上问题,尽大可能保证其结果的可靠性。结束语

由于链接分析法借鉴了引文分析法的方法和思路,是情报学研究方法在网络环境下新应用,目前链接分析法主要实验工具是搜索引擎,但随着网络信息技术如人工智能、网络信息检索、计算机网络、知识挖掘、自然语言处理等的发展,必将为链接分析法的研究和开发应用提供更为有力的支持。情报学也必将充分利用网络信息技术,吸收其它学科的先进方法来深化、完善自己的方法论体系,建立起更为完善的体系结构,从而改变情报学学科的面貌。

【参考文献】徐久龄等.网络计量学的研究.情报学进展1998-1999年度评论,第三卷.北京:航空工业出版社,1999:78-105夏旭等.网络计量学研究:现状、问题与发展.图书馆论坛,2001,(12):44-47邹志仁.论情报研究方法体系.江苏图书馆学报,1990,(2):18-23杨涛.链接分析法存在的问题及改进方法.图书情报知识,2002,(3):62-63刘雁书,方平.Web网站站外链接类型与特征调查-链接分析法可行性研究.大学图书馆学报,2001,(5):65-68邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001,(1):16-17,20邱均平.信息计量学(一).情报理论与实践,2000,(1)邹曼莉.国外网络信息检索的最新进展.图书馆杂志,2002,(2):67-70J.Kleinberg.AuthoritativeSourcesinaHyperlinkedEnvironment.Proc.NinthACM-SIAMSymp.DiscreteAlgorithm,ACMPress.NewYork.1998

链接分析法——情报学研究新方法论文 篇2

农业网站建设是农业信息化建设的主要内容, 随着互联网技术在农业领域的应用, 农业网站建设发展迅速, 政府农业网站作为主要农业网站类型备受关注。本课题组利用中国农业科技信息网等多个农业网站搜索引擎系统进行统计, 截止到2008年7月底, 我国涉农网站已经增至20390个, 西部农业网站总数为2133个, 约占全国农业网站的10%。从国内农业网站的分布来看, 主要集中在北京和沿海省份, 西部地区农业网站数量较少, 且四川、陕西、云南较为集中, 位居前三, 其总和占西部农业网站总数的49%。从农业网站类型数量统计来看, 政府农业网站数量仅次于农业企业网站, 位居第二, 占样本总数的24.1%, 是农业网络信息资源研究的重要资源载体。

由于农业网站内容建设的质量和网站影响力是体现与反映农业网络信息资源利用效率的重要影响因素, 也是评价现行农业网站建设及运行效率的重要参考指标, 应用目前相关测评方法进行检验和实证研究是本课题的重要思路。本文针对西部12省市区, 分别从网络媒体内容、构建质量及网络影响因子进行测度, 借鉴和采纳具有定性特征的信息构建法和具有定量特征的链接分析法, 对政府农业网站进行实证分析。通过考察政府农业网站的IA和网络影响水平的实证结果, 对相关测评方法的应用及指标选择进行初步分析。

一、网络媒体评价研究的主要特点及方法

网络媒体评价研究的发展过程有两个特点:[1]一是将网站信息内容和信息组织结构评价作为网站评价的重要模型和方法, 认为信息是网站评价的最主要对象, 对信息的评价分为对信息内容和信息组织结构的评价, 含有对网络信息资源的评价内容, 如信息构建 (Information Architecture, IA) 法, 该方法是关于如何组织信息以帮助人们有效实现其信息需求的一门艺术与科学。目前, IA已成功地应用于Web网站的设计和建设质量评价。评价要素有:组织系统、全局导航系统、局部导航系统、语境导航系统、补充导航系统、检索系统和标识系统, 每一要素下又设有若干个考察指标。有关文献[2][3]主要利用该方法对南京大学网站及政府网站进行了测评, 提出和建立了IA评价的指标及相关权重。另一个特点是网络媒体评价更加注重网络媒体的影响力和用户行为效果, 其中链接分析法应用最多。该方法主要从网站运营及相对影响力角度, 广泛采纳从网络信息计量学出发的链接 (Link) 分析和与之相关的网络影响因子 (WIP, Web ImPact Factor) 测度。其评价依据是, 一个网站被另一个网站所链接是对该网站的赞许和利用, 可以反映网站的影响力大小。也有文献[4][5][6]从链接分析方法的可行性入手, 应用链接分析指标对大学网站及政府网站予以测评, 方法可用性得到证实。

二、研究方案的设计

1.从网站信息内容及组织结构评价角度

本文借鉴信息构建法, 并利用相关文献[2]中有关IA评价指标体系, 对检索系统、标识系统等指标权重根据农业信息服务特点进行了适当调整, 确定相应权重。

2.链接分析及检索工具选择

许多著名的搜索引擎都能检索某一网页的被链接情况, 可直接用于检索链接关系。Fast Search (http://www.alltheweb.com) 检索功能最全, 高级检索中的各项限制功能都可与链接检索式联合使用, 支持的语言最多, 同时支持中文简、繁体检索和显示, 检索结果的数量最大, 而google无法区分站外链接。故本文利用Fast Search工具对西部各省政府农业网站相关链接指标进行采集, 计算出相应网络影响因子, 并利用ALEXA流量工具对各网站的网络排名PR值 (Page Rank) 进行测定。

3.研究对象的选择

由于课题研究需要, 本文依据第二次全国农业普查主要数据公报的分类方式, 确定西部12省市区 (包括重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆、内蒙古自治区、广西壮族自治区) , 研究对象主要针对各省级政府农业网站。

三、研究指标的确立

1.IA评价指标体系选择

本文借鉴相关文献[2]确定IA评价指标, 并针对农业网站的一般特点确定相应权重, 如农业网站更强调内容的丰富性、实用性, 同时从易用性角度更强调检索系统的方便灵活性等, 对检索系统、标识系统等指标权重适当修改, 指标体系共计15个指标, 权重设置如表1所示。

IA计算:IA总分采用十分制, 评分等级为:2、4、6、8 、10 五个等级 (其中, 2为非常糟糕;4为比较糟糕;6为一般;8为比较好;10为非常好) ;计算公式:undefined (其中S为总分, λi为一级指标权重, λij为二级指标权重, Sij为二级指标得分, m为一级指标数量, n为二级指标数量) 。

2.链接分析指标选择

本文链接分析指标主要选择网站网页数、总链接数、站内链接数、站外链接数。其中, 总网络影响因子WIFtotal=总链接数/网页总数, 外部影响因子WIFex=站外链接数/网页总数, 内部影响因子WIFin=站内链接数/网页总数。通过这几个指标的测算, 反映出各网站的利用效率及相对影响力。

四、数据处理与分析

根据信息构建分析的相关指标体系, 分别选择本课题调研的相关农业信息需求用户 (含个体农户、政府机关工作人员、涉农企业人员等) 24人 (课题总调研用户数达475人) , 分别针对外省政府农业网站进行匿名打分, 各指标采用均值取整, 最后根据权重得出各网站IA总分值, 并进行网站排名。利用Fast Search检索12个农业网站的相关链接指标, 用ALEXA流量工具观测PR值 (采集时间为2008年8月21日) , 并分别计算出相关影响因子, 也进行排名。相关计算及排名结果见表2。

如表2所示, IA分值排在前四位的分别为宁夏、云南、青海、四川, 排在后两位的为陕西和西藏。IA总分高的网站从内容组织设计、全局导航、网站功能建设角度均表现出较高的水平。从链接分析总影响因子排名看, 排在前四位的为四川、云南、甘肃、宁夏, 排在后两位的为陕西和重庆, 但重庆市网页总数及网站排名均靠前, 与链接分析结果存在一定矛盾。从两种分析方法的排名来看, 四川、宁夏均列入前四位, 排名结果有一定一致性。

总影响因子排名, 可以从一定程度上反映出网站内容的吸引力及网站的影响力, 但与网站信息构建、网站排名结果存在差异性, 说明两种评价方法侧重不同。为了更好地发现指标间的关联关系, 利用spss10.0分别对西部各省农业网站的PR值、总网页数 (PAG) 、总网络影响因子WIFtotal、外部影响因子WIFex、信息构建指标IA值进行两两相关性检验, 得出相关性如表3所示。

**Correlation is significant at the 0.01 level (2-tailed) .

从表3可以看出, 总网络影响因子WIFtotal和外部影响因子WIFex表现出较强的相关关系, 相关系数达0.851, 且检验值低于显著性水平0.01;信息构建因子IA与总网络影响因子WIFtotal呈现正的弱相关, 相关系数为0.463;而总网页数与网站排名PR值呈现负的弱相关性, 相关系数为-0.410, 说明两个影响因子均可对网站的影响力及传播效果进行评价, 网站的内容及质量在一定程度上影响网站的影响力及知名度;而网页总数与信息构建因子呈现正的弱相关性, 相关系数较小为0.119;从网站排名与各指标关联来看, 相关性很小, 这种表现结果可能与不同的网站排名工具及排名算法有关。

摘要:西部政府农业网站利用效率是目前网络信息资源管理的重要研究内容之一。本文结合链接分析及信息构建方法对西部12省市区政府农业网站进行定性、定量及指标相关性分析, IA分析结果排序在前四位的分别为宁夏、云南、青海、四川;链接分析指标能反映网站的影响力及流行度, 但不及网站的质量及内容组织对网站的排名影响大。

关键词:信息构建,农业网站,链接,评价

参考文献

[1]贺婷婷.国内外网站评价研究比较及分析[J].图书与情报, 2006, (05) .

[2][7][8]杜佳, 朱庆华.信息构建在网站评价中的应用——以南京大学网站为例[J].图书资料工作, 2004, (06) .

[3]甘利人.IA应用研究——我国政府网站考察与评价[J].情报理论与实践, 2003, (06) .

[4]沙勇忠.中国省级政府网站的影响力评价[J].情报资料工作, 2004, (06) .

[5]吕俊生.网上信息资源的链接分析研究[J].情报科学, 2005, (01) .

上一篇:晒稻小学作文下一篇:梅西大学农科研究生文凭园艺专业学术要求