科学知识图谱

2024-05-12

科学知识图谱(精选8篇)

科学知识图谱 篇1

前言

在知识地图与科学知识图谱的应用过程中, 二者有相似之处, 如不对它们进行辨析和界定将会给用户带来一定的困惑及造成概念使用时的混乱。

1 知识地图与科学知识图谱的概念

1.1 知识地图的概念

“地图”是一个以二维或三维空间形式显示地形和人类活动及相关特征的地理学概念, 知识地图最初是表现科学技术活动与知识的地理分布状况的地图。台湾地区的研究者们也将知识地图叫做知识分布图或知识映射图, 相应的英文为“Knowledge Map”。

知识地图的本质是作为知识管理领域的一种工具与技术。知识地图的概念最早由情报学家布鲁克斯在其经典著作《情报学基础》中正式提出。可视化地显示可获得的信息及其相互关系, 它促使不同背景的使用者在各个具体层面上进行知识的有效交流和学习。在这样的地图中包括的知识项目有文本、图表、模型和数字。从两个方面来进行定义, 从知识地图所包含的内容, 通过知识资源调查所获取的知识资源目录和目录内各知识款目之间的关系;从知识地图的功能, 知识目录和领域专家的导航系统, 是一个向导, 它指向的是知识源和知识库;知识地图不仅是知识的存储地, 而且还揭示知识之间的关系。

目前研究的知识地图就是对组织知识资源总体分布情况的可视化描述, 包括组织知识资源的存在情况及其载体, 以及资源之间可能存在的联系。实质上就是利用现代信息技术制作的组织知识资源的总目录和各知识条目之间关系的综合体以及组织专家的导航系统, 是利用构造地图的方法将各类知识资源中的知识关联起来, 使之成为一个网络[1]。

1.2 科学知识图谱的概念

“图谱”是一个图像, 以一定空间形式在一定时间范围中展现与变化的系统概念。知识图谱英文为“Mapping Knowledge Domain”, 从字面可看出其是对知识领域进行映射即以可视化的手段对知识进行展示。

国内研究科学知识图谱的领军人物刘则渊对科学知识图谱定义为可视化地描述人类随时间拥有的知识资源及其载体, 绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系, 在组织内创造知识共享的环境以促进科学技术研究的合作和深入[2]。

科学知识图谱是显示科学知识的发展进程与结构关系的一种图形。它是以科学知识为计量研究对象, 所以属于科学计量学的范畴。它以数学方程式表达科学发展规律的基础上, 进而以曲线形式将科学发展规律绘制成二维图形时变成为最初的知识图谱。科学计量学奠基人普赖斯是科学知识图谱的早期开拓者。随着科学计量学的发展, 描绘科学知识和科学活动规律的数学模型, 逐渐从二维空间模型发展为开始运用三维空间模型, 科学知识图谱也相应地从简单的曲线图发展为较复杂的三维立体图。著名德国科学计量学家克雷奇默关于科学合作的三维空间模型研究, 大大地推动了科学知识图谱的发展。因此, 知识图谱绘制是科学计量学的发展与创新。

科学知识图谱是用可视化技术描述知识资源及其载体, 挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。具体来说, 知识图谱是把应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合, 用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构的多学科融合的一种研究方法。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来, 揭示知识领域的动态发展规律, 为学科研究提供切实的、有价值的参考。

2 知识地图与科学知识图谱比较

2.1 知识地图与科学知识图谱的研究进展

经过几十年的演化, 知识地图已经大大扩大了传统地理图的概念, 知识地图作为一种知识管理工具能够整合组织中的零散知识, 提供概览组织知识结构和获取知识的统一界面, 通过对这些知识的管理、重用和共享使知识组织具有持续创新发展的动力。知识地图的研究已由先前侧重探讨它的类型和功能及其构建原则和方法, 转向了实际构建技术和应用研究。

科学引文与科学知识图谱ISI的创始人, 加菲尔德推动了代表学术共同体的多学科数据库—SCI的发展。60年代早期, 加菲尔德等人开始了基于引文数据的开拓性研究并绘制了DNA研究领域的历史发展图谱。1965年普赖斯运用相同的数据在他的论文中进行了知识图谱绘制的开创性工作。以引文分析为基础的“知识图谱”理论与方法应运而生[3]。信息可视化是受信息检索领域的研究大大推动的, 美国信息研究所提供的引文数据库使引文结构的大样本统计分析越来越便利, 知识图谱已成为科学共同体结构与发展研究的主流方法广泛应用于很多学科领域。知识领域的可视化是通过三维空间来显示各知识领域间的关系, 它旨在揭示由科学文献和引文路径的复杂交织所反映出的科学主流。1994年图谱概念介绍, 指出一系列历时代排列的序列图谱可以用于发掘科学前沿, 各领域科学家能够利用这类图谱预测一个学科的发展趋势, 以及图谱中显示出该领域的研究现状及内容。

2.2 知识地图分类与科学知识图谱的学科

Eppler从知识地图的功能、知识地图展现的图形形态、知识地图的内容、知识地图的应用层次及知识地图的构建方法角度对知识地图进行了系统实用的分类。归纳起来主要按功能分类如下[4]: (1) 概念型知识地图, 用于协助检索、主题学习、分类编目等工作分流; (2) 流程型知识地图, 用于实务的确认、制造作业、工程设计等工作; (3) 职称型知识地图, 用于协助企业组成项目团队、远程教学等。

科学知识图谱研究是一个以科学学为基础, 涉及应用数学、信息科学及计算机科学诸学科交叉的领域, 是科学计量学和信息计量学的新发展。其基本原理是分析单位 (科学文献、科学家、关键词等) 的相似性分析及测度。根据具体不同的方法和技术可以绘制不同类型的科学知识图谱。

2.3 知识地图与科学知识图谱所描述的对象

知识地图描述的对象, 是指知识地图所服务的人群。明确客户对象以后, 就可以在构建之前对知识地图服务对象的主要特征、使用需求和使用习惯进行深入分析。精准的定位有助于根据服务对象的使用习惯设计查询入口, 确保用户使用方便。

科学知识图谱描述的对象[5]主要包括:1) 、从事科学技术活动和作为知识载体的人, 包括科学家、技术专家、项目组、实践团体或某一知识领域共同体;2) 、显性或编码化的知识, 如论文、专利、所学课程、数据库或类似的应用等;3) 、过程或方法, 包括研究问题和解决问题的过程或方法、组织的业务流程, 以及相关的知识投入等。

2.4 知识地图与科学知识图谱的构建

知识地图的研究已由探讨性研究转向实际构建技术的研究。知识地图的构建是一项复杂的系统工程, 它需要结合知识管理、社会学、数据挖掘和人工智能等领域的知识。唐钦能通过对相关文献的总结认为基本的知识地图模型由3层构成, 下层是资源层、中间是描述层、上层是知识地图层。

科学知识图谱所采用的方法主要有引文与共被引分析、共词分析、多元统计分析、词频分析、社会网络分析等;所运用的软件有引文分析软件 (Bibexcel、Citespace、Histcite) 多元统计分析软件 (SPSS) 、词频分析软件 (W o r d s m i t h T o o l s、Word Stat、Pajek、Ucinet、Netdraw) 等;应用这些不同方法和软件进行一些研究分析。

2.5 知识地图与科学知识图谱的应用

知识地图是一张表示企业组织有哪些知识及其方位的图片, 它是知识存在位置的配置图, 知识地图是利用现代化信息技术制作的企业知识资源的总目录及知识款目之间关系的综合体;知识地图可以是某个部门或某个成员拥有什么知识的导览, 也可以是在何处可得到何种信息的查询系统。它描绘一个组织系统中的知识存量、结构、功能、存在方位以及查询路径等。知识地图主要应用组织知识管理、线上虚拟社群管理和教育学习等方面。

科学知识图谱正在得到广泛应用, 目前应用于科研、教学以及社会学。科研用于文献、专利的结构分析;学科动态、社会网络、领域发展分析等。

3 知识地图与科学知识图谱的联系

3.1 知识查找与知识资源管理

对知识组织中各种知识资源、知识载体、人员及其相互间的联系, 知识使用者查找所需知识以促进知识的共享与重用。

能够自动将学科的知识单元进行关联, 以图形化链接的方式实现知识检索的拓展和关联收集显示本学科各类来源文献, 利用文献间的复杂引用联系建立显性知识的排序和关联;通过作者发文、共引、共用主题词等关系揭示学科专家学者等隐性知识之间的联系, 实现对学科隐性知识的检索和浏览。

3.2 科学知识图谱是知识地图的高级形式

随着信息技术的迅速发展, 知识地图进入了电子时代, 在Internet和Intranet上普遍使用的超文本链接和应用链接就是知识地图的形式。很多绘制知识地图的工具, 如Lotus Notes、IBM的Knowledge X和微软的Visio等, 它们都是基于数据库来绘制知识地图, 有利于知识地图的动态更新和扩展。由于信息技术的发展, 知识地图突破局限于描述知识地理分布的知识地图界限而逐渐演化为含义与内容更加广泛的科学知识图谱。可以把知识地图作为科学知识图谱的一种形式。

4 结语

科学知识图谱在实际应用中多用于揭示学科或领域研究热点和知识演进趋势, 揭示科学研究的社会网络关系, 一般它并不提供与知识资源进行关联以方便使用者快速地获取, 这点是它与知识地图应用目的的区别所在;科学知识图谱在学科领域中比知识地图更能揭示知识之间的联系及知识的进化规律。

摘要:从知识地图与科学知识图谱的基本概念入手, 对它们的分类、进展、对象、构建和应用作了比较, 并描述它们的联系以及不同。

关键词:知识地图,知识图谱,辨析

参考文献

[1]秦长江, 侯汉清.知识图谱——信息管理与知识管理的新领域[J].大学图书馆学报, 2009, (1) :30-37.

[2]刘则渊, 陈悦, 侯海燕, 等.科学知识图谱:方法与应用.北京[M]:人民出版社, 2008.

[3]陈悦, 刘则渊, 陈劲, 等.科学知识图谱的发展历程[J].科学学研究, 2008, 26 (3) :449-460.

[4]廖宇峰.国外知识地图研究现状和展望[J].新世纪图书馆, 2009, (3) :80-83.

[5]刘则渊, 王贤文, 陈超美.科学知识图谱方法及其在科技情报中的应用[J].网络环境下的信息分析与情报研究专刊, 2009, (10) :14-35.

科学知识图谱 篇2

摘 要:知识图谱是在思维导图的基础上,把更长时间段内的知识点融会贯通,将多张思维导图联合起来,可以展示地理学科知识的核心与组织方式。它是教师总结自身对于地理知识的理解,并与学生探讨交流的极佳方式。

关键词:知识图谱;思维导图;初中地理

思维导图本质上是使用形象化的联系图表达知识结构、理顺知识逻辑、形成知识体系的工具。由于其作为教学手段时,新颖独特、形象生动,近年来被广泛地应用到各个学科的实际教学中。初中地理学科知识点多,但各知识点有组织、有内在联系,将思维导图工具引入地理学科教学可以加深学生理解记忆,有效提高教学质量。

而知识图谱最早出现在管理学领域,后来主要集中在信息科技领域和图情领域,现在慢慢向其他学科发展。陈悦和刘则渊将知识域可视化最终呈现的图形称为“知识图谱”,认为知识图谱是显示科学知识的发展进程与结构关系的一种图形,并将知识图谱定义为可视化地描述某一学科/领域知识资源及其载体,绘制、挖掘分析和显示知识以及它们之间的相互联系,创造知识共享的环境,以促进科学技术研究的合作与深入的工具。其“显示知识的结构关系”与“可视化地描述知识”的特性,与思维导图不谋而合,其更加宏大的视野(整合学科乃至知识领域的知识资源)启发我们:可以通过整合、联系多张思维导图的方式,得到跨度更长、知识点覆盖面更广的知识图谱。例如,半个学期的思维导图形成知识图谱,有助于对这半个学期的地理学习形成整体认识。以中国的地形、气候、河流结合知识图谱,并使用软件xmind为例。

对于传统的思维导图来说,会把地形与地势、气候、河流与湖泊、自然灾害划分成四个思维导图来记忆,这样会导致在回顾知识点时,没有宏观的体系结构概念,容易遗忘部分重要细节,而如果先用大的框架将四个思维导图聚合在一起,则更容易让学生把握整个章节的脉络。

由此及彼,我们可以把所有零碎的思维导图都根据相同的节点之间聚合为一个统一的知识图谱。并且可以不断补充,虽然是宏观层面的图谱,但只要不断完善每个子节点,则可以变成一幅完备详尽的知识图谱。图谱的每个圆圈代表一种层级结构,按照概念的层级结构,我们则可以按照统一的方式来梳理我们的知识架构。

这样有利于将知识点按照概念的抽象程度划分,统一成一张图谱,有利于知识脉络的梳理和培养学生的抽象思维能力。加强知识的内在联系,在宏观层面我们更容易联想到不同知识点的串联或者因果关系,起到由此及彼的推理作用。?魍车乃嘉?导图对于层级的划分没有限定,往往是不同的章节有不同的写法,容易使得学生记忆思维导图出现偏差错漏,如果能将层级划分的方式统一固定下来,按照更为科学合理的方式进行组织,则事半功倍。

参考文献:

[1]孔桂飞.“画”出地理好成绩――思维导图在初中地理教学中的运用[J].基础教育.[2]刘建秀.思维导图在初中地理教学中的实践研究[J].中国校外教育,2017(05).[3]贺巧莲.浅析思维导图在高中地理教学中的应用[J].中国校外教育,2014(12).[4]知识图谱研究的脉络、流派与趋势――基于SSCI与CSSCI期刊论文的计量与可视化[J].中国图书馆学报,2015,05(41).作者简介:

科学知识图谱 篇3

1 研究方法及数据来源

信息可视化技术(Information Visualization)是科学计量学的一个新兴领域,科学知识图谱[2,3](Scientific knowledge mapping,简称知识图谱)是信息可视化技术的一个分支,该技术在信息技术的推动下,综合应用了数学、图形学、信息可视化技术、计算机科学等学科的理论和方法。2004年,美国德雷克塞大学信息技术学院陈超美教授(Chaomei Chen)基于引文分析理论,应用Java语言开发了CiteSpace信息可视化软件,成为近几年来在美国信息分析中最有特色和影响力的可视化信息软件。本文利用CitespaceⅡ软件通过合理设置引用(citation)、共被引(co-citation)及共被引系数(co-citation coefficient)的阈值,绘制出较直观的、容易理解的搜索引擎研究领域的知识图谱。

本文的数据来源是美国科学信息研究所(ISI)网络数据库Web of Science 的科技信息检索工具《科学引文索引》(SCI-Expanded),通过主题词“search engine”共检索到2,387篇有关搜索引擎的文献,其时间区间为1999—2010年,每条记录内容包含作者、机构、摘要、关键词、年份、期(卷)及参考文献等。下面从搜索引擎领域的文献着手,通过信息可视化技术,考察近十几年来搜索引擎领域的主要研究内容和发展趋势。

2 分析与结果

2.1 国际搜索引擎领域的学术研究概况

首先统计了1999~2010年搜索引擎领域2387篇文献的历年发文数。国际上有关搜索引擎的论文逐年增长,1999年共发表103篇SCI论文,2009年为303篇,增长近3倍。表明该领域的研究正在不断加强,有望发展为国际上学术研究的热点。

2.2 搜索引擎研究热点国家(地区)

从事搜索引擎研究的作者分别来自四大洲的62个国家或地区,通过对研究国家的统计,可以反映不同国家在该领域研究的状况。各大洲作者的被引频次依次为美洲984、欧洲543、亚洲396、大洋洲100,统计数据表明各地区研究的不平衡。搜索引擎研究的热点国家主要位于北美、西欧和东亚三个当前世界经济发展繁荣的地区。在所有作者中,来自美国的作者被引频次最高,达到866次,占总数的36.28%,充分显示出美国在搜索引擎研究领域的核心地位,其他依次是英国、中国、德国、日本、加拿大等。图1显示了他们彼此之间的关系。表1列出了该研究领域各国(地区)所处的位次。

2.3 搜索引擎最具影响力的作者

一篇论文被引次数的多寡,是该篇论文在学术界产生的影响和占有之地位的客观测度[4]。据统计被引两次以上的作者共有6543位,前五位作者为搜索引擎研究领域最具影响力的权威专家(见表2)。英国科学家塞沃尔(THELWALL,M)是被引频度(30)最高的专家,中心度为0.1,中心度表示合作者的多少,合作者越多,中心度越高,他从情报学的视角系统阐述了链接分析的理论、方法与应用。该方法应用广泛,主要体现在网络信息检索、网络计量学、数据挖掘、Web结构建模等方面。链接分析算法已经显现出了巨大的商业价值,是谷歌的核心算法之一。斯平克博士(SPINK,A)是匹兹堡大学信息科学领域的教授,她着重于理论与应用研究,模拟人类信息行为、网络研究以及互动认知信息检索等方面的研究。詹森(JANSEN,BJ)是宾夕法尼亚大学教授,《搜索引擎研究与框架》是其代表作。朱迪特巴尔伊兰教授的研究领域是信息计量和信息检索,其代表作有“Search Engine Results over Time-A Case Study on Search Engine Stability”。侯赛因(OZMUTLU,HC)和赛达(OZMUTLU,S)教授研究用户内容查询,应用遗传算法和Dempster-Shafer理论,成功开发了根据用户设计高效信息检索算法的搜索引擎,代表作有“Using Monte-Carlo simulation for automatic new topic identification of search engine transaction logs”。

2.4搜索引擎研究核心期刊

检索文献的网络分析表明,被引用的相关期刊共1070种,其中被引用不少于2次的有414种。期刊被其他期刊引用越多,说明该期刊的影响力越强,依据被引频次高低和相互联系,绘制出搜索引擎领域的核心期刊知识图谱(见图3),处于核心地位的期刊和其它期刊的联系越多,影响力越大;被引频次越高,名次越靠前。该领域的十大核心期刊可见表3。作为全球最权威的顶级期刊之一,“NATURE”在搜索引擎研究领域被引频次(310)最高、中心度(0.6)最大,是该领域最具影响力的核心期刊;“SCIENCE”、“LECTURE NOTES IN ARTIFICIAL INTELLIGENCE”、“INFORMATION PROCESSING & MANAGEMENT”三种期刊仅次于“NATURE”,影响力处于第二核心等级;“NUCLEIC ACIDS RESEARCH”、“ONLINE INFORMATION REVIEW”“BMC BIOINFORMATICS”、“BIOINFORMATICS”、“JOURNAL OF INFORMATION SCIENCE”、“ACM TRANSACTIONS ON INFORMATION SYSTEMS”6种期刊影响力弱于前四种期刊。

2.5 搜索引擎研究内容

将检索得到的2387条文献数据导入CiteSpace II软件中,网络节点选为参考文献(reference)和主题词,调节相应的阈值。经过CiteSpace II软件的分析和处理,得到了搜索引擎领域研究内容的知识图谱,如图4所示:

从该图谱中可以看到,搜索引擎研究的专题聚集特征较为明显。对2387篇文献涉及的研究内容进行细分:在2387篇论文当中,(1)关于搜索引擎原理的有433篇,搜索引擎的基本原理是搜索引擎技术继续发展的基础,搜索引擎是一种在网络环境进行信息检索的软件,其研究范围不仅涉及到本身的技术组成,还包括所处的网络环境的特点[5],因此,只有深入研究两者的特点及联系,才能提升对搜索引擎深入发展的清晰思路。(2)关于搜索引擎类型与功能的有426篇,元搜索引擎和垂直搜索引擎(专业搜索引擎)是研究的一大热点。传统搜索引擎存在许多无法克服的缺点,如:查询结果无法覆盖全部网络信息、检索结果没有针对性、准确率低、检索结果重复性高等。元搜索引擎没有自己的爬虫程序,它通过检索界面接受用户的查询请求,在检索时调用多个其他独立的搜索引擎,将查询的结果经过去重后以统一的格式集中显示,这种方式增加了检索的范围,检索结果覆盖率显著增加,起到了整合网络资源的功能。垂直搜索引擎专门用来查询某一学科或主题的信息,将网页库中的某类信息进行一次整合,经过去重、分类、索引等技术处理,最终以非结构化的方式和结构化的方式返回给用户。目前研究的热点是结构化信息提取的算法、垂直网络蜘蛛的设计等。(3)关于搜索引擎发展趋势的有252篇,随着人工智能技术的发展,搜索引擎最新的研究逐渐走向智能化、个性化、专题化、集成化。如被定义为基于语义的搜索引擎kngine[6],该系统尝试理解句子含义,但是与人脑的认知技能还有很大差距,这方面的工作有待突破。(4)关于搜索引擎应用的有79篇,搜索引擎在互联网发展的今天越来越显示出来“新门户”的特点。目前,搜索引擎在商业和其它领域的应用已经达到了相当的规模,巨大的商业价值及应用前景不断刺激着搜索引擎向其他领域渗透。如搜索引擎在电子商务中的应用、在图书馆个性化信息服务中的应用、在科技查新中的应用、在教学中的应用等等。搜索引擎以其独有的优点,如搜索速度快,范围广,时效性强等,在不同领域中扮演了越来越重要的角色。(5)有关搜索引擎的算法有49篇,其中所论及的网页索引、分类、排序、去重等算法都是提高搜索引擎质量的重要技术。网页索引技术一般采用倒排索引,Glimpse[7]认为倒排索引技术在大型文本数据库中进行快速查找有很好的综合性能。目前该技术分三种类型:即完全倒排索引、倒排文件索引和块地址索引,设计高性能的网页索引算法是当前的研究热点之一;由于网页正文的游离性和网页结构的复杂性,所以网页分类非常复杂,Furnkranz、Slattery、Joachim等人提出的分类算法从不同角度提高分类性能,但也存在明显缺陷;Page和Sergey Brin提出的PageRank算法[8]是经典的网页排序算法,目前在该领域的研究多集中于对算法的改进,还没有形成重大理念突破;为提高搜索引擎的检索效率,减轻用户负担,识别和消除返回结果中存在大量重复网页是一个有效途径,目前该领域主要的算法有Charikar的Simhash算法、Broder等的Shingle算法和I-Match算法等。(6)关于搜索引擎评价的有35篇。全面、客观、公正地评价搜索引擎系统,不仅为用户选择搜索引擎提供科学依据,而且可以促进搜索引擎技术的提高,Angel L提出了8条标准[9];H.Vernon Leighton和J.deep Srivastava将查准率和查全率引入搜索引擎评价标准[10];Bell提出了以用户为中心的评价标准[11]等等,基于评价标准建立在不同的指导原则上,因此至今还没有形成一个客观、统一的评价标准。笔者认为,统一的评价标准的确立有助于该领域健康快速的发展。其他研究内容还涉及:搜索引擎的知识产权问题、检索结果的组织技术、检索界面设计等等。从论文研究内容的分布看,综合性研究论文的数量远远超过专门领域的研究论文数,说明搜索引擎的研究还有待进一步向深层次发展。

2.6 研究搜索引擎的学科

搜索引擎是一种对互联网上的信息资源进行搜集、整理、标引、存储,然后供用户查询的系统,所以具有综合性和挑战性[12]。检索到的文献分别从不同的角度对搜索引擎进行了研究(如图4)。目前,主要从事搜索引擎研究的学科是计算机科学(Computer Science),如图5,该领域发表的文章有609篇,占全部文献的1/4,充分反映了该学科研究搜索引擎的学科优势;其次是信息科学和图书馆学(Information science and library science),发表文章399篇,占16.7%,该领域从信息本身的特点以及文献之间的关系来研究搜索引擎,具有得天独厚的优势,当前,搜索引擎中许多算法思想来自于信息科学和图书馆学,例如:pagerank算法、超链分析等;第三大领域是人工智能(Artificial Intelligence),发表文章有277篇,占12.6%,是当代搜索引擎研究的焦点领域,通过数据挖掘,将隐性知识转化为显性知识,致力于开发智能搜索引擎和个性化搜索引擎;其他学科有:电子学、生物化学、分子生物学等等。可见,搜索引擎研究不仅与计算机科学有关,还涉及信息科学与图书馆学、电子工程学以及分子生物科学等学科。其研究成果同样可应用于各领域。总之,搜索引擎研究是计算机科学与其他学科相互交叉、渗透和融合的综合性学科。

3 研究结论与展望

3.1 结论

综上所述,以搜索引擎领域的2387篇SCI论文为研究对象,第一,考察了研究该领域的热点国家,从以上分析可以看出美国在论文数量和影响力上,都有无可争议的巨大优势;中国在论文总量上位居第三,但总体质量(被引次数)上略为落后,国际交流上略为逊色,总体来说,美国和西欧在该领域的贡献较大,在各个方面都领先于其他国家和地区。第二,考察了刊载这些论文的学术期刊和研究搜索引擎的学科分布,表明该领域是计算机科学与信息科学、图书馆学、电子工程学等学科相互交叉、相互渗透和相互融合的综合学科,但搜索引擎研究的主体领域属于计算机科学。刊载该领域文献的期刊共有1070种,其中被引用不少于2次的有414种。第三,运用动态网络分析CiteSpace软件对搜索引擎研究状况、研究群体进行了可视化分析,总的来看,美国的高校研究者重视和IT行业的合作,将理论研究产业化,实践又反过来推动理论的创新。

3.2 展望

第一,智能搜索引擎的开发。用户在搜索引擎上进行信息查询时,并不十分关注返回结果的多少,而是看查询结果是否和自己的需求相吻合。对于一个查询,传统的搜索引擎动辄返回几十万、几百万篇文档,用户不得不在结果中筛选。怎样使搜索引擎更加简约地查询到用户需求的信息,是今后智能搜索引擎研究开发的方向。第二,加强和多学科合作研究。搜索引擎是一个综合性的研究课题,只有和各学科合作取长补短,才能使该学科迅速发展。第三,重视交叉语言检索的研究和开发。交叉语言信息检索是指用户用母语提交查询,搜索引擎在多种语言的数据库中进行信息检索,返回能够回答用户问题的所有语言的文档。

科学知识图谱 篇4

Cite Space是美国Drexe1大学陈超美博士开发的基于JA-VA平台的、应用于科学文献中识别并显示科学发展新趋势和新动态的可视化软件。Citespace利用“研究前沿术语的共现”、“知识基础文章的同被引”和“研究前沿术语引用知识基本文章”三个网络随时间演变的情况来找寻研究热点及趋势, 并以可视化的方式展示出来。知识图谱是以科学学为基础, 涉及应用数学、信息科学及计算机科学诸学科交叉的领域, 是科学计量学和信息计量学的新发展[1]。随着统计分析、引文分析和网络分析方法在科学计量学领域的广泛应用以及计算机图形学和可视化技术的发展, 知识图谱研究在20世纪90年代以后得到迅猛发展[2]。知识图谱在其发展过程中, 功能也在不断地丰富和完善。

《体育科学》 (月刊) 创刊于1981年, 由国家体育总局主管, 中国体育科学学会主办, 是中国体育科学学会会刊。是中文体育类A类核心期刊, 中国人文社会科学核心期刊, 是国际体育文献数据库收录期刊。通过citespace对《体育科学》中文章进行引文摘要数据网络分析, 分析体育学科研究力量分布, 探测学科知识基础。

2 数据来源与数据处理

CSSCI数据库, 它不仅收录文献质量较高, 而且具备检索结果的套录功能, 特别是其具有可以自动抓取参考文献的功能 (国内其他数据库均不具备此功能) , 为各种共被引分析奠定了基础[3]。进入中文社会科学引文索引检索界面, 选择“来源文献”按钮, 并在刊名处输入“体育科学”, 得到所有被收录的3089条文献条目。检索时间为2015年11月13日, 下载从2005~2015年近10年的题录数据, 存储文件格式为文本文件。研究数据的时间跨度对知识图谱的构建具有实质性影响, 不同时间跨度的数据构建出的知识图谱往往具有较大的差异。由于2015还未完整, 但其数据仍具有分析价值, 所以选择2015年前5期收录文献, 共计1803篇。通过筛选, 最终确定文献1709篇。

3 分析与结果

3.1 研究机构分布

将处理完毕的数据导入CitespaceⅢ, 选择时区 (time slicing) 从2005至2015, 时间切片为1, 即每1年为一个时区;阈值选择为Top 30, 即在每个时区中选择前30高频出现的节点;剪枝方式的选择为寻径 (Path Finder) , 其可以简化网络并突出重要的结构特点且具有完备性 (唯一解) ;节点类型 (node types) 选择机构 (Institution) , 点击“GO”进行可视化分析, 得到可视化图谱, 如图1显示。《体育科学》的文章主要来自国家体育总局、北京体育大学、上海体育学院、华南师范大学体育科学学院等。结合表1, 从各个节点的发文频次看, 国家体育总局体育科学研究所文献贡献率最大, 是目前唯一一所科技部保留和发展的国家级、公益类、多学科、综合性的体育科学研究事业单位。多年来围绕国际体育科学前沿领域和未来体育运动发展中的重大科学技术问题, 开展综合性和前瞻性研究, 是我国体育科研领域的领军者[4]。除此之外, 从图一也可以得出, 《体育科学》的研究机构分布相对比较分散, 有很多机构为孤立的点, 部分本区域间机构的合作较为密切, 但与其他机构联系较少。

如表2所示, 近10年来, 研究机构发文量突增率最高的两所机构分别是宁波大学.体育学院、华南师范大学.体育科学学院。两所机构在近些年中发文量具有较大突破, 成为《体育科学》中新兴的科研力量。以宁波学院为例:虽然该机构从2009年发文量才有所初现, 但是在近六年的时间内, 发文量达18篇, 且在2012年内发文量达6篇, 这在非专业体育院校中还是比较罕见的。说明其具备较强的科研能力, 科研势头较猛。

3.2 作者分析

CitespaceⅢ软件界面, 节点类型 (node types) 选择作者 (Author) , 其他选择策略不变, 运行CitespaceⅢ得到有关作者的聚类图谱。表3列举了2005-2015 (5) 《体育科学》中发文量排在前十的作者。结合图3可知:这些高产作者均是我国体育研究领域的学科领军人物或者相关领域研究的知名学者。检索CNKI数据库, 对核心作者发表的代表性论文进行分析以确定核心作者的重点研究领域。胡杨主要从事运动员低氧训练及基因选材研究与教学工作, 提出了运动员低氧训练的新模式———高住高练低训, 设计出具有国际先进水平的低氧训练中心, 建立了国际上首个优秀运动员基因库和永生细胞库, 发现了一批国际上至今没有报道过的可以用于运动员选材的基因标记。王进主要从事竞赛心理学和休闲心理学的研究。其中压力的技能表现和“Choking”现象的探索为标志性研究。田野主要研究运动性疲劳的机理与防治研究;大众运动健身的理论与方法。这些核心作者使得《体育科学》中发表的文章质量极高, 代表着某些领域的前沿性研究, 足以彰显《体育科学》的权威性。从图3可以看出:核心作者分布并不是单独孤立的点, 而是以小聚类簇的方式分散, 节点连线较多, 核心作者在各自相关领域的研究中合作较多, 部分比较集中, 形成了一个个不同大小的核心作者群。但是与其他领域核心作者合作相对较少。

3.3 关键词共现分析

在使用citespaceⅢ绘制知识图谱前, 网络节点选择Keyword, Threshold Interpolation中的Thresolding (C.CC.CCV) 选择为 (5.4.20;3.3.20;2.3.15) , 表示图3中的关键词在前、中、后三个时间段关键词出现次数分别大于4、3、2次, 共现次数分别大于4、3、3次, 词间相似系数分别大于0.2、0.2、0.15这3个条件。通过近10年《体育科学》关键词共现情况可以得到体育学科领域关注的研究前沿主题。由图二可知, “动物实验”、“运动员”、“中国体育”是共现最高的3个关键词, 其中“运动员”属于渐弱型前沿主题, 在07-08年到达顶峰后, 共现频次逐年降低, 受关注程度逐渐降低。“中国体育”为波浪型研究主题, 近年来, “动物实验”研究呈现出良好势头, 08-12年间共计65篇, 中心度达0.21, 越来越多学者都转向该领域研究。多学科相互交叉相互渗透的综合性研究逐渐成为体育科学研究发展的主流。

小结

1.在《体育科学》的研究机构中国家体育总局体育科学研究所文献贡献率最大, 分布相对比较分散, 本区域间机构的合作较为密切。

2.近10年来, 研究机构发文量突增率最高的两所机构分别是宁波大学.体育学院、华南师范大学.体育科学学院, 两所机构在近些年中发文量具有较大突破, 成为中新兴的科研力量。

3.《体育科学》核心作者在各自相关领域的研究中合作较多, 部分比较集中, 形成了一个个不同大小的核心作者群。但是与其他领域核心作者合作相对较少。

摘要:基于Cite Space信息可视化软件, 选定CSSCI收录的我国体育类核心期刊《体育科学》2005-2015年发表的所有论文 (最后检索时间为2015年11月12日) 为数据源, 以1079篇文献为研究对象, 应用citespaceⅢ对研究机构、研究作者、被引文献、被引作者等数据进行分析处理, 用科学知识图谱的方式直观呈现该体育核心期刊的研究机构分布、学科代表人物以及被引期刊来源并进行分析, 梳理当前研究热点和研究力量及代表。

关键词:《体育科学》期刊,citespace,软件,计量分析

参考文献

[1]陈悦, 刘则渊.悄然兴起的科学知识图谱[J].科学学研究, 2005, (4) .

[2]魏瑞斌.国内知识图谱研究的可视化分析[J].图书情报工作, 2011, (4) .

[3]赵丙军, 王旻霞, 司虎克.基于Cite Space的国内知识图谱研究[J].图书情报工作网刊, 2012, (8) .

科学知识图谱 篇5

1 研究对象

利用国际科学计量学的最新研究手段——科学知识图谱, 来全景扫描该刊的知识结构和知识特征。

2 数据来源

通过大连理工大学WISE实验室刘盛博博士所编写的JAVA专用程序 (CSSCIREC) 将下载的数据记录转换为ANSI文本格式, 以便于软件对中文数据的处理, 从而完成知识图谱的绘制。

3 知识图谱及其解读

3.1 作者合著知识图谱

《情报理论与实践》13年中共计有2891位作者 (含第二、三作者) 发文, 2181位作者仅发表了1篇文章, 发表2篇以上论文的作者共有710位, 发表3篇以上论文的共有294位。核心作者前十位排名分别是邱均平 (20篇) 、甘利人 (19篇) 、朱庆华 (15篇) 、焦玉英 (14篇) 、马海群 (14篇) 、储节旺 (14篇) 、王知津 (14篇) 、真溱 (13篇) 、汤珊红 (12篇) 、霍忠文 (12篇) , 这些多产作者对引领和支撑本刊的持续发展具有举足轻重的作用。图1是利用CiteSpace软件, 选取每2年为一个时间段共7个时间段绘制出的作者合著知识图谱。图中上面横条代表时间, 时间由远至近, 颜色逐渐从冷色变为暖色。节点越大代表发文量越多, 节点颜色的变化代表不同年份发文量的变化, 节点间连线代表作者之间存在合作关系。从图中可以看到武汉大学的邱均平与文庭孝、侯经川、任全娥之间;南京理工大学的甘利人与岑咏华、丁晟春、郎诵真、马红梅之间;安徽大学的储节旺与马费成、郭春侠、谢阳群、叶春森之间以及南开大学的王知津与陈婧等之间存在科研合作关系。

3.2 机构合作知识图谱

《情报理论与实践》13年中共计有1089家学术机构发表文章, 说明该刊收录范围较广, 其中发文20篇以上的机构13家, 发文10篇以上的机构38家。核心机构前十位排名分别是南京大学信息管理系 (124篇) 、武汉大学信息管理学院 (114篇) 、北京大学信息管理系 (105篇) 、中国国防科技信息中心 (73篇) 、武汉大学信息资源研究中心 (70篇) 、中国科学技术信息研究所 (67篇) 、中国科学院文献情报中心 (36篇) 、安徽大学管理学院 (35篇) 、南京理工大学经济管理学院 (33篇) 、山西大学管理学院 (33篇) 。核心机构前30位累计发文1019篇, 占全部发文的37%, 说明这些核心机构为刊物的成长和发展做出了突出的贡献。通过对机构合作知识图谱 (见图2) 的扫描, 可以看到没有形成较明显的聚类, 说明跨地域、跨机构的科研合作比较少, 但仍然存在。

3.3 期刊共被引知识图谱

期刊共被引分析是指通过选择高共被引期刊, 借助一定的算法建立期刊间学术联系的一种文献计量学方法。绘制期刊共被引知识图谱 (见图3) , 可以了解该刊的引文环境以及与其他期刊之间知识流动的关系。13年中, 该刊共计引用了4635种学术期刊、报纸和书籍文献, 引用范围非常广泛。在共被引期刊中排名前十位的分别是《情报理论与实践》被引579次、《图书情报工作》459次、《情报学报》455次、《情报科学》376次、《中国图书馆学报》334次、《情报杂志》319次、《现代图书情报技术》217次、《大学图书馆学报》207次、《情报资料工作》178次、《图书情报知识》175次。该刊的自引率最高, 说明其载文相对具有较高的学术价值, 在同类专业学术期刊中居于领先, 是图书情报领域研究者重要的参考期刊。研究中发现排名前40位的被引期刊中外文期刊5种, 分别为《Journal of the American Society for Information Science》被引54次、《Information Processing and Management》49次、《Journal of Documentation》48次、《Journal of the American Society for Information Science and Technology》46次、《Scientometrics》43次, 说明该刊与外文期刊之间的知识交流与互动仍须进一步加强。从图谱中我们看到形成了四个明显的聚类, 其中聚类1主要由国内图书情报学刊物组成;聚类2主要由《计算机工程与应用》等计算机领域刊物组成;聚类3主要由《科学学与科学技术管理》等科学学与科研管理领域刊物组成;聚类4主要由情报学、科学计量学等领域外文刊物组成。聚类1中介中心性最高, 构成引文期刊的核心区, 后三个聚类构成引文期刊的相关区, 而图谱中未形成明显聚类的其它刊物构成了引文期刊的非相关区。这基本上符合文献计量学中描述文献分散规律的布拉德福定律。

3.4 文献共被引知识图谱

利用CiteSpace软件绘制了《情报理论与实践》文献共被引时区分布图谱 (见图4) 。图中每个节点都表示一篇被引文献, 节点向外延伸不同颜色的圆圈描述了该文献在不同年份的引文时间序列, 圆圈的厚度与相应年份的引文数成正比。13年中, 该刊共计引用文献26119条。在共被引文献中排名前十位的分别是《现代情报学理论》 (严怡民, 1996) 被引25次、《信息资源管理导论》 (孟广均, 1998) 17次、《市场竞争和竞争情报》 (缪其浩, 1996) 17次、《信息经济学》 (马费成, 1997) 16次、《走向知识服务:寻找新世纪图书情报工作的生长点》 (张晓林, 2000, 中国图书馆学报) 14次、《博弈论与信息经济学》 (张维迎, 1996) 12次、《情报学的进展与深化》 (马费成, 1996, 情报学报) 11次、《情报学概论》 (严怡民, 1994) 11次、《企业竞争情报系统》 (包昌火, 2002) 10次、《文献计量学》 (邱均平, 1988) 10次。研究发现高频共被引文献的作者中绝大多数为图书情报学领域知名的专家学者, 他们处于学科发展的前沿, 引领和带动了本刊的健康持续发展。笔者还发现在高频共被引文献中图书文献所占比例超过50%, 这说明图书情报学基础理论教程与经典学术著作是构成该刊的主要知识来源。

4 结语

通过前面分析笔者以为《情报理论与实践》杂志始终站在学科研究的前沿, 全面、系统、及时、准确地报道国内外图书馆学情报学与信息技术发展动态, 研究探讨图书馆学情报学理论方法、信息服务实践和科技信息工作。该刊能够抓住图书情报界的研究热点, 刊发出一大批既有理论水平, 又有学术深度的精品论文, 在图书情报专业核心期刊中享有较高的声誉。

摘要:笔者通过中文社会科学引文索引 (CSSCI) 收录《情报理论与实践》1998—2010共13年的题录及引文数据, 分别绘制了作者、机构、期刊、关键词和引文知识图谱, 并通过对图谱进行深入的分析与解读, 全面揭示了该刊的知识结构和知识特征。

关键词:科学知识图谱,《情报理论与实践》,文献计量学

参考文献

[1]王知津, 黄莹莹.《情报理论与实践》学术影响力分析——祝贺《情报理论与实践》创刊45周年[J].情报理论与实践, 2009 (7) :6-9

[2]徐婷.《情报理论与实践》1980-2007年发文的被引分析[J].情报理论与实践, 2009 (7) :20-22

国外信息素养领域知识图谱分析 篇6

1 数据采集与研究方法

以引文文献为基础采用科学知识图谱分析方法, 借助美国陈超美博士最新开发的Cite Space III软件, 直观地展示出有关信息素养领域的时间和空间分布、被引作者、主题、前沿及发展趋势网络图谱。

1.1 数据采集

以Web of Science数据库中的Sci-Expanded, Ssci, Cpci-S为数据来源, 采用精确检索方式, 主题=“information literacy”, 文献类型Article, 检索时间为1974-2013年 (截止时间2013-9-15) , 共检索出1195条记录。分析1195条记录发现数据库最早收录关于信息素养方面的文献在1983年, 1984-1987这几年并没有文献被收录, 1988-1992每年的发文量也甚少, 仅仅几篇, 虽然2013年数据不完整, 但为了了解该领域的最新科研情况, 给予保留, 为此数据采集的时间为1993-2013年, 文献数量953篇。

1.2 研究方法

陈超美博士近期推出的最新一代科学知识图谱分析软件Citespace III就是本文数据分析的工具。Cite Spece III软件可将不同的作者 (或机构或参考文献或主题词) 的被引文献数量以“节点”的大小和颜色差异直观的展现, “节点”越大表示在该领域地位越重要, 并通过连线及其粗细程度表达它们之间有无关系和联系的强度。Cite Space III界面参数设置如下, 时区选择为1993-2013年, 时间跨度选择1年, 主题词来源选择文献标题、摘要、关键词和标识符, 根据分析节点类型的不同采用不同的阈值, 分别表示在前、中、后3个时间分区中设定引文数量、共引频次和共引系数3个层次的阂值, 采用Minmum Spanning Tree或panthfinder精简图形同时也为提升数据处理速度得到信息素养不同节点类型知识图谱。

2 研究内容

2.1 信息素养领域年载文文献量分析

对数据集953篇文献载文分析, 见图1, 1993-2001年发文量在20篇以下, 属于研究初始探索阶段, 2001-2006年发文量在60篇以下, 呈现出稳步小幅上升阶段, 发文量每年基本保持一定的比率缓慢上升, 2007-2011年发文量在135篇以下, 出现急速上升后随即进入平稳成熟科研时期, 2011年是该领域科学研究过程中一个小顶峰, 图中呈现拐点, 2011-2013年信息素养的研究随着该领域科研水平的成熟有渐渐回到平稳发展的迹象。

2.2 信息素养领域被引作者分析

作者发文量的多少及被引情况一定程度上代表学术科研的影响力和权威性;尤其是被引作者。设置Cite Spece III界面参数, 采用阈值 (2.2.20) (4.2.20) (3.3.20) , node types选择Cited Author, 运行软件得到信息素养被引作者图2;从图2中可以看出“节点”大小不同, 越大的“节点”代表作者地位越高, 被引次数越多。最大的是澳大利亚昆士兰科技大学信息素养专家Bruce C, 被引183次排在第一;排在第二的是美国罗格斯州立大学的Kuhlthau, C C.教授, 被引127次, 排名第三的是英国谢菲尔德大学Webber S, 被引78次;前十被引作者中有3名来美国大学, 再一次验证美国大学在信息素养领域的影响力和地位, 其他排名7-10的作者分别为苏格兰爱丁堡大学Bundy A, 被引77次;澳大利亚查尔斯斯特大学Lloyd, A, 被引74次;英国伦敦城市大学Bawden D, 被引70次;美国陶森州立大学Breivik PS, 被引64次;加拿大达尔豪西大学Julien H, 被引63次;美国路易斯维尔大学Rader HB, 被引60次;瑞典哥德堡大学Limberg L被引59次;这些作者都是该领域专家学者或著名教授, 他们发表的许多文献都对该领域有着强大的影响, 比如Bruce博士是最重要的国际信息素养领域的著名理论家之一, 在国际上十分活跃参与信息素养计划的规划与实施, 研究课题主要针对信息素养教学与体验, 尤其注重不同环境下人们对信息素养体验的理解。她的经典“六框架模型”, 每个框架对信息素养概念、信息素养教育、信息素养课程设置、信息素养内容以及评价标准都有独特的见解, 涉及的内容比较广泛, 可以有效将信息素养与其他各种素养联系起来, 对学生的综合能力提高有很好的促进作用。

2.3 信息素养领域国家机构载文量分布

设置Cite Space III相应参数, 采用阈值 (3.4.16) (3.3.20) (3.3.20) , node types选择country, institution, 得到信息素养国家机构载文量分布图谱3;从图3中我们可以看出, “节点”的大小是与产出文献的数量大小成正比例的;在所有国家中美国以绝对优势超过三分之一的发文量368篇高居榜首, 占38.61%, 其余国家形成了以美国为中心的研究信息素养的外围国家, 依次为澳大利亚AUSTRALIA (79篇) 、英国ENGLAND (76篇) 、加拿大CANADA (51篇) 、西班牙SPAIN (38篇) 、南非SOUTH AFRICA (24篇) 、苏格兰SCOTLAND (19篇) 、瑞典SWEDEN (19篇) 、中国PEOPLES R CHINA (19篇) 、台湾17篇;从谱图上看出机构比较分散, 最多的格拉纳达大学Univ Granada 20篇;其余发文量比较多的机构还是以美国大学为主;分别为阿尔伯塔大学Univ Alberta19篇、查尔斯斯特Charles Sturt Univ19篇、谢菲尔德大学Univ Sheffield18篇、伊利诺伊大学Univ Illinois18篇、昆士兰科技大学Queensland Univ Technol13篇、威斯康星大学Univ Wisconsin11篇、大学比勒陀利亚Univ Pretoria11篇、南阳理工学Nanyang Technol Univ10篇、佛罗里达州立大学Florida State Univ10篇。

2.4 信息素养研究领域热点主题分析

利用Cite Space III术语自动聚类功能, 确定信息素养领域的研究热点, 设置Cite Spece III参数, 阈值 (10.14.29) (3.3.20) (3.3.20) , node types选择term, 运行软件得到热点主题图4;并抽取出现频次≥20次的19个名词术语, 见表1。结合图4和主题词表1, 归纳了信息素养领域6个比较大的热点主题, 即计算机信息素养、大学生课程设置、信息素养教育、信息素养理论与实践、图书馆指导及终生学习, 健康信息素养。

(1) 计算机信息素养:从计算机信息素养内涵出发, 从提高知识、能力、素质等几方面培养信息素养, 以大学计算机基础教育为本, 促进信息技术素养教育。

(2) 大学生课程设置:信息素养在本世纪已经转变到关于人的信息素养, 尤其是如何培养大学生的信息素养及其信息素养课程问题越来越重要, 大学生信息素养课程设置将会成为高等教育的重要内容, 其目标就是提高大学生的信息素养以适应现代化信息社会的需求。

(3) 信息素养教育:信息素养教育教学方式多种多样, 比如有问有答式网络课程, 邮件, 电话, 在线提问等, 美国国家信息素养教育论坛采用即时通讯工具实现用户的互动交流的方式深受喜欢。形式多样化的同时, 更注重学生通用技能的掌握, 引导学生获取使用开放资源;不断加强学生使用信息检索软件和工具的能力, 将信息素养教育整合进各学科的日常教学课程中。总之培养学生的信息素养, 教会他们如何检索、评价和利用信息资源己成为信息素养教育的核心内容。

(4) 信息素养理论与实践:原理、评价标准、实践是信息素养框架理论的重要内容;教学设计与实践相结合是教学过程的重点, 具体从教学理念, 教学计划, 教学进度, 教学设计, 主题设计五大方面进行实践。

(5) 图书馆指导及终生学习:一方面馆员积极参与教师的教学计划共同培养大学生尤其是研究生的信息素养能力培养工作中去, 另一方面信息资源为基础, 以计算机为手段, 培养大学生的终身学习信心与能力, 信息素养是终生学习不可缺少的一部分, 也是人的整体素养的基础。

(6) 健康信息素养:自2003年美国医学图书馆协会给出“健康信息素养”定义后, 对健康信息素养方面的研究报道越来越多, 人民越来越意识到健康信息素养的重要性了, 近几年逐渐成为信息素养的重要主流研究课题之一。

2.5 信息素养研究领域前沿分析

在图书情报领域关于“前沿”的解释有三种: (1) 以Price和Small为代表的将一组高被引文献定义为研究前沿, 对应的数据分析方法大多采用同被引聚类; (2) 以Persson和Morris为代表的将一组施引文献定义为研究前沿, 对应的数据分析方法大多采用文献耦合; (3) 以陈超美博士为代表的将突发文献定义为研究前沿, 对应的数据分析方法大多采用共词分析。陈博士认为突现词 (burst terms) 能更准确的反应一个领域的前沿, 通过他开发的软件Cite Space可以实现从大量的主题词中探测出突现词, 进一步揭示一个领域的研究前沿。在Cite Spece III界面上, Term type选择突现词, 运行Cite Space III软件, 结果探测到5个变化频次最高突现词, 分别是计算机素养、在线、课程指导、互联网、高等教育, 详见表2。

表2中可以看出信息素养前沿研究领域分为两大类:分别为信息素养教育 (含突现词课程指导和高等教育) 和计算机信息素养 (含突现词计算机素养, 在线及互联网) 。

2.6 信息素养领域演进路径分析

Cite Space III软件可以产生三种文献共引网络图谱, 即聚类视图 (Cluster View) 和时区视图 (Timezone) 和时间表视图 (Timeline) 。后两者可以反映出共引网络节点随时间变化的视图。在Cite Space III软件界面上node types选择cited reference, 运行软件得到文献共引网络关键节点的时区视图5, 抽取中心度>0.1的6篇文献列于表3;这6篇文献属于知识基础文献可以反映信息素养领域发展演进历程, 下面按照发文时间顺序分析这6篇文献。

第一篇是1989年Breivik, Patricia Senn博士与人共同撰写的书《信息素养:图书馆的革命》《Informationliteracy:Revolutioninthelibrary》[6], 该书介绍了在信息时代的高校图书馆的作用应该是什么?大学校长和图书馆主馆应该在信息时代下重新度量信息素养资源, 以不同视觉看待学术图书馆, 书中也谈到了学术图书馆, 图书馆科学, 大学生图书馆入馆教育, 信息技术及自动化等几个分类主题, 将信息素养定义为是提供信息的系统、鉴别信息的价值、获取信息的渠道、获取和存储信息的基本技能。由于该书在信息素养领域的影响力极其深远并得到同行们的认可, 凭借此书使Breivik博士赢得1990年的GK厅图书馆文学奖。而Breivik博士曾经担任过国家信息素养论坛首席主席, 这个信息素养论坛从1989年成立以来到2005年已经有超过90个国家和相关国际组织的成员能够自由有效地访问和使用论坛信息进行交流, 促进信息素养领域向更深层次发展;Breivik博士本人在担任国家信息素养论坛主席期间对信息素养领域的发展也做出了卓越的贡献, 在世界范围有着重要的影响力, 她的名著在信息素养发展历具有举足轻重的历史地位, 从标题可以看出该书代表图书馆领域发展的一个重要的转折点, 也是世界信息素养运动正式启动的标志性文献。

第二篇是1989年1月10日由美国图书馆协会“信息素养主席委员会”提交了一份《信息素养主席委员会的最终报告》 (Presidential Committee on Information Literacy:Final Report) [7], 在报告中主要强调个人, 企业和公民进行信息素养教育的重要性以及阐述了高等学校发展信息素养教育的时机已成熟, 确定高等学校要向信息时代的目标发展和前进, 高等学校和学院应将信息素养的概念整合到大学生的学习课程, 最终, 把大学生培养成为有信息素养的人。报告中对什么样的人是“有信息素养的人”给以详细解释, “有信息素养的人”就是那些已经知道如何学习, 如何组织信息, 如何找到信息, 如何利用信息, 准备终身学习的人, 因为“有信息素养的人”总能找到任何时候他们所需要的任何信息。该报告强调了普及整个社会信息素养教育的重大历史意义, 提高全民族信息素养的重要性, 尤其是高等学校发展信息素养教育必要性并设置相应课程, 这份报告是美国全民族信息素养教育开始正式启动的标志。

第三篇是1992年北园大学从事目录教学的Bodi, Sonia[8]博士在《Research Strategies》上发表的文献, 题名为《馆员的作用:在教学中采用批判性思维与教师合作》 (Collaborating with Faculty in Teaching Critical Thinking:The Role of Librarians) ;该文献描述了图书馆员在目录教学中可以扮演更重要的角色, 采用批判性思维与专业教师合作, 作为获取知识和提高知识的新途径, 并以北园学院图书馆员和学科专业老师之间的合作为例子研究批判性思维的进展情况。这篇文章的发表标志信息素养发展过程已经渗透到学科专业, 信息素养如何在目录教学中与学科专业相结合共同制定教学计划。有了这篇文献的基础, 才有后来诸多学科专业教师与馆员之间展开合作共同致力于大学生的信息素养教育工作, 如美国南犹他州大学Thomas H.Cunningham[9]也提出信息素养教育是学生必不可少的掌握前沿知识的一种本领, 教师和图书馆员可以合作共同开展信息素养教育的计划, 协同合作研究信息素养问题的解决方案;图书馆员可以参加专业课教学会议, 辅助教师制定信息素养教学计划, 共同承担培养学生信息素养教育工作。又如美国新墨西哥大学Jonathan D.Eldredge[10]博士提出了医学专业课教师和学科馆员应该共同制定教学计划, 将信息素养与医学专业课相结合, 创建一种以专业课为基础, 学科馆员以辅导为辅的新教学模式, 学科馆员帮助学生检索信息, 建立检索式, 识别有用信息, 提高学生检索技能。再如美国维拉诺瓦大学土木与环境工程系Welker, A[11]博士基于信息素养与学科相结合的想法, 将信息素养知识渗透到土木与环境工程专业, 经实践表明学生展现了对信息素养课的浓厚兴趣, 也很大程度上帮助提高了学生工程专业课的学习效果, 体现信息素养与学科相结合的实用性和重要性, 体现了信息素养课的价值。随着这种理念的应用越来越广泛, 对合作的基本框架和标准的需求也越来越显得重要了, 其中较著名的就是Ilene F.Rockman[12]博士提出的一个比较成熟的具有较高的参考价值信息素养教育的框架。

第四篇是澳大利亚昆士兰科技大学Christine Susan Bruce博士在1997年写的《高等教育的七面信息素养》 (Seven Faces of Information Literacy in Higher Education) [13]。她在书中定义信息素养就是为有效地用于各种目的, 管理信息和使用信息的能力, 是一种重要的“通用基本技能”, 掌握了这种“技能”使人们能够有效的进行决策, 解决问题和研究问题, 也使人们在感兴趣的专业领域里继续学习乃至终身学习。在书中“信息素养”概念被从7个不同的方面给予解释, 即“Seven Faces”构想理论: (1) 信息技术构想是指信息技术不仅提高了人们对信息的利用效率, 而且信息技术的发展使信息系统能快速、准确地处理信息, 人们懂得相应的信息技术和信息系统工作原理, 才能学会如何利用信息技术进行信息检索和传播。 (2) 信息来源构想是指无论信息来自正式或非正式, 官方的或个体, 要找到位于信息源中的所需信息, 要从信息源中获得有价值的信息, 这种信息会带来新价值, 也会促使寻找信息的人或团体产生对信息的新认识。 (3) 信息化进程构想是指查找信息和使用信息过程的能力, 包括:识别信息、接受信息, 分析信息、制定检索策略并评价策略的有效性、贮存信息、利用信息、管理信息和传递交流信息的一种综合能力。 (4) 信息控制构想是指借助现代化工具合理利用信息, 挖掘信息的内在附加价值。 (5) 知识建构构想是指信息无论是以哪种形式存在, 也不管是印刷型的, 还是电子型的, 还是以什么载体存在的, 都应该了解和熟悉各种各样的信息, 建立一个人的知识基础, 拥有信息领域的所需的充分知识。 (6) 知识扩展构想是指采用批判性思维方式处理信息从采集到利用贯穿信息所有过程, 批判性思维是以逻辑方法作为基础发展出的一系列批判性思维技巧, 利用信息素养的知识获得新的见解, 在现代社会, 批判性思维被普遍确立为高等教育的目标之一。 (7) 智慧构想是指信息来源不同, 信息内容不同, 信息的形式不同, 人的个性不同, 多种不同的差异最终形成了不同风格的信息素养的人, 他们各自采用独特方法观察信息世界、思考问题、解决问题, 有信息素养的人能够明智地利用信息, 包括判断, 决策, 研究, 建立个人信息素养风格。Christine Susan Bruce博士从7个不同方面对信息素养概念的解析, 全面定义解释了信息素养的本质, 将信息素养这一概念上升到更高更广的层面, 在信息素养发展里程碑上奠定了坚实的理论基础。

第五篇是2000年1月18日由标准委员会审查和由大学与研究图书馆协会 (ACRL) 董事会董事批准的《高等教育信息素养能力标准》 (Information Literacy Competency Standards for Higher Education) [14]。该标准提出了被公众普遍认同的信息素养定义, 其内容主要有信息素养定义、信息素养和信息技术、信息素养和高等教育、信息素养和教育学、使用的标准、信息素养和评估、标准, 性能指标和成果、实用指南等几个方面。次年得到了美国高等教育协会的认可并迅速推广, 被认为是信息素养领域最有影响力的文件之一, 该标准不仅是信息素养体系能力评价指标, 而且也是信息素养教学的指导方针, 它是制订教学计划、课程设计以及评估学习效果的理论依据和方法。作为一名具有信息素养能力的人, 必须能够认识到何时需要信息, 发现、检索、评价和利用所需要的信息。这一概念反应了信息素养的信息意识和信息能力两个重要方面, 更准确的表达了信息素养真正内涵意思, 阐述了信息素养教育对个人、企业、国家的重要性, 普及信息素养教育。它标志着信息素养的本质进入一个新境界, 是美国信息素养运动全面开展的标志, 促成了美国国家信息素养论坛的建立。

第六篇是2001年伦敦北安普顿广场城市大学信息科学系的David Bawden发表在《Journal of Documentation》题名为《信息和数字素质:概念的综述》 (Information and digital literacies:a review of concepts) [15], 属于文献综述类的文章。描述了信息素养和数字素养的概念做了综述性的回顾, 通过文献查询和分析相关概念提出计算机素养, 图书馆素养, 网络素养, 互联网素养, 超素养概念及他们之间的关系。该文不仅提出了“素养”基本概念, 为适应更加复杂的信息环境提出了“素养”新概念。如图书馆, 媒体, 计算机素养大多基于一些特定的技能, 但是有一些素养已超出其本身的概念, 导致了广义概念的产生, 如信息素养, 数字素养, 这些概念都是基于知识, 感悟和态度而提出的。这篇文章的发表标志信息素养发展过程进入新的里程碑网络信息素养阶段。从另一方面也认证了计算机素养, 在线, 互联网三个突现词的产生的背景和意义。

总结这六篇知识基础文献, 归纳信息素养领域的演进路径为首先为信息素养概念的提出———社会普及信息素养教育的历史意义———大学生信息素养教育———信息素养概念新的解析———信息素养标准的建立———计算机信息素养时代的到来。

3 结论

利用Cite Space III可视化分析软件展现国外20余年信息素养领域主题及演进路径特点, 经过对该领域的多方位剖析, 得出如下结论:

(1) 信息素养领域6个热点主题:计算机信息素养、大学生课程设置、信息素养教育、信息素养理论与实践、图书馆指导及终生学习、健康信息素养。

(2) 2个前沿研究方向:由5个突现词 (计算机素养、在线、目录教学、互联网、高等教育) 形成的信息素养教育和计算机信息素养两大前沿研究领域。

(3) 信息素养领域研究演进路径:信息素养概念的提出及解释是图书馆历史性转折, 代表信息素养研究启动, 社会普及信息素养教育尤其是是大学生信息素养教育的问题得到重视, 7面理论的产生赋予了信息素养创新价值和新的内涵, 也随之而来制定了信息素养的标准, 标志信息素养运动全面启动, 随着网络普及进入计算机信息素养时代。

(4) 信息社会的到来, 世界各国的信息素养研究和教育工作者已经意识到了信息素质问题重要性, 在信息时代里, 应更注重信息意识教育, 尤其是信息传播意识、信息守法意识的教育, 遵守法律、法规, 不做信息违法行为, 正确处理信息创造、传播、使用三者之间的关系, 培养个人信息行为的自由性, 准则性与道德性。目前国际上对信息素养教育的重要性和必要性已经得到全世界的认可, 信息素养被看作是信息时代一个人的必需生存条件。

摘要:将1993-2013年SCI, SSCI, CPCI-S收录的主题为信息素养的文献作为研究对象, 应用CiteSpaceIII软件绘制国家机构、被引作者、主题热点、前沿及演进路径知识图谱。提出6个热点主题 (计算机信息素养、大学生课程设置、信息素养教育、信息素养理论与实践、图书馆指导及终生学习、健康信息素养) ;2个前沿研究方向 (信息素养教育、计算机信息素养) ;由中心度>0.1的6篇文献构成了国外信息素养领域的演进路径, 展示了该领域研究趋势。

科学知识图谱 篇7

近年来国内外学者对即兴研究已经进行了系统的文献梳理和总结。Cunha[1]、黄勇[2]、张小林[3]等学者就组织即兴的内涵、促发条件、影响因素和结果等内容进行了较全面的分析。与此同时,部分学者对即兴研究涉及的相关领域也进行了初步分析, 如韵江等[4]评价了组织即兴与组织学习、组织记忆、 组织创新和战略变革的关系,曹光明等[5]总结评价了包含爵士乐隐喻、组织学习、团队管理和战略在内的4个组织即兴研究视角。

以上学者对即兴研究的发展现状和热点等内容进行了初步的尝试,对于理清即兴研究的基本脉络具有重要的价值。然而这些定性研究的结论往往是主观思辨的结果,缺乏一定的科学依据,更为重要的是,这些研究对于反映即兴领域的知识构成及各类知识相互影响而形成的知识框架的学科知识结构 ( intellectual structure)[6]没有给出清晰的描述,因而难以系统揭示该领域的发展历程及其趋势。鉴于此, 本文将在系统回顾相关文献的基础上,利用科学计量学的方法对即兴研究的学科知识结构进行初步的定量和定性相结合的分析。

1研究方法与数据收集

1.1研究方法与工具

常用的知识结构分析方法是引文分析和共被引分析。引文分析有助于了解引文的主题随时间的变化情况和该领域主要的引文,并利用引文频率的变化情况来推断什么时间该领域发生重大变化[7]; 同被引分析是通过建立同被引矩阵来实现的,通过文献之间同被引关系形成同被引网络,同被引网络内节点之间的远近关系可以反映它们的主题内容及亲疏关系[8]。本研究采用以上两种分析方法,具体实施时借助瑞典科学家Olle Persson开发的文献计量学研究软件Bibexcel来构建作者共被引矩阵,在此基础上用SPSS统计分析软件进行因子分析,以便确定知识基础的构成。在知识结构的可视化方面,有时多维尺度很难在二维空间展示全部知识组织,从而显示效果不理想,因此本文采用寻径网络算法加以改进。寻径网络算法在处理相关系数矩阵时,将文献视为节点,相关系数视为联系的强度,再跟据三角不等式检验从而决定是否保留某个连接,最终获得能够反映最重要关系的精简网络[9]。在具体实施时,本研究采用科学图谱 软件Network workbench Tool 1. 0来进行处理和网络的可视化。

1.2数据收集与分析

笔者分别以improvisation、improvisational、improvising和improvise为主题词,利用美国科学情报所 ( ISI) 的Web of Science数据库进行文献的检索, 检索截止时间为2014年4月5日,将研究领域限定在Management、Business和Economics,文献类型限定在Article、Proceedings paper和Review,最终得到1998 - 2014年和即兴有关的文献241篇。据发文数量的年度分布情况 ( 见图1) 结果表明,即兴研究从1998年开始呈较为稳定的发展态势,其中2006年、2009年和2012年呈现出3个增长高峰。为了从动态视角分析知识结构的变化,本文在具体分析的时候,根据发表文献的年度分布情况将其分为两个时间段: 1998 - 2006年和2007 - 2014年。

2研究结果

2.1高被引文献的引用分析

1998 - 2014年所引用的参考文献总数为10234篇,其中期刊为6056篇,占引文总数量的59. 18% 。 从总引文数量的年度分布情况 ( 见图2) 可以看出, 引文从1940年左右开始呈增长趋势 ( 每年大于5篇) ,且大部分集中在1990 - 2005年之间,这也是即兴研究文献呈现快速增长的阶段。

本文通过分析即兴研究引文的被引频次和频率来确定主要文献及其变化情况,表1列出了该领域被引频次大于10的前76种文献及其在前后两个时间段的变化情况。本文在计算被引频率的时候进行了标准化处理,以10000篇为单位进行折算,其最终结果如图3所示。

从表1的结果可以看出,高被引文献中有20种是图书 ( 用* 表示) ,其余均为期刊论文,因此期刊论文对于即兴研究发挥了极大的推动作用,而被引频次最高的则是美国著名组织行为学专家Weick于1998年在Organization Science发表的Introductory essay—Improvisation as a mindset for organizational analysis一文, 总计被引 用79次, 随后分别 是Moorman于1998年在Journal of marketing发表的The convergence of planning and execution: improvisation in new product development和Miner于2001年在Administrative Science Quarterly发表的Organizational improvisation and learning: A field study。同时还可以看出,76篇文献在不同时间段的引用频次有差别,其中有3篇在1998 - 2006年间被引频次为0 ( 用斜体加粗表示) ,说明文献由于发表时间或研究主题的原因,使得其受重视程度不同,这必然对不同时间段的知识结构有所影响。

从图3的文献被引频率变化可以看出,有44篇文献呈反向增长趋势,其中Weick于1979年出版的The social psychology of organizing和1993年在Organizational change and redesign: Ideas and insights for improving performance一书中刊载的Organizational redesign as improvisation一文。其余32篇呈正向增长趋势,其中Baker于2005年在Administrative science quarterly的Creating something from nothing: Resource construction through entrepreneurial bricolage和Vera于2005年在Organization Science的Improvisation and innovative performance in teams,这些说明了不同文献所代表的即兴研究的某些方面在不同时间段发生了变化,而这些变化也进一步影响了知识组织及其内部的关系。

2.2因子分析与知识基础的确定

笔者利用Bibexcel软件以被引频次大于10的前76篇文献建立同被引矩阵,并对其进行因子分析, 以主成分分析法和方差极大正交旋转估计因子载荷量,保留特征值大于1的因子,分析结果中,前6个因子累计方差贡献率达到了87. 42% ,满足萃取要求,结合具体研究,最终以前6个因子来描述即兴研究的主要知识基础,因子分析的具体结果如表2所示。

知识群1的主题是组织、战略和创新,其中组织方面涉及的主要文献包括Weick、Hatch、Barrett、 Zack、Bastien、Mirvis、Lewin和Kamoche从爵士隐喻以及Vera从戏剧隐喻对组织中即兴现象的本质和特征所进行的理论分析,Hutchins和Weick从适应性角度对航船失事和火灾救援中组织即兴过程所进行的案例研究,Moorman和Miner就组织即兴、组织记忆和组织学习之间关系的理论和案例研究,Crossan和Ciborra从时间角度对组织即兴过程特点的理论研究,Cunha对组织即兴影响因素及其结果的理论框架研究等。战略方面涉及的主要文献包括Mintzberg对战略规划的研究,Eisenhardt和Brown的边缘竞争战略理论,Orlikowski和Crossan从即兴角度对战略变革和战略规划所作的理论研究等。创新方面涉及的主要文献包括Moorman对新产品开发过程中的组织即兴及其影响的实证研究,Eisenhardt关于即兴方法加速产品创新流程的案例研究,Brown有关产品开发研究的文献研究以及Burns有关创新管理的理论研究等。

知识群2的主题是能力,涉及的主要文献包括Eisenhardt、Teece和Zollo等关于动态能力的理论研究, Barney的能力资源基础观,Nelson的经济变革理论以及Leonard关于核心能力和核心刚性的理论分析等。

知识群3的主题是学习,涉及的主要文献包括March关于组织学习探索和利用两种范式的研究, Levinthal关于组织学习近视思想的研究, Levitt和Huber分别从经验和过程角度对以往组织学习的文献研究,Nonaka的知识创造理论,Cohen的吸收能力以及Cyert的公司行为理论等。

知识群4的主题是惯例,涉及的涉及的主要文献包括Feldman从柔性和变革视角对组织惯例的理论研究,Pentland从结构视角对组织惯例的研究, Weick关于突发事件下惯例失灵时群体行动的研究等。

知识群5的主题是创业,涉及的主要文献包括Levi提出与即兴相关概念— “bricolage” ( 创造性拼凑) 的著作以及将此概念具体应用到企业创业实践的Bake和Garud的系列研究。

知识群6的主题是方法,涉及的主要文献包括Eisenhardt和Yin的案例研究方法以及Miles的质性数据分析方法。

未归到以上6类的两篇文献是March和Thompson的组织行为决策和权变理论的研究。

2.3寻径网络与知识结构的可视化分析

为了揭示即兴领域各知识基础之间的关系,利用寻径网络图来表示其知识结构,结果如图4所示。 其中节点表示文献,连线表示文献相关程度,高度相关的节点距离越近,反之越远,同一因子文献用相同颜色表示,文献前的数字表示其所属的因子 ( 未归类文献没有数字) 。

从图4可以看出: 知识群1 ( 组织、战略和创新) 是即兴研究最大和最核心的知识基础,位于结构图的中心位置,和知识群5 ( 创业) 、知识群3 ( 学习) 关系最为密切,表明即兴研究涉及创业和学习的主题主要从组织、战略和创新的研究中发展而来,知识群1和知识群5之间是通过Baker和Miner的研究相关联,知识群1和知识群3之间是通过Moorman、Eisenhardt、Cohen、Moorman的研究相关联。知识群2 ( 能力) 、知识群3 ( 学习) 和知识群4 ( 惯例) 之间关系较为密切,表明这些主题存在相互借鉴现象,其中涉及到的关联性文献是Huber、 Leonard、 Levit、 Levinthal、 Schon、 Argote、 Feldman和Nelson的研究。知识群6 ( 方法) 和知识群5 ( 创业) 关系最为密切,表明即兴研究涉及创业的主题大多采用定性研究方法,两个知识群是通过Baker ( 2005) 的研究相关联。

2.4知识结构的演化分析

为了分析即兴研究知识结构的演化,采用卡方检验法,以同被引引文在各知识群的分布情况为检验依据,以前后8年为时间单位,从而判断前后两个阶段的是知识结构是否一样。经过最终显著性检验,得到chi - square = 14. 568,sig. = 0. 012,这也证明了即兴领域前后8年的知识组织在统计上是显著差异的。

为了说明知识结构的演化,分别描述1998 2006以及2007 - 2014两个时间段各个知识群之间的相互关系图,具体如图5和图6所示。

图5的1998 - 2006的知识结构图表明: 知识群1 ( 组织、战略和创新) 规模最大,位于图的中心位置,其他知识群均和知识群1有联系,这也表明了知识群1的重要地位; 知识群2 ( 能力) 、知识群3 ( 学习) 和知识群4 ( 惯例) 自身已经具备一定的规模,相互之间存在较强的联系,且均依赖于知识群1的研究; 知识群5 ( 创业) 和知识群6 ( 方法) 还处于发展阶段,规模较小,且两个知识群之间没有较强关联性,其研究还是更多地依赖于知识群1。

图6的2007 - 2014年的知识结构图表明: 知识群1 ( 组织、战略和创新) 依然位于中心位置,知识群2 ( 能力) 、知识群3 ( 学习) 和知识群 ( 4) 也和知识群1存在较强的关联性; 知识群2和知识群3存在较强关联,但知识群4和知识群3之间没有较强的关联性; 知识群5和知识群6已经具有一定规模,但之间不存在较强的关联,知识群6和知识群4存在较强的关联性,知识群5和知识群1存在较强的关联性。

综上所述,从即兴研究的发展历程来看,围绕着组织、战略和创新的研究始终是主流,而能力、 学习和惯例方面的研究,由于始终是组织理论和战略管理理论的研究主流,因此在不同时间段都与即兴研究主流关系密切。此外,由于即兴研究尚处于发展阶段,很多理论体系尚未建立,因此诸多研究都采用定性和案例研究方法,而创业方面的话题则属于近年来即兴研究逐渐成长的新方向。

3结语

居家养老研究文献的知识图谱分析 篇8

随着老龄人口的增加,传统的家庭养老方式已经不能满足养老需求,在此基础上,居家养老服务应运而生。国务院在《中国老龄事业发展“十二五”规划》中提出要建立以居家为基础、社区为依托、机构为支撑的社会养老服务体系,创建中国特色的新型养老模式。学术界对居家养老的研究始于20世纪末,袁缉辉(1995)在《强化家庭作用、支持居家养老》一文中首次提出“居家养老”这一概念并对它进行理论阐述[1]。随后,国内学者从各自的研究视角出发,对居家养老服务做了诸多研究。例如,居家养老满意度研究[2]、居家养老方式选择研究[3]、居家养老政策研究[4]以及政府在居家养老服务中的责任定位[5]等。

然而,随着研究的不断深入,居家养老领域呈现出许多问题,如理论体系繁杂、研究边界模糊等;另外,各研究领域的理论分歧也逐渐显现,例如,基本概念的涵纳范围及概念之间的差异问题,如居家养老、社区居家养老以及居家养老服务[6]等;政府购买居家养老服务的绩效评价问题[7]等,这些问题明显阻碍了居家养老研究的深入发展,也不利于形成一个完整的居家养老理论体系。

基于此,本文主要利用科学知识图谱这样一种可视化的文献计量工具,以CNKI上所刊载的居家养老的文章为数据来源,构建居家养老研究领域的可视化知识图谱。通过居家养老研究文献的年载文量、机构、作者分布,运用关键词共线网络以及突显词分析等,系统地展示近20年居家养老研究进展的整体脉络,并对居家养老的研究前沿与热点进行追踪,为今后居家养老的理论发展提供现实依据,同时对该领域的总体把握也能为我们解决现实中存在的居家养老问题提供有价值的信息。

1 研究设计

1.1 数据来源

本文所使用的数据来源于CNKI中国学术文献网络出版总库,检索时间跨度为1995—2015年。为了解在这20年里中国居家养老研究的基本情况,本文以“居家养老”为检索词在CNKI数据库中进行检索,检索结果共计3113篇,剔除掉部分不符合要求的论文396篇,本文统计的实际文献篇数为2717篇。

1.2 数据分析流程

本文对居家养老领域研究数据的处理主要包括以下核心环节。首先,选取关键词。主要利用Bibexcel软件,把关键词从已下载的文献中提取出来。为了保证关键词数据的有效性,文章对数据进行了预处理:剔除无效的数据,主要是把与研究主题不相关的关键词去除掉;合并近似关键词,选择出现频次6次及以上的关键词作为分析对象。其次,对高频关键词进行可视化分析,主要从关键词共现网络等方面进行初步的数据分析。最后,绘制知识图谱,根据各关键词在网络中的地位,从不同视角把握居家养老领域的研究热点以及发展趋势。本文所使用的数据处理软件主要包括:SPSS,Bibexcel,CitespaceⅢ等软件。

2 结果与讨论

2.1 文献数量

根据年发文量的描述性统计结果(见图1),在2008年以前发表的居家养老方面的文献数量较少,文献增加较为缓慢。一方面说明在2008年之前居家养老研究服务刚刚兴起,各方面研究处于初级阶段,没有形成统一的理论体系;另一方面说明,中国当时的老龄化并不是很严重,没有引起研究者以及政府部门的足够重视。2009—2015年文献数量增长较快,每年发表的居家养老的文献数量都保持在一个较高的水平。一方面表明对居家养老的研究不断深入,研究进入繁荣阶段;另一方面也说明中国的老龄化进程在逐步加快。根据第六次全国人口普查数据,60岁及以上人口占13.26%,比2000年人口普查上升2.93个百分点,其中65岁及以上人口占8.87%,比2000年人口普查上升1.91个百分点。这说明我国的老龄化现象已非常严重,人口老龄化成为全社会关注的问题。

2.2 研究机构

运行Cite SpaceⅢ,得出居家养老领域研究机构的分布如图2所示。由Cite SpaceⅢ导出的数据分析结果表明,居家养老机构分布比较分散并且各研究机构之间缺乏必要的合作。其中,发文量最多的是华北电力大学人文与社会科学学院,说明该学院在居家养老领域的研究能力与影响是比较突出的。其他发文量较多的大学还有苏州大学社会学院、中国人民大学社会与人口学院、河北工业大学、河南大学哲学与公共管理学院等。其他类型的科研机构中,浙江师范大学农村研究中心以及中国老龄科学研究中心的发文量也是比较多的,其中浙江师范大学农村研究中心的发文量排在第四位。可见,居家养老的研究已经引起了各类研究机构的关注。

2.3 重要著者

运行Cite SpaceⅢ,得出居家养老领域重要作者的分布如图3所示。从图中我们不仅可以看出居家养老领域的研究者,而且还可以看出各研究者之间的合作与联系。鲁可荣(2015)运用实证的方法探讨农村居家养老的可行性[8]。胡宏伟(2012)以公共服务均等化理论为视角,通过对居家养老、机构养老与家庭养老3种养老模式进行对比研究,得出居家养老是实现养老服务均等化的最优路径[9]。穆光宗(2000)通过对家庭养老、社会养老与自我养老的区分,论证传统养老方式变革的必然性[10]。

2.4 研究热点

本文主要通过关键词共现网络来展示居家养老领域热点词汇与研究热点,运行Cite SpaceⅢ,绘制关键词共现网络知识图谱,导出Cite SpaceⅢ中的数据,梳理出居家养老领域研究热点的关键词及其中心度(见表1),出现频次在前三位的关键词分别是居家养老、机构养老与养老模式。可以看出,在居家养老领域中机构养老和养老模式是重要的研究内容与研究热点。而从中心度方面看,节点值较高的有社区养老服务、家庭养老等。这表明,社区养老服务、家庭养老也是居家养老领域的研究热点。

2.5 研究前沿

本文利用Cite SpaceⅢ的膨胀词探测算法确定居家养老领域的研究前沿,主要是以关键词的突显值为评价指标,统计结果如表2所示。表2中的Burst值反映了关键词的变化频率,例如“老年福利”(2002)“社会福利社会化”(1998)“福利服务”(2002)等Burst值较高,表明这类关键词是居家养老领域当时的研究热点。近年来,关于居家养老方面的“服务条例”(2014)等方面的研究出现突然增多的现象,Burst值较高,成为居家养老研究的重要前沿领域。

3 结语

(1)研究关注度不断增强。纵观1995—2015年的统计数据,居家养老相关研究论文在数量上已经有了质的飞跃。随着互联网的普及和民主进程的推动,居家养老将受到越来越多的专家学者和政府、个人等社会不同层面实践者的关注,会产生出更多有价值的研究成果。

(2)持续、稳定的研究者和研究机构正在形成。从统计结果看出,居家养老领域正在形成一批稳定、持续、有影响力的研究者和研究机构。在该研究领域代表人物方面,如李春根、唐韵、鲁可荣、金菁、梁永郭、段春颖、胡宏伟等领军人物,也有不少后起之秀,如穆光宗、郭穆琦、包宗华等学者;在研究机构方面,既有中国老龄科学研究中心等专业研究机构,各大高校的研究中心也相继成立,此外,随着各级党政部门积极投入关注,必将推动居家养老研究向纵深发展。

(3)居家养老研究有待深入。目前大多数对居家养老的研究停留于表面,集中于居家养老的基本概念、养老方式等,研究主要以定性为主,缺乏定量的研究。

(4)高质量的研究尚有欠缺。从统计数据中可以看出,2010年之前在核心期刊上发表的文献数量还不是很多,这主要由于居家养老服务发展的时间还比较短,很多方面的研究还处于初步阶段,但这也为广大学者提供良好的契机,因为新兴的研究热点与领域更容易出成果。

(5)研究仍需要基金项目的大力支持。随着国家社会科学基金、自然科学基金以及大量省部级基金项目对居家养老的关注与资助,近几年这方面的课题和研究成果也越来越多,居家养老研究的创新与发展还需要各大基金项目更大力度的支持。

摘要:随着经济和人口的发展,我国已经进入老龄化社会,在传统家庭养老功能弱化的大背景下,我国政府正在逐步推动居家养老服务以解决养老问题。那么,如何正确认识居家养老服务问题以及这一问题会对我国的养老事业和政府政策的制定产生什么样的影响,逐渐成为学术界研究的重点。基于此,文章对CNKI中居家养老的研究文献进行梳理与总结,利用知识图谱这一文献计量研究方法分析当前居家养老领域的研究现状、研究热点以及未来的发展趋势,希望对研究者们提供一定的研究意义与参考价值。

关键词:居家养老,文献计量,可视化分析

参考文献

[1]袁缉辉.强化家庭作用支持居家养老[J].上海大学学报:社会科学版,1995(6):30-34.

[2]颜秉秋,高晓路.城市老年人居家养老满意度的影响因子与社区差异[J].地理研究,2013(7):1269-1279.

[3]姚远.从宏观角度认识我国政府对居家养老方式的选择[J].人口研究,2008(2):16-24.

[4]王莉莉.中国居家养老政策发展历程分析[J].西北人口,2013(2):66-72.

[5]陈友华.居家养老及其相关的几个问题[J].人口学刊,2012(4):51-59.

[6]崔恒展.居家养老的源起演变及其内涵探究[J].山东社会科学,2015(7):120-124.

[7]包国宪,刘红芹.政府购买居家养老服务的绩效评价研究[J].广东社会科学,2012(2):15-22.

[8]鲁可荣,金菁.农村居家养老何以可行及可持续——基于浙江“金东模式”的实证分析[J].中国农业大学学报:社会科学版,2015(6):87-93.

[9]胡宏伟,时媛媛,肖伊雪.公共服务均等化视角下中国养老保障方式与路径选择——居家养老服务保障的优势与发展路径[J].华东经济管理,2012(1):119-123.

上一篇:创新信访管理模式下一篇:墙文化