引文信息

2024-11-07

引文信息（共11篇）

引文信息篇1

2009年4月中共中央和国务院在有关医疗卫生体制改革方案中把“建立使用共享的医药卫生信息系统”列为“八大支柱”之一, 医疗卫生信息化被提到了前所未有的高度。随着信息技术的迅猛发展, 医疗信息系统发展到一个新的阶段, 其主要标志是许多医疗机构开发和应用大规模一体化的区域医疗信息系统, 共享各类数据并开展协同服务。建立区域医疗信息共享与协同服务是落实新医改政策、解决“看病难、看病贵”问题以及“提高人民群众健康素质”这一重大民生工程的关键[1]。根据IDC报告回顾, 最早的区域医疗信息化探索始于上世纪八十年代末, 美国通过以社区卫生信息网络 (Community Health Information Network, CHINs) 的形式探索区域卫生信息协同共享模式[2]。此后, 美国从以国家卫生信息网 (National Health Information Network, NHIN) 为代表的国家级、以State Designated Entity (SDE) 为代表的州级和以区域卫生信息组织 (Regional Health Information Organizations, RHIOs) 为代表的地区级三个层面全面开展区域医疗卫生信息化工作[3,4,5,6,7];加拿大通过INFOWAY推动国家以及各地区域卫生信息网的建设, 建立全国性的电子健康档案等系统[8];欧洲启动了欧洲健康信息网络战略计划 (Strategic Health Information Network for Europe, SHINE) [9];澳大利亚通过成立National e Health Technology Architecture (NEHTA) 组织, 从国家层面制定卫生信息化领域的相关标准、政策制度和法律法规, 推动区域医疗信息化建设[10]。国内也在北京、上海、中山、厦门等地开展了区域医疗的试点示范。区域医疗信息协同共享模式在改变患者的就医习惯的同时, 促进了现代医疗服务模式的变革, 增强了医疗服务的可及性、提升了医疗服务质量、提高了医疗服务效率、降低了医疗成本和风险, 并为医疗大数据的发展奠定了坚实的基础, 成为医疗卫生管理的协同创新模式和重要发展方向[11]。

区域医疗领域内的相关研究日益增多, 当前已成为国内外学者研究的热点之一, 以国内研究为例, 在中国期刊全文数据库和万方知识数据库中, 以“区域医疗”或“区域卫生”为主题检索词进行精确检索, 分别得到相关研究文献3 834篇 (2013-12-26) 和2 294篇 (2013-12-26) , 其中2010年以后发表的文献分别为2 143篇和1 312篇, 占全部文献数量的一半以上。

本文基于Web of Science (简称WOS) 数据库, 综合运用引文分析和可视化技术方法, 对区域医疗信息化领域相关文献进行比较、归纳、概括, 找出该领域的核心文献、核心期刊、核心作者及高频关键词, 编注清晰直观的引文编年图, 从而把握该领域的研究历史, 提炼出研究重点难点, 预测今后的发展趋势, 提高相关研究的创新性和学术价值。

1 研究方法

在科学文献体系中, 文献与文献之间的引用存在直接或间接等现象, 表现出网状或链状引用结构。引文分析, 就是综合运用数学及统计学的方法, 对引用对象和被引用现象进行比较、归纳、概括及分析, 从而揭示其内在规律和特征。通过对文献与文献之间的这种相互关联、相互引用关系的分析, 不但能说明引文与被引文的学科内容之间的联系强度, 而且还能反映引用文献的广度和深度。引文分析方法相对于学者个人归纳、访谈调查等主观研究方法, 具有客观性、科学性和有效性等特点, 能帮助研究者迅速准确把握特定领域研究的趋势和规律[12]。目前, 引文分析已经成为文献计量学和科学计量学中成熟的定量研究方法。当前主流的可视化引文分析方法主要有引文编年图法 (Historiography) 、文献耦合分析 (Bibliographic Coupling) 、文献同被引分析 (document co-Citation) 以及作者同被引分析 (Author Co-Citation) [13,14,15]。

本研究主要通过编制引文编年图, 分析区域医疗信息化领域的历史规律、存在现状及发展趋势。这样可以从更清晰、直观、形象的视野显示出研究主题各个环节的发展沿革及继承关系, 全方位、多层次凸显研究领域中的重点、难点, 有助于发现区域医疗信息化领域的发展脉络、规律及前行走势。

本文的分析与结论的产生以国际权威的美国科学情报研究所 (Institute for Scientific Information) 的WOS数据库作为数据来源, 数据单元主要包括文献作者、题目、摘要和文献引文等。以“regional medical Information”或“regional health Information”为主题检索词在WOS数据库中进行精确检索所有年份的文献记录, 共检索得到104篇文献 (2013-12-26) , 其中“Article”类型的文献67篇, “Proceedings Paper”类型文献36篇, “Meeting Abstract”类型的文献7篇, “Editorial Material”类型的文献4篇, “Review”类型的文献1篇。从WOS数据库导出检索到的文献记录后, 使用文献分析工具Hist Cite 12.03.17软件作为辅助分析工具对区域医疗信息化领域的相关研究进行实证分析。

2 重点要素的确定

以检索到的104篇文献为样本, 运用可视化引文分析方法, 采用知识图谱方式, 编著引文编年图, 并通过分析、比较, 得出该领域的核心文献、核心期刊、核心作者、高频关键词等重点要素, 分析出区域医疗信息化领域的热点、前沿及发展脉络。

图1是根据104条文献记录的时间先后顺序和引用关系, 编写的引文编年图, 每篇文献是图中一个圆形节点, 圆形节点之间带箭头的连线代表了文献之间的引用与被引用关系, 圆形节点的面积越大表示被引频次越多。

2.1 核心文献的确定

核心文献是指在研究领域内的关注度高、重要程度高、贡献大、影响大, 能反映该领域的研究重点和趋势的文献。界定核心文献的主要指标是本研究领域总被引次数LCS (Local Citation Score) 和在整个SCI数据库中的总被引次数GCS (Global Citation Score) 。

通过Hist Cite软件, 按照LCS值的大小对104条文献记录进行降序排序, 结果如图2所示。其中, 按LCS排名第一的是University of California的学者ROBERT H.MILLER和BRADLEY S.MILLER发表在HEALTH AFFAIRS (《卫生事务》) 上的“The Santa Barbara County care data exchange:What happened?”一文, 文章指出圣巴巴拉郡的健康数据交换计划曾经是美国最有雄心勃勃的卫生信息交换项目之一。为提高医疗卫生水平和降低成本, 加利福尼亚地区的各医院和诊所之间计划通过可协同共享的电子病历共享病友信息。在该项目运行8年, 耗尽了1 000万美元的资助经费后, 尽管基础设施得到了发展, 许多医生也在使用电子记录, 但是, 跨诊所共享数据、轻松地跟踪患者治疗的梦想却已逐渐破灭, 该地区的医疗机构看不到这个项目继续下去的价值, 圣巴巴拉郡的健康数据交换计划悄然落下帷幕[16]。按GCS排名第一的是HARVARD UNI-VERSITY的学者ADLER-MILSTEIN J等人发表在HEALTH AFFAIRS (《卫生事务》) 上的“The state of regional health information organizations:Current activities and financing”一文, 文章指出电子病历数据交换会带来良好的经济和社会效益。该文作者早在2007年, 调查了145家区域卫生信息组织 (RHIOs) , 近四分之一可能倒闭, 只有20%的保持适度规模和交换临床数据, 调查结果提高了对实现广泛的电子病历数据交换的担忧[17]。按LCS排名前5名的其他几篇文献分别从区域医疗的建设模式、技术方法、可持续发展的商业模式等方面进行了研究, 并指出区域医疗信息化在保障临床诊断的准确性、提高临床工作效率和促进公共卫生事业的发展等方面的重要作用[18,19,20,21]。

2.2 核心期刊的确定

核心期刊是指在该领域研究成果发表数量多、被引用次数高、影响程度大的期刊。这类期刊中的被引文献具有一定的集中性特点, 通过客观分析文献被引用的数量、频率, 得出在该研究领域中所占比重, 就能从引文利用角度确定核心期刊。对区域医疗领域核心期刊上发表的学术论文进行深入学习、分析与研究, 有助于准确把握该领域的研究动态、研究重点和发展方向。

本研究通过统计期刊文献数量和被引频次两个指标来遴选区域医疗领域的核心期刊, 在涉及的60余种期刊中选取了10种期刊 (见附表) , 这些期刊为区域医疗信息化相关研究提供重要数据来源和信息基础。其中, “HEALTH AFFAIRS”《卫生事务》、“JOURNAL OF THE AMERICAN MEDICAL IN-FORMATICS ASSOCIATION”《美国医学信息学杂志》、“INTERNATIONAL JOURNAL OF MEDICAL INFORMATICS”《国际医学信息科学杂志》、“METH-ODS OF INFORMATION IN MEDICINE”《医学信息方法》和“JOURNAL OF BIOMEDICAL INFOR-MATICS”《生物医学信息学杂志》五种期刊在2000~2013年间共发表相关文献39篇, 占WOS区域医疗信息化领域文献总量的37.5%。进一步分析数据, 这五种期刊上发表的39篇文献的TLCS (Total Local Citation Score) 总和为49, 所占比重为TLCS总数的70%, TGCS (Total Global Citation Score) 总和为533, 所占比重68.6%。通过分析可以确定, 以上五种期刊是区域医疗信息化领域的核心期刊。

2.3 核心作者的确定

核心作者是通过发表论文的数量多、引用频次高、贡献程度大来确定的。核心作者的确定, 能使人们更深入地了解他们的研究内容、方法和结论, 追踪他们的研究主题和方向, 便于快速了解该领域的重点、难点、热点和发展点。

在本研究的104篇论文中, 共有332位作者。以发表文献数量为主要指标, 参考TLCS和TGCS值, 对文献作者进行排序 (如图3、4所示) 。从图中可以看出, New York Presbyterian Hospital的KAUSHAL R (Kaushal, Rainu) 从2007年~2013年共参与著作了6篇文献, 发表文献数量排第一名。发表的文献被引用频次排在前两位的分别是美国学者TSIK-NAKIS M和KATEHAKIS DG, 反映了他们对该领域的贡献程度较高。

2.4 高频关键词的确定

关键词是文献检索的核心要素, 它高度概括了文献研究成果的核心内容, 以高频率出现的关键词, 揭示该研究领域的特征及规律, 反映了研究内容的热点和发展趋势。

在本研究的104篇论文中, 共涉及关键词415个, 如图5所示。从前20个高频词中可以看到, “Regional”、“Medical”、“Health”、“Information”是最常用的检索关键词, 展现了某一特定的内容特征。“Systems”、“System”、“Network”、“Networks”、“Based”、“Infrastructure”等词条的大量出现说明区域医疗领域的研究对象主要包括基础架构、网络环境、基础设施和信息系统。“Electronic”、“Record”、“Date”、“Exchange”、“Open”、“Management”、“Organizations”等高频词条表明区域领域的研究内容主要是医疗电子数据、记录、交换、开放、组织管理。“Use”和“Outcomes”关键字表明区域医疗研究领域关注应用研究和成效。

3 讨论

本文运用可视化引文分析方法, 确定了区域医疗信息化领域内的核心文献、核心期刊、核心作者及高频关键词等重点研究要素, 对该领域内现有成果、发展状态及部分热点、难点问题进行了分析, 帮助研究人员在面对海量的科学文献时, 快捷、直观把握重点, 为深入研究新问题、探索新方向提供有利资源。通过以上重点要素的确定及相关文献的分析, 笔者也进行了一些思考。

3.1 国内外优秀成果少

区域医疗自上世纪末开始展开研究以来, 多个国家都在此领域积极探索, 力求寻找突破的道路, 但在该领域的优秀成果一直较少。从文献数量上看, 美国是在区域医疗领域发表文献最多的地区, 几乎占WOS数据库中总数的一半, 其发表文献的引用频次也最高。欧洲国家发表的文献数紧随其后, 英国、德国、希腊、芬兰、意大利、瑞典等国家都在区域医疗领域展开了研究, 日本和加拿大在区域医疗领域也有少量相关研究成果。我国大陆地区发表的区域医疗文献共4篇, 按文献数量排名居于第7位。以“区域医疗”为关键词, 在CSCD数据库中进行检索, 区域医疗信息化领域的学术研究文献仅32篇 (其中核心刊8篇) , 在CSSCI数据库中, 仅5篇。这与在中国期刊全文数据库中区域医疗相关文献数3 834篇和万方数据知识服务平台中区域医疗相关文献数2 294篇形成强烈的对比。从期刊情况上看, SCI收录医学信息学学科期刊共22种 (其中SCI核心版12种) , 其中美国医学信息学期刊10种, 英国4种, 德国3种, 爱尔兰2种, 加拿大、荷兰、澳大利亚各1种。目前在国内的医学信息学刊物主要有:卫生部统计信息中心主办的《中国卫生信息管理杂志》和中国医学科学院主办的《医学信息学杂志》。刊发医学信息学领域论文较多的刊物还有重庆市医学会和重庆市卫生信息中心主办的《重庆医学》、中华预防医学会主办的《中国农村卫生事业管理》和四川省卫生厅主办的《中国卫生事业管理》等。以上刊物仅有《重庆医学》为CSCD扩展版, 无CSSCI来源期刊。从期刊的情况可以看出国内与国际在该领域相比存在巨大差距。

3.2 区域医疗信息化研究发展缓慢

WOS数据库中收录的区域医疗领域的文献自2000年开始才有记录, 从文献的数量变化上来看, 直至2005年文献总数仅为20篇, 说明这五年间, 区域医疗信息化领域的研究并没有引起足够重视, 仅仅是零散边缘化研究。其中, 在2000年和2001年的时候, 只有2篇文献而且没有被引用, 说明当时处在区域医疗信息化研究的初始阶段, 研究成果很少且不成熟。在2002年和2004年的11篇文献中, 有7篇文献得到了广泛引用, 文献数量虽然较少, 但已经产生了较为重要的研究成果, 说明区域医疗信息化的研究慢慢进入发展阶段。2005年到2009年文献数量出现明显上升趋势, 相互引用也比较普遍, 说明区域医疗领域的研究开始逐渐涌现, 并步入繁荣, 研究成果稳步递增, 学术交流气氛活跃。表明区域医疗的相关研究进入上升期, 开始出现较多的研究成果。2010~2013年间, 文献数量和引用频次停滞不前, 甚至有减少的现象, 说明区域医疗信息化的相关研究处于艰难推进阶段, 研究成果难以呈现。

3.3 区域医疗推进难度大

区域医疗信息化是一项复杂、系统的工程, 涉及医疗机构、医保部门、政府和企业等多个单位, 目前面临着医疗机构信息化基础薄弱、应用水平低、技术与人才匮乏、资金投入不足、缺乏顶层设计和成熟的信息标准体系、缺乏相关法律法规、医疗政策与医保支付模式不匹配、缺乏有效的商业运营模式等诸多问题, 虽然多个国家和地区都积极尝试, 但是由于区域医疗信息化建设开展时间较短, 不同体系壁垒难打破, 尚处在探索和试点阶段, 缺少有深度的实证研究成果, 总体推进缓慢, 目前成效显著者极少[22]。国内外的研究多局限于系统概念、信息共享、建设模型和技术实现途径等方面的探讨, 还没有较为成熟的研究理论体系。如何打破当前不同体系各自为战、力量分散、协同效率不高的模式, 实现系统优化, 解决内涵发展成为当务之急。

引文注释规范篇2

(一)来自图书的引文

(1)著作

顺序：责任者?著作名?出版者?出版年?页码

资中筠：《国际政治理论探索在中国》，上海人民出版社，1998年，第304页。

[美]罗伯特?基欧汉：《霸权之后》，上海人民出版社，2001年，第109-119页。

Charles Kupchan, The End of the American Era: U.S. Foreign Policy and the Geopolitics of the Twenty-first Century, New York: Knopf, 2002, p. 28.

(2)析出文献（著者和析出篇名可视具体需要标注或不标注）

顺序：著者?析出篇名?文集编者?文集题名?出版者?出版年?页码

亚历山大?文特：“国际政治中认同和结构变化”，约瑟夫?拉彼德、弗里德里希?克拉托赫维尔主编：《文化与认同：国际关系回归理论》，浙江人民出版社，2003年，第75页。

《毛泽东外交文选》，中央文献出版社、世界知识出版社，1994年，第93页。

《马克思恩格斯书信集》，人民出版社，1962年，第7-8页。

Noam Chomsky, “International Terrorism: Image and Reality,” in Alexander George （ed.）, Western State Terrorism, New York: Routedge, Champman & Hall, Inc., 1991, p. 28.

(二)来自期刊和报纸的引文

顺序：著者?篇名?期刊名（报纸名）?年期（年月日）?页码（可省略）

秦亚青：“多边主义研究：理论与方法”，《世界经济与政治》，2001年第10期，第9页，第13页。

门洪华：“国际机制与美国霸权”，《美国研究》，2001年第1期，第74-88页。

中国外交部亚洲司司长傅莹：“新时期的亚洲”，《大公报》，2003年3月12日。

引文信息篇3

随着计算机技术的飞速发展和各国专利网络数据库的免费在线提供, 专利引文分析研究已经进行得较为深入并朝着可视化方向发展, 但在专利引文数据的选择以及有效性问题上国内学者考虑得还太少。Meyer2000年在探讨专利引文数据有效性时提到:必须深刻理解各国专利实践活动才能恰当地解释专利引文数据。Michelle以及Paila Criscuolo等众多学者在大规模收集美国专利和欧洲专利引文数据的基础上, 发现不同专利制度下2个专利系统在平均引文数量、引用地域分布、发明人和审查员引文比例上都存在极大不同, 这就意味着选择不同的专利系统作为专利引文数据来源将会造成分析结果的差异。

对于必须通过美国知识产权局专利数据库以及欧洲专利局数据库收集专利引文数据的国内学者而言忽略各国专利实践过程中的差异所得到的专利引文数据将会影响到专利引文分析的质量和效果, 本文将对比美国和欧洲专利局的审查标准和相关程序, 对这2个组织提供的专利引文数据特点以及对引文分析产生的影响进行描述。

1. 专利引文数据来源

目前我国专利数据库均不提供专利引文数据, 国内学者进行专利引文分析时主要选择美国专利全文或文摘数据库、欧洲专利局提供的欧洲专利数据库或世界专利数据库、日本专利局知识产权电子图书馆作为引文数据来源, 这些数据库均免费提供专利的引用与被引用信息。本文选择前2个更常用的平台进行介绍和对比。

(1) 美国专利商标局 (USPTO) 专利数据库 (www.uspto.gov) 。

美国是世界发明专利第一申请大国, 各国家在美国申请的专利占世界专利的1/3。美国专利与商标服务局提供的公布专利数据库提供详细的引文信息, 当通过专利权人或通过技术类别检索出一批专利文献后, 点击专利号或题名进入可以看到该专利引用的在先专利列表、引用的其他科技文献列表和该专利的被引信息列表, 这些均是各个角度专利引文分析的数据基础。

(2) 欧洲专利组织专利数据库 (ep.espacenet.com) 。

欧洲专利组织 (EPO) 也是世界上授予专利权较高的专利组织, 在每一份欧洲专利说明书中都包含审查员进行新颖性检索得到的检索报告 (search report) , 罗列出该发明最相关的在先技术。在检索欧洲专利数据库时, 点击某一专利篇名进入后可以看到该专利的引用与被引用数据, 其中引文数据来自于欧洲专利组织的专利检索报告。

2. 美国和欧洲专利引文数据的对比

从20世纪80年代至今, 很多学者都运用数学方法证明专利被引次数的多少确实与其技术价值和经济价值呈正相关, 从而证明专利引文分析具有一定的可靠性;但在专利引文分析技术不断深入发展的同时, 国外学者对专利引文数据有效性的探讨以及对不同专利制度下产生的专利引文数据所做的比较一直都在进行。

(1) 基于同族专利的专利引文对比。

笔者在利用USPTO平台做IBM公司专利分析的过程中随机抽取了专利US5634015, 并转到EPO平台中世界专利数据库 (worldwide) 检索到该专利的同族专利EPO498201, 同族专利是同一发明在不同国家申请的专利文献。如表1所示为从欧洲专利局为EPO498201提供的检索报告中提取的该专利文献的引文;如表2所示是从美国专利局授权专利数据库中提取的US5634015的专利引文。

理想状态下, EPO498201和US5634015的引文应该一致, 因为它们所描述的发明内容完全相同, 是同一申请人为取得在不同地域的专利保护而在不同国家申请的专利。但通过比较表1和表2发现, 这2个同族专利的引文不仅在数量上不同, 在内容上也没有一条是相同的, 甚至欧洲专利局审查员认为与EPO498201密切相关的引文EPO255096和US4371924均没有出现在US5634015的引文列表中 (在欧洲专利检索报告中, 在审查员认为密切相关的甚至可以否认申请专利某些权项要求的引文前加[X]标注) 。表3列出了US5634015各引文的欧洲同族专利, 6篇引文中有5篇具有欧洲同族专利, 按理说如果标准相同的话, 无论哪个系统的审查员都应该能够检索出相同的引文, 但事实上并非如此。

另外, EPO498201的引文既有欧洲专利 (EPO255096) , 也有美国专利 (US4371924和US4715030) , 而US5634015的专利引文全部都是美国专利。这些虽然是对一个专利发明的引文信息进行的比较, 还不具备统计学意义, 但在一定程度上说明了专利引文信息并不像人们想象的那样具有高可靠性, 不同系统间的专利引文数据存在着差别。

(2) 基于统计的专利引文对比。

不同系统间的专利引文数据差别有多大, 是否会对专利分析造成较大误差, 需要进行统计学意义上的引文信息对比———在收集大量引文数据的基础上进行不同角度的比较。

(1) 平均引文量。

Michelle和Bettels对1999年所有欧洲专利和美国专利的引文数量进行了对比, 他们的研究发现:美国专利的平均引文为12.96条, 大约是欧洲专利平均引文4.37条的2.96倍;在同时具有美国、欧洲、日本等同专利的专利集合中, 美国专利局授权的专利拥有平均引文14.26条, 其由欧洲专利局授权的同族专利拥有的平均引文只有4.18条, 倍数扩大到3.4;非专利引文也具有相同的趋势。

Sampat收集了2001年至2003年间502687件美国发明专利的引文信息, 其中包括6324381件美国专利引文, 1382430件外国专利引文, 经计算得到这一期间美国发明专利的平均引文为15.33, 与Michelle和Bettels对1999年美国专利进行研究得到的12.96相比又有了增加。而Paola Criscuolo和Bart Verspagen收集了1985年至2000年间共700674件欧洲专利, 共得到2859714件专利引文, 平均引文量为3.25, 还略小于Michelle和Bettels的4.37。

造成这一现象的主要因素是美国和欧洲专利审查的可专利性需求不同, 美国专利局的专利审查比欧洲专利审查标准化程度和要求都更低。据Quillen和Webster统计, 美国专利申请的通过率在80%以上, 加上美国专利本来数量庞大, 为后续专利提供了更多的在先技术和引用基础, 因此更多的参考文献出现在美国专利说明书的扉页上, 其中包括很多相关性并不大的在先技术。人们甚至可以看到参考专利引文在100条以上的专利。

欧洲专利审查更具标准化, 检索和实质性审查是严格分开进行的, 检索审查员的任务是根据申请书的权利要求识别最相关的在先技术, 而实质性审查员则不受检索审查员的影响对新颖性和商业应用潜能做出判断。根据E-PO2005年的指导书可以了解EPO引文选择原则:只选择必要的最相关的文献作为引文, 如果几个在先技术与申请技术相关性相同, 只选择其中之一加入引文列表。从这一角度而言, 大多数学者认为欧洲专利引文具有更高的可靠性。

另一个原因是美国专利的发明人倾向于在申请书中添加大量的引文以满足美国专利法规的要求, 申请人一般会先进行在先技术的检索以保证申请通过审查, 这一点将在后文描述。

(2) 外国专利引文比例。

Michelle和Bettels同时发现:1999年欧洲专利局授权专利的引文国别分布较美国专利局授权专利的引文更为分散, 欧洲专利引用最多的不是欧洲本土专利而是美国专利, 占总数的30.9%, 世界专利 (WO) 、德国专利 (DE) 、日本专利也占不小的份额;而1999年美国专利商标局授权专利的专利引文则呈现完全相反的景象, 90.2%的引文来自美国本土, 其他国家专利只占9.8%, 所引用的欧洲专利、日本专利、世界专利均不超过2%。

利用Sampat收集到的数据进行计算, 2001-2003年美国专利的外国专利引文占总引文数的17.9% (总引文数7706811件, 外国专利引文数1382430件) , 这一比例比通过表5数据计算到的9.8%有了较大增长, 但与本土引文所占的82%仍然有非常大的差距。Sampat的数据还显示:这些美国发明专利的引文有41%是由审查员发现的 (其余59%由申请人在专利申请书中揭示) , 但审查员发现的外国专利引文只占所有外国专利引文的12.3%, 这说明本来数量就偏少的外国专利引文绝大部分是由申请人添加的。可以说Sampat的研究进一步证明了美国专利局授权的专利更倾向于由申请人或审查员在专利说明书中揭示本国在先技术, 而对外国在先技术的反映存在一定的局限性。这对于美国专利不占优势的技术领域, 由于大部分基本专利分布在其他国家, USPTO的这种特性将导致大量专利引文漏检, 以此为基础的专利引文分析会带来较大偏差。

(3) 发明人引文和审查员引文比例。

上文已经提到Sampat的研究发现:2001-2003年美国专利的引文有59%由发明人在申请书上添加, Alcacer和Gittlelman2006年的研究也得到了相似的比例, 他们认为60%的美国专利引文来自于专利发明人而不是审查员。

从Paola Criscuolo和Bart Verspagen的数据中却发现欧洲专利的专利引文呈现另一种趋势, 1985年至2000年间75.77%的欧洲专利其引文全部由审查员提供, 发明者在申请书中添加的专利引文只占总引文数量的11%。如果考虑年代的因素, 那么通过图1可以看出申请人专利引文占总引文比例随着年代的增长呈下降的趋势, 从1985年的14%逐渐下降到1999年的9%。

Aker指出美国专利法规定每一个发明人具有揭示所有与该发明相关的在先技术的职责, 不这样做将导致严重的惩罚, 因此申请人总是倾向于提交宽泛而庞大的引用列表以免承担日后专利权被撤销的风险。学者们普遍认为美国专利局的专利检索报告更具有文献检索的特征而不是专利新颖性检索特征。欧洲专利局则没有这样的规定, 只是要求申请人在申请书中尽可能描述技术背景, 帮助审查员了解该发明, 申请人可以选择是否提交在先技术列表。即便申请人提交该列表, 审查员也将对这些在先技术进行分析和过滤以保证只选出最密切相关的在先技术记录在检索报告中。2个专利系统间规则的差异导致发明人引文和审查员引文比例存在较大差异, 也导致2个系统中专利的平均引文数相差悬殊。

另一点要说明的是, 无论是欧洲专利还是美国专利, 它们的发明人引文比例都与具体的技术类别相关:Paola Criscuolo和Bart Verspagen发现欧洲专利中有机化学领域的专利其发明人引文比例超过20%, 而信息技术领域发明人引文比例不足4%, 说明在同一专利系统中不同技术领域的发明人添加专利引文的习惯是不同的。发明人是否进行深入的新颖性检索以及揭示在先技术的影响因素很多, 包括一些策略上的考虑, 如有些领域的申请人只希望获得更多的专利而形成保护网, 并不在意专利质量, 这种申请人可能倾向于少揭示其引用的具有其发明基础特征的专利, 而将其他无关紧要的专利作为引文。因此发明人引文比例过高一定程度上影响了专利引文数据的可靠性。

3. 影响与对策

对于中国学者而言, 由于国内专利数据库不含引文数据, 进行专利引文分析的数据源一般都依赖EPO和USPTO的专利数据库平台, 如重庆医科大学图书馆的侯筱蓉、司有和在《基于引文路径分析的专利技术演进图制作的实证研究———以医学内窥镜专利分析为例》一文中描述了他们的引文数据来源:先利用IPC分类号找出与医用内窥镜有关的国内专利, 再利用这些专利在其他专利系统 (EPO、USPTO、JPO) 中的同族专利获得免费的专利引文数据。通过上文的对比, 笔者认为在利用专利引文数据时, 应该意识到不同系统中引文数据具有明显差异, 应根据课题的具体目标进行选择数据源, 并应注意以下标准。

(1) 尽量选择EPO专利平台获取引文信息。

通过上文的比较可以看出, EPO专利的引文数量较少, 外国专利分布比较均衡, 而引文多来源于审查者, 因此几乎所有的研究人员都认为EPO的专利引文数据“噪声”更小, 作为专利引文数据源更加可靠;美国专利系统授权的发明专利数量巨大, 又比较依赖发明人在申请书中添加他们认定的在先技术作为引文, 在进行新颖性检索时对美国专利系统以外的在先技术揭示不足, 这些都导致某些专利的授权本身存在错误 (本来不具备新颖性, 却获得了专利权) , 专利质量受到影响, 反过来又影响到后续专利的引文质量, 大部分研究人员认为美国专利系统的引文数据质量与EPO引文相比存在一定差距。因此, 在进行专利引文分析时, EPO专利平台应该是首选。

(2) 尽量使用同一系统收集引文数据。

在进行专利引文数据收集的时候, 应该选择同一专利系统作为数据源。在同一系统中, 不论发明人还是审查者都遵循相同的标准和规则进行新颖性检索和专利引文添加, 引用习惯也基本相似。在这种情况下, 一些数据误差可以通过修正方法加以矫正。如果从多个专利系统中提取专利引文数据, 则因为各系统具有不同的引用规律, 很难用单一的方法进行修正。美国专利引文数据虽然相对而言质量偏低, 但并非不可用, 事实上很多研究人员都利用USPTO收集专利引文数据, 但同时在多个平台上进行数据收集显然是不可取的, 应该尽量避免。

(3) 收集的引文数据应该进行修正。

不论是利用EPO还是USPTO收集引文数据, 都应该根据分析目标加以修正。EPO的专利引文数量偏少, 在通过引文数据进行技术路径变化研究时可能出现节点较少而无法有效聚类的情况;而USPTO则正好相反, 可能出现节点过于密集连成一片的情况, 加大分析的复杂性。对于前者有国外学者采用多阶段引文分析法加以修正, 即选择一批基本专利, 收集其专利引文及引文的引文, 扩大节点数量;后者需要研究者精心设定阈值, 满足一定条件的引文才能入选作为分析对象。

4. 结语

专利引文分析是专利情报分析的重要组成, 对挖掘重要的专利技术、识别重要的竞争对手、研究技术的演进和技术预测都有重要的意义, 而保证专利引文数据具有较高的有效性又是专利引文分析的前提。本文对EPO和USPTO所做的引文数据对比主要基于国外学者的数量统计, 接下来的研究应该致力于利用从不同专利系统收集的专利数据进行专利引文分析的实证研究并比较分析结果, 才可以得到更加有效的结论。

摘要：专利引文分析是专利情报分析的重要组成, 而有效的专利引文分析是以高质量的专利引文数据为前提的。EPO和USPTO是国内学者通常使用的手机专利引文数据平台, 但由于欧洲专利组织和美国专利商标局的审查标准和相关程序不同, 导致这2个专利系统在平均引文数量、引用地域分布以及发明人和审查员引文比例上存在很大差异。文章对比了EPO和USPTO的引文数据差异, 分析了差异产生的原因并针对专利引文数据收集提出了一些建议。

关键词：专利引文分析,平均引文,发明人引文,外国专利引文,USPTO,EPO

参考文献

[1]Narin, F.Patent bibliometrics[J].Scientometrics.1994 (30) :147-155.

[2]Meyer, M.What is special about patent citations?Differences between scientific and patent citations[J].Scientometrics, 2000 (49) :93-123.

[3]Michel, J, Bettels, B.Patent citation analysis:A closer look at the basic input data from patent search reports[J].Scientometrics, 2001 (51) :795-816.

[4]Sampat, B.N.Determinants of patent quality:an empirical analysis[R].Mimeo Columbia University, 2005.

[5]Paola Criscuolo, Bart Verspagen.Does it matter where patent citations come from?Inventor vs.examiner citations in European patents[J].Research Policy 2008 (37) :1892-1908.

[6]Quillen, C.D., Webster, O.H.Continuing patent applications and performance of the U.S.patent office[J].Federal Circuit Bar Journal, 2001 (11) :1-21.

[7]Alcacer, J, Gittelman, M.Patent citations as a measure of knowledge flows:the influence of examiner citations[J].Review of Economics and Statistics, 2006 (88) :774-779.

[8]Akers, N.The referencing of prior art documents in European patents and applications[J].World Patent Information, 2000 (22) :309-315.

[9]Rule 27 (1) (b) of the European Patent Convention[EB/OL].2005.http://www.espacenet.com.

[10]侯筱蓉, 司有和, 吴海燕.基于引文路径分析的专利技术演进图制作的实证研究——以医学内窥镜专利分析为例[J].情报学报, 2008 (5) :788-791.

中国科学计量指标论文与引文统计篇4

一.关于编制意图

科学技术作为第一生产力，在当今中国的经济发展和社会进步中正发挥着越来越显著的作用。人们对于中国科学技术对国民经济发展的贡献率，对于中国科学技术的发展水平在国际上所处的地位，对于比较和评价国内科研机构、高等院校和企业的研究与开发活动的绩效和成果产出等，产生了越来越浓厚的兴趣。为此，学术界从定性和定量两个角度提出了测算和评估的一些理论、方法和指标，其中，论文量和引文量是衡量以论文为主要产出形式的研究活动的两类重要计量评价指标。

美国SCI（Science Citation Index）是“中国看世界，世界看中国”的权威性的科学引文分析工具。由于SCI收录中国期刊太少，将SCI作为“中国看中国”的工具则缺乏普遍性。中国科学引文数据库（Chinese Science Citation Database，简称CSCD）能有效地弥补这些不足，它在基本结构和选刊原则等诸多方面与美国SCI接轨，是研究国内科学技术活动整体状况的引文分析工具。为了帮助科教决策部门科学地评价我国科学活动的宏观水平和微观绩效，为了给学术界研究与评价科学交流和传播机制积累基础性数据，为了帮助科研人员客观地了解自身的学术影响力，也为了科学计量学和文献计量学学科的成长与发展，中国科学引文数据库紧密结合国情，以SCI和CSCD的来源期刊为统计源，精心设计和编制了这本《中国科学计量指标：论文与引文统计》（以下简称《指标集》）。

二.关于统计源

《指标集》设置的百余项有关论文与引文的指标是根据美国SCI和中国CSCD为基础数据统计而成（书中的统计数据如无特殊说明，均按第一著者统计）。

1.SCI数据说明

SCI的数据是通过检索SCI光盘2004年年度光盘而获得。检索数据的条件为：著者单位所在地标注为“Peoples-R-China”的论文。满足检索条件的数据共计34576篇（不包括原文为文摘的数据）。其中中国大陆著者为第一著者的论文，共计29194篇。大陆著者在SCI收录的非中国出版的期刊上发表了29816篇论文。

2.CSCD数据说明

CSCD是中国科学引文数据库（Chinese Science Citation Database）的简称。CSCD的来源现 I 有来源期刊1046种，其中核心库期刊669种。2005年卷的《指标集》以CSCD核心库的669种中国出版的中英文科技核心期刊为统计源，2004年总计论文136953篇（不含增刊论文）。

三.关于数据分类

按照《中国图书馆图书资料分类法》，对SCI的每一篇论文（根据题名）和CSCD的每一篇论文（根据内容）进行分类。若一篇论文涉及多个学科领域，就列出多个分类号。《指标集》中，有关分学科统计的数据，均按多个分类号统计。因此，分学科统计的数据总量不等于当年CSCD的论文总量。

中国科学引文数据库项目组

欢迎访问中国科学引文数据库http:// 联系电话：82627496

引文信息篇5

关键词：知识服务引文索引数据组织编码设计

中图分类号： G254 文献标识码： A 文章编号： 1003-6938（2013）05-0007-05

1 引言

文献通过引用建立关联，这种关联蕴含着丰富的知识，对引用关系进行分析可以揭示知识的关联，帮助发现隐藏的知识与科学规律。信息技术的发展推动了引文数据的开发利用，早从20世纪60年代开始，就研制出了以SCI为代表的一系列引文索引系统。当前人们对知识服务的需求不断提升，引文索引已不再是简单的检索工具，人们希望能从中获取更多的知识。如何借助引文索引实现知识服务？如何从引文索引中发现科学研究规律和和潜在学术价值？这就需要我们对引文索引结构与组织进行深入探讨，使之充分体现引文索引价值，满足知识服务对引文索引的要求。

2 研究背景

文献间的引证关系始于19世纪西方科学界形成的严格科学传统[1]，引文索引正是利用这种引证关系创建而成。国外最早出现的是1961年计算机编制的《遗传学引文索引》，其后在尤金·加菲尔德的带领下，先后诞生了SCI、SSCI、A&HCI等一批优秀的引文索引。国内对引文索引的研究始于80年代末期，陆续诞生了CSCD、CSTPC、CSSCI等一批引文索引系统。郭丽芳[2]、王婧[3]对中外引文索引的功能进行了比较研究。从大量文献可以看到，国内对于引用关系的研究多集中于引文数据的分析利用，而对于引文索引及其数据组织关系的研究则凤毛麟角。南京大学苏新宁教授撰写多篇文章详细介绍了CSSCI的数据组织结构与应用价值[4-5]，为国内引文索引的设计与研究工作奠定了良好的基础。在此基础之上，也陆续产生了一些针对专业领域的引文索引系统[6-7]。

传统的引文索引以文献为单位，强调的是文献的检索，对于文献内部蕴含的知识以及知识间的关联不能全面、深刻的进行反映，从而不能满足广大用户的知识获取需求。本文以知识服务为视角，阐述了新型引文索引的构建思路，并在此基础上对面向知识服务的引文索引的架构设计、数据库结构以及索引编码设计进行了详细的介绍。

3 面向知识服务的引文索引构建思考

文献之间的引用本质上是知识间的关联，这些关联知识也正是提供知识服务的前提与基础。引文索引是一种典型的关系类知识工具，在文献引用过程中，各類实体间的关联是广泛而复杂的。知识服务是一种用户目标驱动的服务，是面向知识内容、面向解决方案的服务，贯穿于用户进行知识析取、集成、创新全过程的服务[8]，因此引文索引的数据组织也应当以科学研究的需要、学者的需求为目标。

3.1 引文索引的知识服务类型

科学、有效的数据组织是提供知识服务的有利保证，知识服务是数据组织的最终目的。为了更深刻的理解引文索引功效，发挥引文索引在知识服务中的重要作用，我们归纳了引文索引能提供的知识服务类型（见表1）。

传统的引文索引以检索型服务为主，以文献作为信息传递单元。虽然大多索引都具有分类统计功能，也提供了较多的检索途径，但知识服务功能相对较弱，对于更宏观、更全面的分析、评价和预测功能则却鲜见。

根据上述五种知识服务类型，我们按照知识需求的层次从低到高进行划分：检索统计型提供最低级的知识服务，其次是特征分析型和资源评价型，知识发现型和学术预测型是最高层次的知识服务类型。不同类型的知识服务对引文索引的设计要求也不同，层次高的知识服务需要有更大规模的数据和更先进的分析技术作为支撑，同时也希望基础的数据组织架构能够表达实体间更多的关联，为知识服务提供更好的数据基础。根据对不同类型知识服务的需求分析，我们对新型引文索引系统的设计目标总结为：①结构科学合理，发挥各数据属性功用，增加检索途径；②科学组织数据，呈现科学特征、规律，为数据挖掘和知识发现打下基础；③实现数据代码化，为科学地、多角度地统计分析提供精准数据；④注重数据间的关联，为展现对象间的多重关联提供途径和实现手段；⑤数据的组织能够易于系统功能的扩展。

3.2 知识服务引文索引系统模型

为达到上述系统目标，按照数据工作流程，我们将整个引文索引系统组织分为五大层次，依次为基本业务层、基础数据层、数据模式层、知识服务层和用户层（见图1）。

基本业务层的主要工作是相关数据的采集。包括：资源的选定（如期刊引文索引中的来源期刊的选定），对采集的数据输入、整理、清洗、标引和分类工作等。

基础数据层是引文索引的实体部分，主要提供文献检索和一般性知识查询服务。这一层重点关注数据库的架构、细节化的库结构设计以及元数据的表达等，它是整个索引系统提升知识服务的基础数据来源，也是一般性统计分析的重要基础。

在数据模式层中，主要建立数据中各类关联，为知识服务奠定基础。该层的数据组织主要依据用户需求，建立面向主题域的知识仓库。知识仓库的数据来自于基础数据库，其数据关联来自于用户需求和科研领域的需要，并能够充分体现对象间的多维关联。

知识服务层由是完成知识服务功能的系统组成，它根据用户需求，并对基础数据层和数据模式层提供的数据进行统计、分析、挖掘等工作，并提供用户知识服务。在这一层面，要求功能模块可以根据需要扩展，系统功能的开发可以完全独立于数据库的物理存储结构，提升系统的逻辑独立性。

用户层的作用是对用户的信息需求进行分析，将用户的需求分解成对应的知识服务功能模块，由知识服务层启动相关功能模块为用户提供知识服务。

简介科学引文索引及其检索方法篇6

一、SCI简介

美国科学技术情报研究所 (IST) 的情报学专家尤金·加非尔德于1960年编辑出版了《科学引文索引》 (ScienceCitation index, 简称SCI) , 是一种国际知名的大型多学科引文检索工具。它以3600多种自然科学、技术科学和行为科学期刊作为来源出版物, 每年收录其中的来源文献约50万篇, 每年从中采集的被引文献约为700万篇。依据这些数据形成的引文索引、来源文献索引和来源机构索引, 查询科技论文引证关系的常用数据源。

SCI报道的内容有:农业、生物学、环境科学、工程技术、应用科学、医学与生命科学、物理学、化学等方面。SCI具有两个重要特点:第一, 基于杂志索引的几个基本标准、引文分析、反应在科学技术和生物医学方面被引证文献频率。第二, 增加了更为快捷的检索途径。检索近85%的引文索引, 以密切早期出版物的文献和近期引证了该文献的文献主题关系。使用已知的论文和著作查出引证了这篇文献的近期出版物, 以利于对学科发展的追踪。

二、SCI检索途径

1. 手工检索。

在书本式的检索工具中, 出版物的形式有双月刊、年度累积索引、五年累计索引等刊物。上述出版物均标注有三种索引:引文 (Citation Index) 、来源索引 (Source Index) 、轮排主题索引 (Permuterm Subject Index) 。另外, 还包括辅助索引——团体索引 (Corporate Index) 。每期的SCI分五册出版, 用期号连接, 分别用A～E字母表示。例如, SCI的1992年1A、1992年1B、1992年1C、1992年1D和1992年1E分别为1992年第一期A、B、C、D、E分册。其中A、B和C分册为引文索引, D为来源索引, E为轮排索引。SCI的团体索引被编排在D分册内, 位于来源索引之前。团体索引反应了团体人员的论文被SCI收录的情况。

(1) 引文索引 (Citation Index) 。引文索引按所有被引证文献著者姓名的字母顺序编排, 在此下给出它的文献出处, 依次为出版年代、杂志名称、卷、期、页码等。如ANSARAI——被引证作者ANSARAI

71 MON ATSHEFTE FUR CHEMIE 102 1855

72 SEMIE CHIE ETAT—SOLL 1被引作者所发表的文献

WAGNER C METALL T-B

上述记录说明作者WAGNERC在METALLT-B杂志上发表的文章中引用了作者ANSARAI, 1971年在MONATSHEFTE FURCHEMIE102卷1855页和1972年在SEMIECHIE ETAT—SOLL 1卷的发表文章。

(2) 来源索引 (Source Index) 。来源索引按照来源文献著者姓名顺序编排。其中给出的内容分别为:文献题目、出处、年期页、引证参考文献的数量、ISI杂志的存取号, 如果文献有共同著者, 则在文献的第一作者后引证共同作者 (Coauthors) 。在索引中如有See字样出现, 是交叉索引的第二作者。See的出现是引导读者看第一作者引证的参考文献数目。

团体作者索引 (Corporate Index) 包括地区和机构两部分。其排序是:先美国, 再其他国家。按美国各州及其他国家拉丁字母顺序编排, 以下依次是城市 (同一单位的所属部门按大小依次列出, 如同一大学下有学院、系和实验室等) 。第一作者及原文出处。共著录格式如下 (选1992年D册为例) :沈阳化工学院

People R CHINA

LIAONING

SHENTANG INST CHEM TECHNOL

即为沈阳化工学院的注入形式。

(3) 轮排索引 (Permutern Subject Index) 。轮排索引简称PSI, 是一种通过主题途径查找文献的编排方式。从文章题目中抽出的若干能表达文章内容特征的关键词, 将其分成主要词和配合词, 采用每个关键词各作一次主要词轮排方式, 按主要词顺序排列, 其余的词作为配合词按字顺排在其栏目下, 每个配合词的后面表示了引用著者姓名或出版物名称的缩写。通过轮排索引可以从各个角度查到同一篇文献, 再通过配合词后面标注的作者去“来源索引”, 即可查到论文的篇名、出处及参考文献等信息。

由上可见, SCI具有很强的科学性、实用性、重要性, 因此近年来SCI的查阅量呈上升之势, 随之而来手工检索SCI与联机检索SCI的优缺点日益凸显。手工检索SCI经济, 但费时费力;联机检索方便快捷, 但费用较高。究竟选择哪一种检索方式要根据客观条件而定。下面对联机检索SCI方法作一简介。

2. 联机检索。

SCI联机检索系统有美国的Dialog和德国的STN系统, 均可通过因特网进入。两大系统均有引文索引的机读数据库。数据库有基本索引和辅助索引两部分。在检索中主要查找的内容是被SCI收录和作者所发表的文章被引用方面的内容。由于机读数据库文献记录是原始记录, 其标引的常用索引字段为:著者 (AU) 、题目 (TI) 、出处 (CS) 、被引证文献作者 (RAU) 、文献类型 (DT) 、语种 (LA) 、出版年代 (PY) 、被引证文献出处 (rwk) 。现举例说明:检索沈阳化工学院从1995年到2002在SCI中收录的文献数量。在检索对话框中键入检索策略:bscisearch;s Shenyang inst chem./cs and 110021/cs and 1995-2002/py机器响应:7001 SHENYANG/CS;

摘要：本文就SCI的几种检索途径和检索方法作一阐述, 希冀能为广大的科研工作者有所帮助。

引文分析法的定义及其作用篇7

1 引文分析法的相关定义

1.1 引文

“引文”通常指文献结尾处的参考文献, 不含脚注、间注、夹注等, 现有的文献引文分析工具也不提供脚注、间注、夹注的查询。

1.2 引文分析法

引文分析 (Citation Analysis) 就是利用各种数学、统计学以及逻辑方法中的归纳、比较等方法, 对科学期刊、论文、著者等分析对象之间的各种关联和相关关系进行分析研究, 以便揭示其数量特征和对象间内在的规律的一种文献计量分析方法。

引文分析法是科学评价中的定量分析的方法, 通过建立科学计量学指标体系来实现对论文质量和学术影响力的评价。引文分析就是这样一种基于文献之间引用与被引用的线性关系和网状关系的定量研究方法。通过对文献中大量的引文进行定量分析研究, 旨在探讨文献的分布和使用特性以及文献之间的关系。通过引文分析, 可以揭示科学结构、科学发展变化和前沿领域, 评价学科领域及科研机构, 了解某学科领域的发展现状, 预测科学发展趋势等。近年来, 利用引文分析的定量评价方式对个人、机构的科研成果和水平进行评价越来越普及并且引文分析的方法被各国政府机构和科研管理部门广泛应用于科学成果的评价。

2 引文分析法的作用

2.1 评价核心期刊, 研究期刊质量以及期刊之间的关系

核心期刊即某学科的主要期刊。一般是指所含专业情报信息量大, 质量高, 能够代表专业学科发展水平并受到本学科读者重视的专业期刊。如果按照期刊在一次文献中被引用的频率进行排列, 被引频率高的期刊一般为某馆或某学科的核心期刊。通过引文频次的多少不仅可以评价核心期刊, 而且也可以评价引文所在期刊的质量, 一般来说, 引用的频次越高, 其质量越大。并且通过文献之间引用与被引用的关系, 也可以分析学科之间的关系, 通过学科文献之间相互引用的关系, 可以探讨出文献所属学科之间的联系, 更有利于学科的发展以及相互之间的促进。引文分析法从根本上来说是一种定量分析的方法, 并不能说某一文献引用的频次多, 其质量就越好, 但定量分析在一定程度上确实能够反映文献所属刊物的质量。

2.2 研究文献老化规律, 指导文献收藏和文献利用

许多文献老化的规律的研究都是基于引文分析法的, 如普赖斯定律的提出, 半衰期指数的确定, 都是在引文分析法的基础上得到的。所以引文分析法作为一种研究文献之间关系的基础方法, 具有很重要的意义。同时通过引文分析法研究文献老化的规律, 并将此种规律应用于图书馆及其他机构文献的查旧剔除以及最新文献的引入, 将有利于指导文献的收藏与文献的利用, 更有助于优化馆藏, 更好地为用户提供服务。

2.3 评价人才

论文被响应度可以作为衡量该论文的学术价值和影响的一种测度, 因而也从科研成果被利用的角度反映了作者在本学科领域内的影响和地位。一般来说, 作为被引用文献的作者, 文献被引用的频次越多, 其影响力就相应的较大。虽然文献的引用具有一定的主观性, 并且在引用的过程中, 有一些不规范的引用情况, 但根据马太效应的影响, 文献的引用频率可以从一个侧面对作者的影响力进行一个反映。

2.4 评估某组织机构、国家和地区的科学能力和学术水平, 评价科研工作质量和科技生产率, 推动科学发展和技术进步

论文发表以后, 是否被引用和被引用的多少, 可以说明它们对后来研究工作的影响和作用。而通过这种引用与被引用的多少以及后来的影响与作用, 可以很清晰地对科研工作的质量与效率进行评价。一个机构、国家、地区的科学及学术水平是有很多方面组成的, 而一个机构的文献的发展情况也属于一个侧面。某一机构其文献被引频率越高, 其学术水平也相应的较高。实践的发展来源于理论的进步, 对于引用频率较高的核心的文献加以利用, 会促进科学的发展以及技术的进步。

2.5 研究科学技术的发展历史和趋势

引文分析可以从几个方面分析, 通过对引文年代, 引文作者, 引文学科之间的分析找出其中的规律以及发展的趋势。通过对引文年代分析, 可以了解文献发展的历史并且可以预测其未来发展趋势, 而对于引文学科的分析, 可以了解学科之间发展的情况, 对于判断热门学科以及未来的潜力学科都有很大帮助。

3 结语

引文分析法作为信息计量学的基础方法, 发挥了很大的作用, 应用也较广泛。尤其是在网络化与可视化技术飞速发展的今天, 引文分析更是被赋予了更多的含义与作用。当然, 引文分析法也并不是完美无缺的, 它在引用质量的区分、引用意图以及引用的客观性方面都有缺陷, 但这并不能抹杀引文分析法在科研工作中的作用。引文分析法的缺陷会在科研工作者的事件中得到改善以及克服, 引文分析法也将会发挥它巨大的作用。

参考文献

[1]鲁超, 刘清.引文分析可视化现状[J].情报杂志, 2010 (11) :48-52.

[2]苏芳荔.文献引文分析、网络链接分析和网络引文分析的比较[J].情报探索, 2010 (1) :11-13.

[3]史卫国, 饶艳.论引文分析法研究进展与趋势[J].山东图书馆季刊, 2001 (3) :9-10.

[4]沈利华, 缪家鼎, 陈国钢, 等.“客观同行评议”方法探索性研究——一种基于引文分析法的学术论文影响力评价方法[J].图书情报工作, 2012 (18) :144-148.

[5]李玉进.引文分析存在问题的再认识[J].天津外国语学院学报, 2001 (3) :60-62.

[6]张慧敏.引文分析法的内涵及研究实证[J].编辑学报, 2006 (S1) :174-177.

[7]刘建明.宣传舆论学大辞典[M].北京:经济日报出版社, 1993.

[8]思萌.引文分析法的作用、局限性及其改进[J].图书馆建设, 1992 (6) :17-20.

基于引文排序的科技文献检索初探篇8

关键词：相关强度,引文路径,引文排序,被引用次数

0 引言

科研人员在自己的研究领域就某些问题的研究总是要查阅和借鉴前人已有的研究成果以帮助自己在已有成果的基础上继续深入研究和创新,但随着科学发展的不断进步科技文献的数量日益庞大,如何从浩如烟海的文献资料中检索出自己关心的篇章是人们日益关心的话题。一篇完整的科学论文一般是由作者的正文部分和附于其后的被引文献构成,文献与文献之间建立起了一种引用和被引用的关系,一篇文献也往往兼有引用和被引用两种角色。我们从文献的引用和被引用关系上能够发现文献间的相关性。这种相关性有强有弱。相关强度大的对于研究人员的参考价值就大。因此按照相关强度对引文进行排序是合理的,有价值的。

本文将以一组科技文献的引文系统中的文献为研究对象探讨按照相关强度对引文进行排序的方法。我们会发现文献间的相关性与文献的被引用次数有着直接关系,我们可以以文献的被引用次数来反映文献间的相关强度并论述它的合理性。对学术期刊、文献的引用和被引用现象进行定量分析,以便揭示其数量特征和相互关系,弥补传统文献检索方法的不足,具有良好的理论价值和应用价值。

1 引文网络结构的表示

广义的引文分析,要了解引文系统中引用文献和被引文献之间的关系,也就是要了解和掌握该系统的结构,一组同一领域的有相互引用关系的论文构成的一个网络图,它们之间具有一定的结构,这个结构能表述它们的相互作用关系和相关强度,可以勾勒出相关课题的来龙去脉。引文网络图可以用链、树、网型三种结构表达。令引文和被引文献均为系统中的结点,如果我们用“”来表示文献间的引用关系,以箭头指向为被引文献,而箭尾为引文(即文献)。

图1的网状结构图反映了一个不同于链、树结构的复杂体:

文献之间的引用关系十分的复杂,所以考虑采用网状结构表示。

2 文献间的相关强度和被引用频次的关系

根据图论中路径的相关定义,在此给出引文路径的语义定义:如果文献之间通过n次引文相联系,那么它们之间所经过的n次联系所形成的引文链,称为引文路径。文献之间的引文路径不是唯一的。例图1中,文献[1]到文献[7]的引文路径有多条,其中一条由1到7,另一条由1到2再到7。

引文路径长度是指文献之间形成的引文联系的次数,也就是引文路径概念中n的值。如果n=0,文献A与文献B之间没有引文联系;如果n>0,则文献A与文献B之间形成了n次引用联系。图1中,文献2与文献3之间的引文路径长度为0,文献1到文献7之间的引文路径长度为1或2。

引文路径宽度是指具有引文联系的两篇文献之间的引文路径长度相同的引文路径的数量。图1中文献1到文献7之间的引文路径长度为2的路径有2条,其中一条为由1、2、7所组成的引文路径,另一条为1、5、7所组成的引文路径。

根据引文分析路径模型的理论既通过引文路径相联系的文献之间的相关性与其之间的引文路径长度成反比。与其之间的引文路径总宽度成正比的理论。有如下公式:

其中:R代表文献间的相关强度,n代表相关文献间引文路径的长度,tn代表当引文路径长度为n时两个引文间的引文路径宽度,K为常数。

我们以图1为例,计算文献1与其它文献间的相关强度,假设K为常数1:

1与2间:R1-2=1*1/1=1;

1与3间:0;

1与4间:0:

1与5间:R1-5=1*1/1=1;

1与6间:R1-6=1*1/1=1;

1与7间:R1-7=1*(1+2/2+1/3)=7/3;

1与8间:R1-8=1*(0+1/2)=1/2;

根据上述结果我们按与文献1的相关强度对文献排序如下:

从图中我们还可以看出按照各引文的被引频次排序如下:

再比如文献2与文献7的相关强度为2,与文献5的相关强度为1,与8的相关强度为1,其它为0。

文献3与文献7、6的相关强度都为1,其它为0。

文献4与文献7、5、6、8的相关强度都为1,其它为0。

从总体上来看我们能够发现引文网络图中的某一文献与其它文献的相关度与它的被引用次数有着直接关系,当文献的被引用频次较高时它与其它文献的相关强度也大,反之当文献的被引用频次较低时它与其它文献的相关强度也较小。但根据引文路径模型我们不但能够检索出与一篇文献发生直接引用关系的引文还能检索出间接引用关系的引文。因而利用引文路径模型我们能够得到与一篇文献相关的引文系统。

由于某一文献与其它文献的相关度与它的被引用次数有着直接关系,我们可以用引文系统中文献的被引频次来反映此文献与其它文献的相关度,从而在一个引文系统中按照文献的相关度把文献排序的问题可以转化为按文献的被引用频次的排序问题,使问题变得简化。

3 设计实现

首先,引文网络(citation network)作为一个系统,它能够反映各个要素相互之间存在的各种关系。引文关系特点就是(1)在时间上单向,(2)不能自引,(3)关系一旦形成不可更改三个限制。这都是在编程时应该注意的。检索论文后处理,先将论文格式转化成txt文件,抽出网址-URL,头部-Header,摘要-Abstract,介绍-Introduction,引文-Citations,正文-Full Text等信息,专门对Citations做解析工作,具体处理步骤不再赘述。

在得到检索、格式处理后的论文txt文件后,将数据分解成两个表导入SQL server数据库:表1(论文序号,论文名,引文数量)属性列,论文序号为此引文网络中论文的一个编号;表2(引文序号,作者,引文名称,出处来源及所属论文)属性列,所引论文表示的是此引文为表1中某一论文的引文。

利用Java编程时,借助JDBC与数据库连接进行操作。方法1:将数据库表中数据读出到Java程序数组中进行字符串迭代匹配,得到论文引文排序;方法2:Java程序中嵌入数据库结构化查询语句(struct query language)直接进行查询。方法1在对空间或是时间上都代价较高,特别是在一个引文网络中论文数量很大的情况下更加体现出效率低。与之相比较,方法2是在数据库内进行一系列操作,sqlserver的存储量大,查询速度快,方便数据的传输等优点便可以显现。

4 结束语

对引文按被引次数进行排序直接反映了文献间的相关强度,迭代法排序的查询速度不及数据库查询的方法。此结果是在引文系统只有10篇论文的请况下得到的,如果是大量论文的引文系统中可以判断数据库的优越性会更显著。此研究的目的是根据某一文献找到相关的引文系统并根据与所给文献的相关强度对引文进行排序从而提供使用者查阅。由于时间有限,本人的能力有限,考虑得不是很周到。这些有待日后进一步加工以使论文按引文排序方法更加完善。

参考文献

[1]陈雪.引文分析路径模型[J].情报探索,2009(6).

[2]严蔚敏.数据结构[M].清华大学出版社.2005.

[3]丁学东.文献计量学基础[M].北京大学出版社,298

[4]周云平.我国引文分析研究现状与21世纪发展趋势[J].图书情报工作,2001(2).

[5]Ma Jun.Retrieving Digital Artifacts from Digital LibrariesSemantically.LNCS.3644,Springer,2005,340-349.

[6]T.-Y.Liu,T.Qin,J.Xu,W.Xiong,and H.Li.LETOR.Benchmarkdataset for research on learning to rank for information retrieval.In SIGIR Workshop on Learning to Rank for IR(LR4IR),2007.

我国移动学习高被引文献研究篇9

一、研究过程

1. 研究样本选取

本研究以中国知网(CNKI)中的期刊为数据来源,使用“篇名”为检索项,以“移动学习”为检索词,选择核心期刊和CSSCI为来源类别进行精确检索,时间为2003—2014年,检索到被引文章598篇,按照被引频次降序排列,利用普赖斯定律()确定核心作者的方法确定高被引论文[2]。为了避免只看重被引频次数而不考虑时间的先后带来的被引频次数的积累,在选取样本上还选用共时法[3],基于这种引证规律,将时间化为3段,分别为2003—2006年、2007—2010年、2011—2014年。共选取样本文献为125篇,高被引文献占总被引文献的20.90%,文献数量集中,数据具有可研究性。移动学习文献的高被引文献分析,终止于2014年,是因为文献的被引频次与时间的积累有很大的关系,近两年的文献的高被引会受到很大的影响,一些重要的文献还不能从高被引的方式分辨出来。

2. 高被引文献中被引频次超过100次的文献

在研究样本中即125篇高被引文献中,被引频次超过100次的文献共有11篇,在移动学习的研究中被多次的引证证明了在研究者中的认同率最高,可见在移动学习的研究中占有重要的地位,而且有一定的时间积累对文献的影响力占一定因素。

这11篇文献中文献综述类文章占了5篇,说明移动学习的研究还不成熟,研究者还在对移动学习的定义或基础理论的文献进行研究。其中叶成林2004年发表的《移动学习研究综述》中,对移动学习的概念及其定义进行了论述,由于时间的累积效果和这篇文献对移动学习的几个关键性问题的提出,使得此篇文献成为移动学习研究者引用频次最多的文献[4],详情请见表1。

3. 高被引文献的日期分析

在样本的选取中,以共时法的普赖斯定律选取高被引文献,由图表可以看出高被引总频次虽然有时间的累积占有一定的因素,但还是呈现了一种周期性,每2年或3年为一个周期,产生一个峰点年份,此周期性与当年是否具有标志性的事件或此年的文章是否能在接下来几年引起共鸣有关。

由图1可见,2004年、2007年、2009年为高被引的峰点年份,而2010年也有发展为峰点年份的趋势。在2009年在这一年中发表的文献无论数量还是质量都是可观的,论文发表的内容包含了理论[5]、技术实践[6]和资源开发[7]等多个领域,可见移动学习到2009年已经达到兴盛的状态。我国的移动学习研究虽然还没有发展成熟,但是发展势头良好。

4.高被引文献的第一作者分析

从高被引文献的作者署名情况统计发现绝大部分的文献为合著作者,合著作者文章一共有98篇,占了高被引文献的78.40%,这表明目前移动学习的研究主要以团队合作为主,不同机构间合著论文已经成为科学研究的主要发展趋势。

移动学习的高被引文献的第一作者分布相比较其他专题比较分散。从年龄来看,前5名作者都是1970左右出生的,这个年龄段的研究者是我国移动学习研究的中坚力量。方海光在移动学习和学习对象的研究中,建立了系统过程模型,从整体构建移动学习系统环境的应用与研究框架—移动学习的系统环境路线图。顾小清对微型移动学习进行深入研究,研讨了微型学习策略和资源的共建及其可用性设计(见表2)。

5. 高被引文献的关键字分析

在对高被引文献的关键字进行分析时,本文利用在线软件HTML5 Word Cloud。在线软件HTML5 Word Cloud是一款文字云软件,可以输入词汇或文章能够突出显示原文本中的高频词,通过文字显示大小形成特殊的词汇云图达到可视化效果。

利用HTML5 Word Cloud对125篇高被引文献的关键字进行可视化分析,除去以“移动学习”为关键字,输入所有的关键字生成词汇云图,由图可以看出,“学习”是移动学习中关键字频率最高的,也是移动学习研究中最重要的部分和研究取向。接下来是“资源教育”“设计”“分析”“模式”“内容”“系统”和“环境”等都是关注的热点。随着时间的推移,移动学习的研究趋势更倾向于系统的设计和对资源的开发利用,更加关注学习者(如图2所示)。

二、总结与启示

1. 移动学习的理论研究稳定持续发展

通过对高被引文献的分析,移动学习主要有以下7种理论基础,包括非正式学习理论、活动学习理论、情景认知与学习理论、分布式认知理论、境脉学习理论和会话学习理论。通过横向的对比发现其理论研究都是以对学习者的研究为中心的。随着移动学习碎片化的特点,传统理论行为主义的“小步子”学习法,基于遗忘曲线的强化理论与基于交互理论的及时反馈的优势特点得到充分体现,在移动学习资源开发上实现了创新性的应用[8]。这种传统学习理论与新兴教育形式的有机融合,将会在未来一段时间引起人们的思考。

2. 技术更新扩展移动学习发展空间

技术作为移动学习不可忽略的基础与关键性因素之一,需要研究者给予重视。随着科技的不断发展,利用技术手段增强移动学习的情境性学习、构建学习模式和开发移动学习资源等实践应用中,利用Podcasting技术构建移动学习模式[9]、基于Flash Lite的移动学习资源开发[10]、基于GSM Modem的移动学习平台构建[11]等实例研究在减少移动学习者的外部认知负荷和学习资源的建设中不断发挥其特色优势,且新技术带给学习者新的学习体验,伴随着新技术的不断产生拓展了移动学习的发展空间。

3. 新技术和新理念推动移动学习方式创新

新兴技术和新理念在学习中的深入应用,使得移动学习能发挥自己的优势促进传统、单一的学习方式转变为自主、探究的学习方式,有利于增强学习者参与学习过程的积极性,形成良好的认知和情感体验,促进学习方式的创新。移动学习支持学习者进行随时随地的学习的同时也带来了一个突出的问题:学习者的移动性是和注意力的分散性相关联的,因此导致了移动学习者无法进行连贯、系统的学习,而针对此问题将采用片段化的处理方式进行弥补,利用新技术和新理念推动移动学习的快速发展。

三、结束语

从2003—2014年高被引文献的统计分析虽然有管窥蠡测的嫌疑,但依旧可以发现一些问题,既有优势也有不足。优势有权威人物和权威机构在学术界的影响不容忽视,由于他们的文献提供了创新性较强的研究理论或研究方法,引导了移动学习的研究走向;不足有引用过此文献的文章成为另一个高被引文献而产生了盲从心理,进而在科学知识系统中产生“马太效应”,形成数量上的累积而成为高被引文献。总体来说,只有不断提高研究内容的质量或自身的分量就会获得更高的引用,而高被引文献之间也会不断相互引用,文献的高被引频次可以说明文章的学术价值。

摘要：学术论文的被引频次已经成为对学者研究成果的一种认可。利用普赖斯定律和共时法确定核心作者的方法确定高被引论文,对2003—2014年12年间的高被引文献以内容分析法进行统计和分析。揭示我国移动学习高被引论文的研究新趋势及所呈现的新动态,为接下来的研究提供参考与借鉴。结果表明我国移动学习研究稳步持续发展,新技术的引进支持学习方式的持续创新,也为当前教学课堂的延伸和教学形式的改革做出贡献。

引文信息篇10

引文分析是利用数学及统计学方法以及比较、归纳和抽象等逻辑方法对科学期刊、论文、著者等各种分析对象的引证与被引证进行分析，以揭示其数量特征和内在规律的一种文献计量学分析方法。该方法在学术期刊中的应用研究发展得较为迅速，多位学者从不同角度进行了阐述，而其在图书著作中的研究还未见报道，笔者选取37种全国高等学校教材（供8年制及7年制临床医学等专用）（第2版）共5004篇参考文献作为统计分析对象，采用引文分析法对这些参考文献进行调查统计，从引文数量、引文类型、引文语种和引文时间分布4方面进行分析。

1.引文数量分析

引文数量是指某一主体对象（论文、期刊、学科、著者等）含有的参考文献的数量，引文的数量反映出著者对本学科专业及与研究课题相关的学科领域的前沿知识和研究进展掌握的深度和广度，并可揭示作者的文献调查能力，利用文献和吸收、消化文献信息的能力。笔者共调查37种图书，引文共5004篇，其中系统解剖学和眼科学未引用文献。全国高等学校教材（供8年制及7年制临床医学等专用）（第2版）引文数量结果详见表1。引文数量前三位分别为：内科学（410条）、感染病学（402条）、生理学（360条）；后三位分别为：妇产科学（4条）、预防医学（13条）、外科学（16条）。笔者以参考期刊所刊登论文字数为5000—10000字/篇计算，一般情况下一篇论文所引用文献在15条以内，笔者以10000字为计量单位计算37种图书的文献引用情况，发现图书中每万字参考文献为3.2篇（5004/1 555.6）。

2.引文类型分析

引文类型分布即各种文献（图书、期刊、报纸、法律法规、网络文献等）在参考文献中所占的比例。对引文类型的分布加以分析可了解文献的来源和构成，可以揭示著者使用情报源的习惯和方式等。该研究中著者引用的文献类型包括上述5种，未见报纸文献，且法律法规和网络文献均较少，笔者未将该类引文计入统计报告中。全国高等学校教材（供8年制及7年制临床医学等专用）引文类型结果详见表1。由表1可知，37种图书共引用图书类文献2313条（46.2%），期刊类文献2691条（53.8%）。引用图书文献数量前三位的依次为：生理学（270条）、精神病学（145条）、医学免疫学（115条）；后三位分别为人体寄生虫学（0条）、药理学（4条）、妇产科学（4条）。引用期刊文献数量前三位分别为内科学（329条）、感染病学（318条）、组织学与胚胎学（224条）；后五位分别为局部解剖学（0条）、妇产科学（0条）、预防医学（0条）、医学心理学（0条）、医学伦理学（0条）。

3.引文语种分析

从世界科技文献的语种分布情况来看，英语最为广泛（占46%），其次是俄语（占14%）、德语（占10%）、法语（占9%）和日语（占4%），其他语种占17%。由表1可知，37种图书共引用中文文献1814条（36.3%），英文文献3190条（63.7%）。引用中文文献数量前三位的依次为：生理学（147条）、精神病学（114条）、实验动物学（106条）；后三位的依次为：妇产科学（2条）、药理学（3条）、医学微生物学（9条）。引用英文文献数量前三位的依次为：内科学（374条）、感染病学（297条）、生理学（213条）；后三位的依次为：预防医学（1条）、妇产科学（2条）、医学文献信息检索（3条）。

4.引文时间分析

引文时间分析是从时间的角度对引文分布规律进行分析，可以反映引文的出版、传播和利用情况，常用于文献老化和科学史的研究。对教材引文的年代进行研究分析，可以了解某一学科的发展动态及文献利用的最佳时期。在科技领域，引文的新颖性是反映该研究水平的一个重要标志，引用最新的文献，说明著者立足在科学研究的前沿，选题和论点具有前沿性。全国高等学校教材（供8年制及7年制临床医学等专用）不同年份引用参考文献结果见表2、图1。由表2可知，37种图书引用1995年以前的文献413条（占8.3%），1996—2000年文献为656条（13.1%），2001—2005年文献为1717条（34.3%），2006—2010年文献为2218条（44.3%）。由图1可知，37种图书2006—2010年文献引用数量前六位分别为内科学（273条）、感染病学（248条）、生理学（135条）、肿瘤学（112条）、病理生理学（112条）、组织学与胚胎学（103条）。

笔者通过对37种全国高等学校教材（供8年制及7年制临床医学等专用）（第2版）共5004篇参考文献进行统计分析，发现在图书出版中很多编辑不够重视对参考文献的处理。主要表现在数据加工不规范，错误率高，限制参考文献数量，甚至省略参考文献等。这无疑会影响引文数据库的质量，进而影响到引文评价期刊的客观性和准确性。因此，在医学教材出版中，编辑应该注意加强自身的规范化建设，不断提高图书的编辑出版质量。笔者认为有3方面的工作应该加强。

第一，规范参考文献的使用格式。在该研究的资料收集过程中，笔者发现参考文献的著录格式不尽相同，有的文献放在“章”或“节”的后面（组织学与胚胎学、细胞生物学、生物化学与分子生物学、生理学、人体寄生虫学、医学遗传学、医学免疫学等），有的在“篇”的后面（临床诊断学、耳鼻咽喉头颈外科学），有的放在著作的文后（医学微生物学、局部解剖学、外科学、妇产科学等），作为一部系列教材，笔者建议应该使用统一的编辑规范和体例，做到和谐统一。另外，在对该系列教材的引文进行分析的过程中，笔者发现部分参考文献的著录格式存在不规范现象，普遍表现为标点符号、题名、文献类型等著录不完整或错误著录，影响了著作的严谨性，具体问题笔者将进一步研究。同时希望编写组能统一规范，严格按照国家颁发的《文后参考文献著录规则》（GB/T 7714—2005）中的相关规定，在再版中避免参考文献的不规范或错误著录。

第二，应加强我国引文数据库的规范化建设。目前，我国在建的文献数据库当中，包含引文数据的有中国科学引文数据库和中国科技论文引文数据库。它们的来源文献收录范围和数据加工方法各不相同。利用不同的数据源会产生不同的统计结果，不利于对评价对象做出规范化的客观描述。今后，我国应加强引文数据库的规范化建设，逐步确立统一的引文数据源，以便在医学教材的引文评价工作中使用统一的标准，使我国的科技期刊定量评价工作更加科学，更加准确，更加合理。

第三，应正确看待引文评价指标在医学教材评价工作中的作用。引文评价方法的确提供了一种可以定量评价医学教材内容质量的途径。但是，我们应正确地认识引文评价的意义和作用。基于上述种种原因，引文指标不可能完全反映医学教材的整体质量。对医学教材的综合评价应包括多项指标，例如医学教材的政治质量、编辑质量、出版印刷质量，以及发行数量等。

[1]艾红，章丽萍.23种农大学报核心期刊载文被引情况分析[J].中国科技期刊研究，2013（2）：295-298.

[2]马云彤.2006—2010年国内期刊出版专题研究高被引论文分析[J].编辑学报，2012（4）：335-338.

[3]苗松，王正兴，黄小华. 《中国科技期刊研究》“十一五”期间载文和引文分析[J]. 中国科技期刊研究，2012（3）：391-396.

[4]孟祥保. 图书情报学交叉融合与发展——基于国外35种核心期刊的引文分析[J]. 图书情报知识，2012（5）：50-58.

[5]王琳，魏杰. 引文分析与科技期刊评价[J]. 今传媒，2012（5）：95，147.

引文信息篇11

关键词：《中国病案》,分析,引文统计

1 材料与方法

1.1 材料

以《中国病案》2011年 (共12期) 所有载文及引文为样本数据源, 篇为单位, 分别按栏目设置、载文量、引文, 作者分布合著情况等进行量化分析。

1.2 方法

对2011年《中国病案》 (共12期) 所有载文及引文进行手工检索, 分类及统计分析。

2 结果

2.1 栏目设置及载文量分析

《中国病案》杂志非常重视栏目设置, 共推出十几个栏目, 平均每期出现栏目一般在8个左右。知识覆盖面广, 深受广大档案工作者及基层档案管理人员的欢迎。《中国病案》2011年 (共12期) 共刊载各类学术论文527篇, 平均每期43.9篇。病案管理78篇, 占14.8%, 质量管理101篇, 占19.1%, 临床路径7篇, 占1.3%, 疾病与手术分类37篇, 占7.02%, 病案与法15篇, 占2.85%, 现代化管理69篇, 占13.09%, 信息利用99篇, 占18.7%, 教育与教学47篇, 占8.9%, 临床实践15篇, 占2.85%, 临床与护理7篇, 占1.3%, 其他4篇, 占0.75%, 论著2篇, 占0.38%。

2.2 引用文献

2.2.1 引文量

在527篇论文中, 有引文的527篇, 占发表论文的100%, 共有引文3 97条, 引文量最多35条, 最少为1条, 平均引文量5.88条, 略低于国家自然科学论文平均引文量8.86条的标准。

2.2.2 引文年限

在3097条引文中, 中文期刊最早引自1981年, 外文期刊最早引自1961年, 图书最早引自1975年, 中、外文期刊最近引自2011年, 图书最近引自2010年。时间跨度分别为中文引文30年, 外文引文50年, 图书引35年。

2.2.3 引文语种

将3097条引文按语种进行统计, 中文2784条, 占总引文量的89.9%;英语313条, 占10.1%, 中外文引文量比为8:8:1。提示病案管理专业人员阅读外语文献的水平及范围, 今后应加强外语阅读能力, 加强对外文期刊的利用。

2.2.4 引文类型

该刊2011年 (共12期) , 刊用的527篇论文中有引文3097条, 引文来自中文期刊、图书、标准、规范、条例、学报、网络信息等, 其中期刊较多, 图书次之, 两者分别为2583条 (含外文) 和381条, 两者总和占全部参考文献的95.7%, 说明期刊是获取信息的主要来源, 是作者阅读的主要文献。

2.2.5 引用中文期刊文献的集聚规律

2011年该刊12期527篇论文中, 共引用中文期刊2270条, 引自397种中文期刊, 被引用15次以上的期刊有15种 (见表1) , 引次总数为1209篇次, 占全部引文量的53.2%。该刊自引率32.02%, (5.88/527) 。说明这15种期刊是病案专业人员的核心期刊, 如果能保证这15种中文期刊的订阅和收藏, 即可满足大部分病案管理专业人员的需求。

2.3 载文作者群

2.3.1 作者单位

该刊2011年12期论文共有作者527人 (以第一作者为统计对象) , 从作者单位结构看, 来自省市地方医院207人, 占39.2%大学及医院院校附属医院206人, 占39%, 军队医院114人, 占21.6%, 其中, 病案管理专职人员78人, 占14.8%。从统计中可以看出:省市地方医院及大学医学院校附属医院是主要作者群, 从作者地区分布看, 527名作者来源于近100个城市, 而北京市发文量最多;为186篇。其次广州、十堰18篇, 重庆、乌鲁木齐15篇, 说明该刊在北京具有较高的影响。见表2。

从表2可以看出, 该刊作者虽然分布全国, 但主要还是来自14个城市同时也反映了这些地区学术活动比较活跃, 专业人员的素质相对较高。

2.3.2 作者单位的合作情况

通过统计表明, 527篇论文中, 由一个单位独立完成的有483篇, 占91.7%, 其余为2个单位以上完成的有44篇, 占8.3%。从论文作者单位合作的情况看出, 527篇论文中既有同一个单位之间的合作, 也有不同单位之间的合作。随着科学信息技术的不断进步会促进我国病案管理事业的发展。

3 讨论

《中国病案》杂志从创刊以来, 始终坚持向正确的办刊方面办刊, 从所载文章内容看能代表并反映我国病案科学管理理论与实际的探求、发展现状和水平。由于注重专业学者的意见和建议, 及时发表他们对病案管理发展方向的研究性文章, 提高了该刊的学术价值和影响力, 是广大基层病案管理工作者的首选刊物, 从该统计结果看, 该刊栏目设置合理, 论文作者分布于全国近100城市, 说明了该刊在国内具有较高的影响力, 期刊引文量是衡量学术水平的一项重要指标, 该指标说明论文及期刊科学交流程度和吸收外界信息的能力, 是著者尊重他人研究成果的具体表现[1]。该刊引文量5.88与我国科技期刊论文的平均引文量8.86条相比略低, 这说明了《中国病案》在科研和实际工作中信息吸收量较高, 已形成自己独特的学术风格和办刊理念, 学术质量不断提高, 是我国病案管理专业的重要期刊。

参考文献

【引文信息】推荐阅读：

引文评价07-07

非专利引文10-14