地方文献数据库检索系统建立之设想(通用3篇)
地方文献数据库检索系统建立之设想 篇1
建立地方文献数据库之探索
近年来,我国各种各样的数据库层出不穷,对数据库的开发、数据著录的格式、数据库的管理等数据库建设方面的问题均有不少论述,但对地方文献专题文献数据库的建立却稀有涉及。地方文献是以一个地区为记述范围且反映本地特色的文献资源,是了解和研究某一特定地区的工农业生产、科学文化、历史与现状的主要情报来源。在集中精力进行经济建设的新形势下,区域经济的研究更离不开地方文献的支持。图书馆要想更好地服务于社会,服务于地方经济建设,“建立地方文献数据库”已是当务之急。如何根据地方文献的自身特点,将那些具有浓郁地方特色的资料建成适合用户需要的特色数据库,更方便研究者的使用,则是图书馆人不可忽视而需要共同探讨研究的问题,笔者拟就此谈几点看法。
1地方文献数据库应建成全文、摘要、题录三种形式并存的库
地方文献是关于一个地方的全部资料,不仅其内容涉及一个地区的历史、现状、自然科学、人文科学、社会历史遗留等各个方面;著述形式也有方志、专著、期刊、族谱、地图科技报告、专利文献、学位论文、会议记录等新老成员;文献载体更有印刷型的书籍、缩微品、录音制品、录像制品、机读磁带、磁盘、光盘等众多品种……建立地方文献数据库就是要将这些不同来源、不同内容、不同著述形式、存于不同介质的原始数据存于同一库中综合使用。面对内容如此广泛、形式极其多样的地方文献,如何将其内容适度地呈现给用户,如何让使用者更快、更多地了解地方文献信息,这是建立地方文献数据库必须首先考虑的问题。
1.1 地方文献数据库中部分文献应建成全文式的
目前各种专题数据库的数据录入大都以书目数据为主,只对文献的特征、主题、分类等做一般著录。实际上,从用户角度来看,他们更需要的是全文数据显示,以便直接获取原始资料。
在进入信息时代的今天,地方文献不再仅仅以书籍形式出现,而更多的是发表于各种各样的报刊上,散见于各种各样的会议文件之中,甚至出现在各种各样的商业宣传品里,地方文献和其它文献一样力求以更快速度、引人注目的方式向社会传播。这部分文献大都以简短精要的论文形式出现,建成全文数据非常可行。再者,论文型的文献比较零散,不仅分布在不同的媒体介质上,而存贮地方文献的媒体介质本身又不全是地方文献的收藏范畴,若全部收集地方论文材料的原载体有一定难度,也不适宜,故这部分论文文献有必要建成全文数据,让用户直接获取原文、及时了解最新信息。
1.2 地方文献数据库中部分文献应建成摘要式的
随着科学技术的发展,文献的载体不断发生变化。地方文献在以传统的印刷书籍占据主角时,更多的非书资料正逐年增加。这部分非书资料虽然内容繁多,但其本身的检索使用都较方便,故不必要建成全文数据。然而非书资料仅从外表又看不出其具体收藏内容,故需要对原始文献进行深层次的挖掘,加工成文摘或提要式录入,以向用户简要介绍文献的.主要收藏内容,建成摘要数据库供用户选择使用。当然摘要式文献部分还应向用户提供原文献出处及其收藏地,以便用户及时找到原文,尽快获取所需信息。
1.3地方文献数据库中部分文献应建成题录式的
地方文献是有关某一个地方的一切资料,除我们常看到的白色文献外,一些单位的半机密资料数据或机密文件等灰色文献或黑色文献亦是地方文献的收藏对象。这部分资料不便于广大用户公开查阅,需要使用的用户可以同有关单位联系,根据具体的使用办法及注意事项查阅,所以只提供题录比较合适。为便于用户查找获取原始资料,题录式数据须注明具体的收藏地或收藏单位。
再者,地方文献中除图书、杂志、报纸、手稿等常见资料外,还有图片、画片、表格、票据等资料,这部分文献一般从其名称即可知其内容,没有必要建成全文或摘要。建成全文型也困难,故也可建成题录式数据,并准确注明其收藏地。
地方文献数据库应建成全文、摘要、题录三种形式并存的交叉信息混用库,尽可能将数据库建设得全面、深入、贴近用户,而又易操作可行。用户在使用时可以随时检索到自己所需要资料的内容,最大限度地满足读者的需求。
2 地方文献数据库应建成学科分类、地名归类、著述形式等多途径检索的库
地方文献库具有涉及内容广泛、时间序列较长、且资料来源复杂、贮存方式多样等特点。要将这些不同来源、不同途径、存于不同介质的原始数据归于同一库中供用户综合使用,须对其内容进行多方面、多角度、多层次的划分和揭示,给用户提供多条检索途径,以便用户能从不同角度查找自己供所需资料。
2.1建成具有学科分类检索功能的地方文献数据库
地方文献数据库应属于专题文献数据库,但因其文献内容广泛而丰富,涉及政治、经济、法律、军事、文化、文学、历史、地理、人口等多学科范畴,故又具有综合性数据库的特点。打开一个学科综合的数据库,广大读者最常用的方法就是依学科分类来检索文献。
不同的用户一般都有自身的研究领域,而且对该领域的文献最敏感、知识分类也最熟悉。为使用户能快速了解自身学科范畴的文献资料,并能较全面地浏览某地区在该学科领域的科技发展新动态,地方文献数据库必须依据学科专业来组织文献资料,分门别类地显示文献信息,实现按学科分类检索的功能。
学科分类检索功能主要是指依据文献内容的学科属性其特征,将成千上万种文献划分开,按照科学分类标准,将容文献编排类目,各分其类,数据库系统能按类提示文献息、提供文献线索,便于用户寻类索文、触类旁通。用户同可按学科分类的次第性,逐次寻找类目,查获数据库内含有关文献。
2.2 应建成具有地名归类检索功能的地方文献数据库
虽然学科分类检索能满足人们检索文献的一般逻辑思维方法,但是,随着科学技术的飞速发展,各种新学科、新科技不断涌现,学科间相互联系、相互渗透越来越强、而学科分类是属于一种先组式的检索体系,只能单维地提示文献特征,对文献的专指度跟不上交叉学科的发展,在反映新学科、新成果方面也总是滞后,给用户检索新的科技信息增加了不少困难,也降低了文献的检全率、检准率。因此有必要实现按地名归类检索的功能。
地名归类检索功能主要指依据文献所属的地区,将文献划分开来,按地域区分和隶属关系。将库容文献各归其地。这样可避开文献的学科分类,按地域提供文献线索,便于用户以地寻文、鸟瞰全貌。
地方文献都是以某一地区为记述范围且反映本地特色的,这些共同的地方特色,体现为文献的区域性。对研究地方特色的用户来说,他们更注重地方文献这一“区域性”特征,地名归类检索功能也正是满足了用户按地名揭示和组织文献的要求,用户不仅能以地名作为检索口,查检某一具体地区的有关文献资料,并能较全面地了解该地区的总体概况。
可以说,地名归类检索功能为“区域研究”的用户提供了一张地图似的资料检索途径,使他们对地方文献一目了然,广域的地方文献从而成为更具体的地方文献。
2.3 应建成具有著述形式检索功能的地方文献数据库
地名归类检索已是在学科分类检索的基础上,进一步拓宽了用户的查检途径,亦是在综合性数据库的基础上,体现了专题性数据库的检索要求,但对地方文献的不少用户来讲,学科的交叉渗透、地域的临界相关往往正是他们研究的焦点,这时候前述两种检索子系统都不能满足他们的要求,而著述形式则成为他们查找资料的第一入手点。地方文献数据库如能按著述形式组织文献,即实现按著述形式检索的功能,满足更多地方文献用户群的需求。
著述形式检索功能主要指依据文献的著述形式,将文献划分开来,如:地方志、地方史、地方报刊、地方年鉴、地方名人、地方论文、地方档案、地方图录等等,按著述形式的层次关系,依次设立子目,如:地方志层次下可分综合志、专门志等,将库容文献各归其位。
关于地方文献据库究竟应如何建成学科分类、地名归类、著述形式等多途径检索的库,数据库的检索系统又如何构建,笔者另有专文“地方文献数据库检索系统建立之设想”详细论及,在此不再赘述。
地方文献数据库建设是一项探索性工作,究竟建成一个什么样的数据库才是最适用的、用户最满意的,那是仁者见仁、智者见智,笔者这里的几点设想,不求同行赞同或采用,只求抛砖引玉。
〔出处〕 大学图书情报学刊(2)
地方文献数据库检索系统建立之设想 篇2
1.1“看病难、看病贵”的现状
我国医疗服务的主要问题集中于“看病难、看病贵”看病之难, 难在大医院一号难求, 一床难候, 由于我国的医疗卫生资源不足和分布不合理, 导致大城市大医院门庭若市, 人满为患, 而乡镇卫生院则门可罗雀, 无人问津;看病之贵, 贵在政府投入不足、医保水平低、新药品新技术的高昂费用、“举证责任倒置”所带来的过度检查、药品流通环节中的层层加价, 老百姓因病致贫、因病返贫的问题依然严峻。另一方面, 大部分临床医生工作时间过长, 工作压力巨大, 紧张的医患关系常常使他们的工作如临深渊、如履薄冰, 再加上现阶段医生的收入偏低, 体现不出他们的劳动价值, 这又进一步恶化了看病难、看病贵的问题。
医疗问题是我国重要的民生问题之一, 近年来, 政府一直十分重视, 采取一系列措施并取得一定成效, 如推进基本医疗保障制度建设、初步建立国家基本药物制度、健全基层医疗卫生服务体系、促进基本公共卫生服务逐步均等化、推进公立医院改革试点, 但现阶段看病难、看病贵的问题依然突出, 医改的路还很漫长。
1.2 大数据技术
2013年5月, 马云在卸任阿里集团CEO的演讲上说, 大家还没搞清PC时代时, 移动互联网来了, 大家还没搞清移动互联网时, 大数据时代来了。
大数据 (big data) 又称巨量资料、海量资料, 指的是所涉及的资料容量规模巨大到无法通过目前主流软件工具, 在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。近年来, 伴随着云计算、物联网、社交网络等信息技术的飞速发展, 数据正以惊人的速度迅速增长积累, 大数据时代已经来临。
从某种意义上来讲, 大数据指的是数据分析的前沿技术, 是从各种各样类型的数据中, 快速获得有价值信息的能力。大数据提供了一种新的看待世界的方法, 不再依赖随机抽样, 而采用所有数据, 分析挖掘出小数据无法提供的有价值信息, 为人类社会服务。
事实上, 大数据正对生活产生广泛的影响。洛杉矶警察局和加利福尼亚大学合作, 利用大数据推测某地发生犯罪的概率、犯罪类型, 以及最有可能犯罪的时间段, 有针对性地加强巡逻, 减少罪案的发生;连锁超市Tesco PLC (特易购) 在其数据仓库中收集了700万部冰箱的数据, 通过对这些数据的分析, 进行更全面的监控并进行主动的维修以降低整体能耗, 提高运营效率;印第安纳大学利用心情分析工具, 对近千万条的网上留言进行分析归纳, 准确地预测道琼斯工业指数的变化;统计学家Nate Silver利用大数据成功预测2012年美国选举结果;麻省理工学院利用手机定位数据和交通数据建立城市规划。
2 建立免费网络医疗指引系统的设想与目的
2.1 设想
利用大数据技术对医疗卫生数据进行分析、处理和建模, 建立具有智能诊断与指引功能的免费网络医疗指引系统。当老百姓出现不适时, 可将自身的情况诉之于系统, 系统根据其自诉的情况结合性别、年龄等进行智能判断, 若是小病、常见病, 则给出处理方法, 指导患者自行处理, 建议多推荐中医的调理和指导;若需要进一步观察, 则给出在观察期间得到应注意的事项建议;需要进一步检查的, 则建议患者通过网上预约系统进行预约, 然后前往医疗机构进行进一步的身体检查。当然, 需要提醒患者若经过医疗指引效果不佳的;或者出现急、危、重等症状的应及时到正规医疗机构就诊。
2.2 目的
通过随时免费使用网络医疗指引的方式, 完成对患者的筛选, 减少小病、常见病等普通病均到大医院求治和过度医疗的现象, 减轻大医院的医疗压力, 缓解“看病难”的问题。
通过指导患者自行处理小病、常见病, 向群众逐渐普及医疗常识, 同时减少患者到医疗机构就诊的次数, 降低医疗费用, 缓解“看病贵”的问题。
3 可行性分析
3.1 医疗卫生数据资源丰富
大部分县及县以上医院均已建立起以患者为中心的电子病历系统, 该系统详细地记录了患者的基本信息, 病程发展、诊断以及处方治疗等卫生数据;2010年底, 原卫生管理部门完成了“十二五”卫生信息化建设工程规划编制工作, 初步确定了我国卫生信息化建设路线图, 简称“3521工程”, 即建设国家级、省级和地市级三级卫生信息平台, 加强公共卫生、医疗服务、新农合、基本药物制度、综合管理5项业务应用, 建设健康档案和电子病历2个基础数据库和1个专用网络建设。随着这些平台、系统的不断建设和完善, 医疗卫生数据源头也越来越多, 数据将越来越丰富。系统之间的互联互通和信息共享也能使“信息烟囱”“信息孤岛”等现象有望得以消除。
3.2 大数据技术应用广泛
大数据技术除了在经济、金融、政治、社会安全管理方面等有广泛应用外, 在医疗卫生领域的应用也广为人知。2008年, 谷歌推出“谷歌流感趋势”项目, 利用网民搜索的关键词检测流感是否爆发, 在2009年美国H1N1爆发几周前及时而准确地预测了流感在全美国的爆发流行区域, 让美国公共卫生机构为之震惊。2014年4月, 中国疾病预防控制中心在传染病控制方面与百度合作, 利用大数据引擎建成我国首个流感预测系统。这些例子均为利用大数据技术建立网络医疗指引系统提供重要的实践经验。
3.3 互联网高度普及
随着的经济的快速发展, 互联网的普及程度越来越高, 在网速不断加快的同时, 资费也不断下降, 特别是无限网络的高速发展, 使老百姓对互联网的使用更加便捷。此外, 政府部门也出台了不少措施推进互联网的进一步普及, 深圳市罗湖区政府于2013年1月实施“智慧罗湖”项目, 通过政府购买服务, 运营商负责建设管理Wi Fi网络, 在辖区内各大商圈、政府部门、交通枢纽等九大场所为市民免费提供无线上网服务, 这将为网络医疗指引系统的推广普及提供网络基础。
3.4 网络终端高度普及与多样化
智能手机、平板电脑近年来高速发展, 不断普及, 成为继台式电脑、笔记本电脑后的主流网络终端之一, 使老百姓对网络终端的选择更加多样化, 上网更加便捷。同时, 各大网络公司对手机APP的大力研发和推广也使得老百姓获得更好的上网体验。可以设想, 在智能手机上安装网络医疗指引系统APP, 将使老百姓能随时随地获得指引。随着各式各样传感器的出现和数据收集技术的进步, 将来还能实现利用智能手机直接收集患者的体温、血压、心率等基础信息, 有助于系统作出更有针对性的指引。
3.5 临场路径试点工作已经开展
临床路径是指针对某一疾病建立一套标准化治疗模式与治疗程序, 是一个有关临床治疗的综合模式, 相关试点工作已由国家卫生计生委组织在国内开展。相对来说, 临床路径的内容更加简洁易懂, 可操作性强。如能应用在网络医疗指引系统上, 则能给患者提供更加细化, 更加标准化的医疗指引。
4 结束语
建立网络医疗指引系统有三个关键要素:一是要有丰富的医疗卫生数据资源, 并且通过建立完善的机制达到数据共享;二是要有技术支撑, 对海量的数据进行分析处理, 挖掘数据的深层价值;三是要取得社会的广泛支持, 特别是政府、医师、患者这三个与医改密切相关的群体的支持, 才能有序高效地推进。
地方文献数据库检索系统建立之设想 篇3
由于国家、地区间的宏观调控不力,主观上缺乏统一规划的思想意识,技术上缺乏网络环境的支持,属于事业单位的各报社缺少需求分析和用户界定,也很少注重数据库的利用率问题,致使各地方报社自行投资建库,造成数据库规模小,缺乏竞争机制,建库方式单一,在选题上重复与空缺并存,造成人力、物力、财力的极大浪费。例如《南方日报》、《广州日报》和《羊城晚报》,各自都建有报纸信息数据库。由于同属于广东地区的地方报纸,相当一部分内容是重复的。像“中国新闻”、“国际新闻”、“广州新闻”、“体育新闻”、“天气预报”、“金融证券信息”等报道,因为消息来源是一致的,所以几乎每天的内容都大同小异。
目前,从总体上看,地方报纸信息数据库开发重复现象严重;而从个别来看,由于地方报纸信息的地方性、复杂性与时效性和技术支持不够,以及人员专业素质较低等因素的影响,普遍存在现有的报纸信息资源开发不足的问题。
1.2 检索效果未如人意
一个实用可行的报纸信息检索系统应是外部特征检索、主题检索、分类检索、全文检索的综合应用[1]。目前已经建立的地方报纸信息数据库大多都只有外部特征检索和全文检索两种检索途径(见表l)。
表1 广东部分地区报纸信息数据库可检字段一览
单 位
外 部 特 征 字 段
内容特征字段
广州日报
(起始)时间、时间版次、作者、标题
关键词
南方日报
(1993-1996)日期、作者、标题、栏目刊头、头版头条、版名、版次、体裁、版序、类目
(-)日期、标题、版次、版名
类目名称
关键词
羊城晚报
(1991-1993)(起始)时间、时间版次、作者、标题
(1994-)标题、作者、时间、专栏、版次、注释(专题报导名称等)
专栏名称
关键词
深圳特区报
标题、作者、时间、版次、地区、来源
关键词
一般的用户都能快速简便地从作者、标题、日期、版次等外部特征入手查找资料,但前提是用户已事先知道要查找的资料所在的日期及其他信息,否则,用户要想扩大或缩小检索范围,查全查准资料,并非易事。数据库缺乏科学的辅助检索工具,影响了它的使用效果。
全文检索与其他检索途径相比,虽然具有不需人工标引加工、便于查找文章细节、检索结果直接可靠、检索详尽彻底、使用简便易学等优点,但在不进行任何控制的情况下,文章中的每一个字、词均可成为检索点,虽在输入方面大大节省了人力和存贮空间,却加重了检索方面的负担,使每次检索命令中的文献量偏多,筛选量过大,用户检索所需时间长,直接影响了查准率,造成了检索噪音。再加上“假义词”、同义词大量存在,更容易造成漏检错检,难以保证查全率和查准率。
1.3 人员素质及其知识结构影响数据库发展进程
由于多方面原因,我国新闻资料从业人员整体素质不太高,知识结构不合理。据调查统计,具有高级职称的新闻从业人员仅占全部人数的5%[2],信息学情报学专业毕业的工作人员更是凤毛麟角。近年来,一些沿海经济发达地区、尤其是广东地区的新闻资料从业人员的大专以上学历的比重有所增加,但大部分属于后继学历,而且学科专业不对口,从整体而言,同样存在素质不高、知识结构不合理的问题;负责开发数据库的计算机技术人员一般都不甚了解数据库所属专业,而数据库所属专业人员反过来也不懂计算机技术;负责开发报纸信息数据库的计算机技术人员,一般都不熟悉报纸信息的分类、主题标引等业务工作,同样,从事报纸信息业务的工作人员通常都不懂得计算机程序编写及系统设计等知识,或是只懂得一些计算机的基本操作。因此,常常囿于双方的沟通和知识结构差异的问题,都会不可避免地、或多或少地影响数据库的发展进程。
1.4 商品化程度尚低,不能向社会开放
目前我国已建的地方报纸信息数据库大多只供本单位内部使用,一般不能向社会开放,能提供商业化服务的更是屈指可数。其原因是:
(1)地方报社的行政体制束缚了信息服务的社会化与商品化进程。
(2)信息市场发育水平低,信息的价值与价格关系没有理顺,地方报纸信息服务的社会化与商品化缺乏大环境。
(3)社会信息化意识不强。一方面建库者对数据信息的社会性认识不足,只想独霸,不愿共享;另一方面是社会公众缺乏利用现代化手段获取信息的意识,习惯于从行政渠道下达的政策文件中获取信息,形成了信息需求上的惰性,即使是横向联系也要通过上级管理机构进行协调;加上对地方报纸信息数据库了解不多,或是由于网络通信等问题而放弃使用数据库。
(4)缺乏必要的资金投入与人力投入。数据库是属于技术知识密集、资金密集和劳动密集型的事业,没有足够的资金、人力及技术力量的投入,难以快速启动建成并维持长期正常运转和提供服务。目前多数地方报社资金仍然比较困难,人手短缺,信息数据库的工作人员大部分都是身兼数职,常常忙于内部服务,很难再向社会开放或开展商业化服务。
1.5 未能突出地方特色
【地方文献数据库检索系统建立之设想】推荐阅读:
建立地方与民族文献数据库的设想08-15
建立地方文献主题目录的设想与实践08-29
对西北地方文献数据库建设的构想01-03
文献检索系统开发研究论文06-22
文献信息检索课程文献检索参考课题05-24
文献检索检索报告12-08
文献信息检索08-03
文献信息检索课08-05
医学文献检索09-20