医疗数据

2024-08-16

医疗数据（精选12篇）

医疗数据篇1

按照新医改方案中关于大力推进医药卫生信息标准化建设的要求, 人力资源和社会保障部于2009年7月启动了医疗保险联网数据上报工作, 各统筹地区将医疗保险数据经过标准化转换后逐步集中到各省及部数据中心, 这标志着医疗保险数据整合工作的正式开始。

由于医疗保险政策复杂, 联网环节多, 数据量大, 各地区普遍按照其业务需求开发了医疗保险管理信息系统, 这些信息系统在规划时缺乏全局性的考虑, 大多没有按照统一的数据标准建设, 使得各地区医疗保险数据在类型和格式上差别很大, 因此要推进医疗保险信息标准化建设, 推行全国统一的医疗保险数据规范就是当务之急。为此, 人力资源和社会保障部下发的《关于开展医疗保险生育保险联网指标上报工作的通知》 (人社部函【2009】136号) 中详细列出了医疗保险和生育保险数据整合的具体技术指标, 其中医疗保险19张表, 共计420个指标, 这些指标基本涵盖了支撑医疗保险信息系统的基础数据。各地区将根据这些数据指标开发相应的数据转换软件, 这样不论各地数据有多大差别, 经过转换后都可符合国家标准, 达到数据类型、数据格式及库表结构的统一。对于空项的数据, 各地可以逐渐调整政策, 规范业务流程, 在信息系统升级时将这些空项数据填补上来。

在实现市级统筹的基础上, 各市通过联网上报软件将数据集中到省级数据中心, 再由各省数据中心将全省数据上报到部数据中心, 从而达到了全国医疗保险数据的全面整合。这种方法简便易行, 可以不考虑各地区政策比例、缴费基数、结算办法以及各自信息系统的差别, 而单从医疗保险基础数据方面着手, 通过按照国家标准进行数据转换使各地区的数据在类型和格式上趋于一致。这样比较复杂的医疗保险数据在较短的时间内就可以达到一致并实现全国范围的数据整合。

医疗保险数据整合之后, 不但能为统计分析及宏观决策提供更为全面可靠的数据, 同时还为异地就医实时结算、医疗保险关系跨地区转移接续等医疗保险难点问题提供可行的解决办法, 最终为推进金保工程建设及实现社会保险“一卡通”奠定良好的基础。

一、为多元化的统计分析及宏观决策提供数据支持

由于这些集中上来的数据详细到每一个参保人的缴费和就诊信息, 数据全面可靠, 可以在此基础上开展多元化的统计分析工作。如开展参保人群及参保率比较分析、基金收支结余分析、单病种医疗费用分析, 门诊常用药分析等, 从而为制定覆盖全民的参保策略、基金风险调剂政策、重大疾病管控方法及门诊统筹政策提供有力的数据支持。这些统计分析不仅能够为国家宏观决策提供依据, 通过地区间的比较分析还可以为各地区查找问题, 指导各地区制定合理的政策比例, 促进区域间医疗保障水平的平衡发展。同时结合这些翔实可靠的数据, 还可以加强医疗保障审计监管工作的力度, 增强各地医疗保险经办机构业务操作的透明度, 通过信息公开, 接受社会各界广泛监督, 进一步规范经办机构行为, 建立更加和谐的医保、保患关系。

二、为异地就医及医疗保险关系转移接续问题提供可行的解决办法

异地就医监管和费用报销一直是医疗保险的一个难题, 在新医改方案中明确要求改进异地就医结算服务, 减轻参保人负担。异地就医实时结算是建立在数据统一和联网的基础上的, 在数据整合之后, 各地交换库中的数据实现了统一, 同时, 各地通过和省级数据中心及部数据中心的联网, 也间接实现了各地区的联网, 这个问题就可以得到解决。各地可以通过联网软件有选择的将省级或部数据中心的异地参保人员信息下载到本地交换库, 并标记为异地人员, 通过数据转换软件转入本地生产库, 此时异地参保人员就可以在当地住院, 所产生的医疗信息通过本地交换库上传到数据中心, 则参保人所在地医疗保险经办机构就可以通过和数据中心联网下载到这些信息, 实现异地医疗费用的实时监管及实时结算, 无需参保人垫付医药费, 同时医疗保险经办机构也大大减少了手工结算的工作量。

同理, 对于农民工及其他流动性较强人员的医疗保险关系跨地区转移接续问题, 各地医疗保险经办机构也可以通过与省级或部数据中心联网实现数据交换得到解决。各地区需按照本地实际情况制定出参保人医疗保险关系转移接续办法及合理的基金转移比例, 在本地医疗保险信息系统中增加相应的医疗保险关系转移接续功能, 利用从数据中心下载到的异地参保人数据, 对这些数据进行本地化处理, 实现参保关系的接续及个人账户和基金的转移, 消除地域限制, 方便参保人在各地参保及就医。

三、为推进金保工程建设及实现社会保险“一卡通”奠定基础

金保工程旨在全国范围内建立统一、规范的劳动和社会保障信息系统, 其中建设能够实现养老、失业、工伤、医疗、生育“五险合一”的社会保险信息系统是金保工程的一个目标。在这五个险种中, 医疗保险的数据最复杂, 整合难度最大。在医疗保险数据整合这个难关被攻克之后, 金保工程“五险合一”的建设就能够取得突破性的进展。在统一的数据标准和整合规范下, 各险种分别实现了全国范围的数据整合之后, 通过数据库表的逻辑对应关系, 就可以实现各险种之间的信息共享和数据交换, 从而可以开发统一的应用软件, 实现各险种之间的业务衔接, 达到“五险合一”的目标。

在各险种数据分别整合的基础上, 实现各险种的信息共享和业务衔接是“五险合一”的初级阶段, 在此基础上, 还要全面整合包含五大险种在内的社会保险数据, 逐渐以统一的交换库代替各自的生产库, 以社保核心平台为基础开发实用、高效的“五险合一”软件, 进一步提高信息和硬件设备的利用效率, 减少资源浪费。

社会保险“一卡通”是金保工程“五险合一”建设的目标, 全国联网和各险种间的数据共享是实现“一卡通”的基础, 在社保数据全面整合之后, 参保人在任何一个网点都能够使用社保卡办理社保业务, 配合“一卡通”的使用, 社保经办机构整合资源, 进一步简化业务流程, 从而为参保人提供更大的便利。

四、逐步提高统筹层次, 实现全民参保和全国统筹的最终目标

新医改方案中明确提出医疗保险建设的总体目标是逐步提高统筹层次, 实现制度框架的统一, 建立城乡一体、覆盖全民的医疗保障体系。这个总体目标的实现, 是中国社会经济发展的必然结果。目前, 除了一些地区实现了医疗保险市级统筹外, 大部分地区还停留在县级统筹水平, 新医改方案要求到2011年城镇职工医疗保险和城镇居民医疗保险基本实现市级统筹。实现市级统筹, 不但需要各级政府部门的协调和大力支持, 以及一些相关机构的积极配合, 还需要开发适合市级统筹业务模式的医疗保险信息系统, 将大量的繁琐复杂的数据整合在统一的市级数据库中。

医疗保险数据整合为市级统筹数据统一工作提供了可资借鉴的标准和规范, 各地可以直接按照国家公布的数据指标建立规范的生产库, 简化数据转换操作。在按照国家标准实现数据整合之后, 各地逐步升级各自的医疗保险信息系统, 逐渐以交换库代替生产库, 从而为将来的省级统筹乃至全国统筹打下良好的基础。

当医疗保险数据通过整合逐级集中到国家数据中心之后, 如何保证数据的安全就是一个显著的问题。由于大量数据通过联网集中到一个数据中心后, 对计算机硬件设备的承载能力及网络传输的安全性能都有很高要求, 这不但需要建设高水平的数据灾备中心确保数据的安全备份, 还需要建立严格的数据传输规范, 制定相应的政策和措施, 提高人为的警觉性, 在国家、省、市三级业务专网中, 通过层层监管, 保证数据整合工作的有效实施。各市也需要结合目前各自信息系统的状况, 制定切实可行的数据转换方案, 将数据有效转换, 快速集中到上级数据中心, 配合上级部门共同做好医疗保险数据整合工作。

医疗数据篇2

科技发展到今天，医院已经基本能实现无纸化办公，传统的手开处方模式已基本结束。省级以上的医院都已经实现智能化、信息化、数据化。但是大数据时代，互联、互通、共享才是时代特色，数据局限于几家医院或一片区域都没有太大意义，只有在大范围甚至全国实现数据互通，共享，才能让人们真正享受大数据带来的福利。

在科技高速发展的同时，我国经济也在高速发展，随着人民的物质生活水平不断提高，相应对医疗、保健养生方面也提出了更高的要求。而我们国情决定了大部分人都处于基层范围，在大数据时代的医疗结构中，县级医疗单位就处于一个非常重要的位置。它起到一个承上启下的作用，只有它实现智能化、数据化、信息化，才能真正提高广大人民接受的医疗水平。

医院救人如消防员救火，争分夺秒，浪费时间=浪费生命。大家经常能看到这样的场景：一个护士妹子跳上手推车做心肺复苏，其他人推着向急救室飞快跑去。然人力有时而穷，这就需要我们想法缩短可能缩短的进程，为病人获得更多的时间。如果能在一个或几个省甚至全国范围现在数据互联、互通，那就很方便快捷了，病人只需在这个范围内的任意一个终端上，刷下自己的身份信息，主治医生就可以看到他以前所有的治疗信息，根据他的既往病史，迅速作出判断，大大缩短治疗时间。再比如：一个人急需手术，但他所在区域无法完成这个手术，这时候上级医院专家可以在线视频，通过传感器的检测数据来诊断病情，通过遥控智能手术设备来完成手术，从而挽救生命。

未来的医疗，可不仅仅是治病就完事了，应该是集预防、治疗、治疗后回访，康复，保健几位于一体的立体式治疗模式。这就对医生提出了更高的要求，不仅要医术精湛，还要熟练各种智能化器械、终端，更是要治疗思维模式的改变、提高。以后医生的工作范围不仅仅是在医院，首先要普及疾病常识，让人们了解，做好预防；治疗后可以通过手机终端回访，了解病人情况，做好治疗后的康复工作，下一步的保健、养生。甚至可以通过手机终端连接传感器，简单检测一下情况。可能以后医院也就不仅仅是医院了。

大数据互联网带来了方便快捷，同时也有不可忽视的隐患问题。其一就是网络安全问题。互联、互通，首先面对的就是来自网上的各种病毒、木马，甚至于有目的的恶意攻击，还有就是医院里终端使用中带来的各种意外。第二就是信息泄露。医院的数据库中保存有大量病人的详细信息，不管是什么原因，都是一场不小的灾难。因此大数据互联网时代，安全防护是重中之重，不仅要防住来自网络攻击的“网灾”，更是要加强管理，警惕“人祸”。

打开医疗数据“黑匣子” 篇3

美国布鲁金斯学会对医疗数据公开十分关注。该学会医疗改革研究中心执行主任卡维塔·帕特尔于12月1日邀请专家学者召开研讨会，从微观层面探讨如何通过有意义的数据公开，促进医疗系统透明度。而技术创新研究中心主任、副会长达雷尔·韦斯特和研究员严亚拉（音译）早前发布研究报告《医疗领域的新兴革命》，从宏观层面分析了医疗数据公开面临的机遇和挑战，并提出了相关政策建议。

医疗数据逐步公开

美国总统奥巴马2013年签署了一项执行法令，要求所有新增政府数据都必须以电脑文件方式向公众开放。白宫管理预算办公室和科技政策办公室同时也颁布了开放数据政策，将封闭的政府数据向企业、研究者和公众开放。遵循这一法令，美国政府公开了大量医疗领域数据。最近，美国医疗保险及医疗补助中心（CMS），前所未有地向公众开放医生的酬劳明细以及医疗机构收益、医生开处方模式、手术与药物等医疗费用的详细数据。

从历史上看，医疗数据一直是个“黑匣子”。患者、医保机构甚至医院和诊所本身，都很难获取医疗服务和价格的实时、准确的信息。哪怕是告到法院，公众也很难获取医生的开方和酬劳信息。

帕特尔认为，CMS的做法是促进医疗市场透明度的重要一步。数据的公开对各方都有好处：对患者而言，可对各家医院和诊所的服务和价格进行对比;对医保机构而言，能识别医疗服务提供方的价格是否过高;对医院和诊所而言，可激发它们之间的竞争，提高医疗服务的整体效率。

《医疗领域的新兴革命》报告说，公开医疗数据顺应了当前两大趋势：一是病人参与疾病预防、保健、治疗的程度越来越高。病人越来越多地从网络和亲朋处获取信息，作为对医疗机构信息的补充。数字技术可赋权病人，扩大其搜索范围，使其获得更多、更新的数据，更积极地与医疗服务提供者商量治疗计划。这是“以病人为中心”式医疗的第一步。

二是病人越来越在各种网络平台上生产数据，例如，将自己的饮食、运动、病情等信息上传到网上。这种病人自我报告的数据对医疗有积极的作用：在网络上报告数据和询问可减少不必要的入院治疗;同时，这些数据对医疗机构进行研究也很有价值。

此外，美国监管者越来越重视医疗效果，政府开始惩罚重复入院率（即同一病人某段时间多次在医院治疗）高于平均值的医院，令其作出解释并提出改进计划。构建医疗数据公开系统可帮助医疗机构跟踪病人治疗效果，保证病人得到适当的治疗，提高治愈率。

“单单公开医疗数据不够”

尽管医疗数据公开对医疗改革有积极作用，但布鲁金斯学会的两项研究活动均表明：单单公开医疗数据是不够的，公开医疗数据目前还面临诸多挑战，需要多项政策支撑。

目前，医疗数据公开主要面临四大挑战。一是数据归谁所有。《医疗领域的新兴革命》报告认为，为了整个系统的利益，各方机构都应将信息拿出来共享。如果医院、医保机构、药店等将数据作为自己的敏感资产，那医疗数据公开的整个生态系统就无法建立。不过，帕特尔说，政府带头公开医疗数据对私营部门有“涓滴效应”，即通过提高整体利益，刺激私营部门也共享数据。

医疗数据由多方持有还带来技术层面的互操作性问题。上述报告说，各机构的数据管理系统在技术细节、语言、语义上都有很大差别，不同的信息系统难以联通和交换数据。帕特尔认为，各机构碎片化的数据应整合在一起，这样才便于人们对医疗机构进行全方位了解。

二是病人隐私和数据安全问题。上述报告认为，即使数据去除了个人识别信息，尊重隐私对数据公开仍至关重要。医疗数据可能包含药物记录、地理位置、消费习惯等各种信息，这些信息对用户来说是高度敏感的，一旦泄露，后果非常严重。问题在于，医疗数据公开系统还不完善，不像金融数据共享系统，有第三方来确保数据的储存和交换安全。而且一旦发生事故，第三方可对客户进行赔偿。

三是过于依赖医疗数据可能破坏医患关系。医生当面问诊病人的一大好处，是能跟病人建立情感连接。如果未来医疗领域过于依赖信息技术和数据分析，病患这种情感连接可能被破坏，治疗过程失去人性因素。病人会觉得被忽视，丧失对医生的信任感，影响诊疗效果。

四是费用问题。应用医疗大数据的目的是增强整体效率，但部署、维护、更新数据系统对某些医疗机构来说，可能是一笔巨大花费。

公开医疗数据挑战多多，但上述报告认为，只要对公开数据进行政策规范，其将对医疗改革有极大裨益。具体可从以下6方面着手：

使用大数据工具。每个病人的经历都可为有效治疗作贡献。相较于临床实验，医院可利用大数据工具，对大量公开的医疗数据进行分析，不仅节省费用，还能加快药物研发。

建立技术标准，解决互操作性问题。单个医院数据就像一个个孤岛，如不相联相通，数据公开的效果就大打折扣。而将各方数据系统打通，最重要的是政府要出台相应的技术标准。

注意患者教育。要防止出现“数字鸿沟”，帮助数字时代的弱势群体连接到医疗公开数据系统;此外，获取医疗公开数据的界面应设置成用户友好型。

数据记录多元化。建立以患者为中心的健康数据系统，不只是公开医疗机构、医保机构、药厂等组织的数据，患者本人的各种信息对诊疗也有很大帮助。数据公开平台应建立接口，将患者平时自我报告的如饮食、运动习惯、血压等健康相关数据上传。

保证患者隐私权和数据安全。患者的健康相关数据可能比金融数据更敏感，因而数据安全性要求更高。政府不仅要比照银行系统，建立更安全的数据系统，还要对医疗数据的使用，出台相应的政策和规范，避免医疗数据被不当使用。

医疗数据篇4

关键词：元数据,数据共享,医学综述

1、元数据的基本概况

元数据词最早出现于美国航空航天局的《目录交换格式》手册中[1], 被译为“元数据”或“诠释数据”。其英文定义可理解为“描述数据的数据”或“关于资源的结构化数据”。对于元数据的具体含义虽有不同解释, 但一般认为元数据是用于提供某种资源的有关信息的结构数据 (如题名、外在表征、位置等) 。元数据最早主要指网络资源的描述数据, 常用于网络信息资源的组织和利用[2]。元数据的目标主要有两个方面:一是简单高效的描述、保存、组织和管理大量信息资源;二是使信息资源的检索、发现、定位和共享更加便利与高效[3,4]。

2、元数据的结构

2.1 内容结构

用于定义元数据的构成元素。包括:描述性元素、技术性元素、管理性元素和复用元素等[5]。元数据内容一般分为三层, 即元数据子集、实体和元素。元数据元素是元数据最基本的信息单元, 实体是同类元数据元素的集合, 子集是相互关联的元数据实体和元素的集合。在同一个子集中, 实体可以有简单实体和复合实体两种, 简单实体只包含元素, 复合实体既包含简单实体又包含元素, 同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系[6]。

2.2 句法结构

用来定义元数据的格式结构以及如何描述这种结构。如元素结构描述方法 (如XML Schema, RDF等) , 结构语句描述语言 (如扩展巴科斯范式标记法等。此外, 句法结构还可以定义元数据与被描述数据对象的捆绑方式。

2.3 语义结构

用于定义元素的具体描述方法。包括元素本身有关属性的定义, 一般采用IS011179标准, 《数据元素的规范和标准化》) ;元素内容编码规则定义, 编码规则可以是特定标准, 或最佳实践 (best practice) 或自定义的描述要求 (in.smlc曲n) [7]。

3、元数据的类型

按组织信息资源的功能, 元数据可分为以下类型:描述型元数据、结构型元数据、存取控制型元数据和评价型元数据。美国Getty信息研究所的Anne J.Gilliland—Swet—land根据元数据功能性将元数据划分为管理型元数据、描述型元数据、保存型元数据、技术型元数据和使用型元数据[7]。英国图书馆及信息网络化办公室将在结构和语义方面逐渐完善的一系列元数据分为三组:简单格式、结构化格式和复杂格式[3]。此外, 还可以按照元数据的内部结构、应用领域、编码标记方式、开发设计角度、通讯协议等方面进行分类[8]。

4、元数据特点和作用

4.1 著录描述

元数据对数据单元进行详细、全面的描述。元数据元素包括内容、载体、位置与获取方式、制作与利用方法等方面信息。

4.2 识别和确认

元数据对信息资源进行个性化描述, 将信息资源中的重要信息抽出并加以组织, 赋予语义并建立关系, 提供识别和确认信息资源的基础, 从而有利于用户识别和确认所需要的信息资源。

4.3 评估与选择

根据元数据所提供的信息, 参照相应的评估标准, 结合使用环境和实际需要, 用户可以对信息资源作出取舍, 选择适合自己使用的资源。

4.4 检索与定位

元数据通过在描述数据中提供检索点, 实现对信息资源的检索和利用。由于元数据同时包含信息资源位置方面的信息, 因此通过元数据可确定资源的存储位置, 从而使用户获取所需要的信息资源。

4.5 资源管理

元数据支持对资源利用和管理过程的政策与控制机制的描述, 包括权利管理、电子签名、使用管理、支付审计等方面的信息。

4.6 信息资源保护与保存

元数据支持对资源进行长期保存, 包括详细的格式信息、制作信息、保护条件、转换方式、保存责任等内容。

4.7

资源共享元数据可整合异质的信息资源, 提供分布式信息资源共享[9,10]。

5、元数据的互操作

5.1 元数据映射

所谓元数据互操作是指多个不同元数据格式的释读、转换和由多个元数据格式描述的数字化信息资源体系之间的透明检索。元数据映射指两个元数据格式间元素直接转换, 或通过中介格式进行转换。这种途径转换准确、转换效率高, 但在面对多种元数据格式并存的开放式环境中此法应用受到限制。

5.2 标准描述方法

其过程是建立一个标准的资源描述框架, 用这个框架来描述所有的元数据格式, 只要系统能够解析这个标准框架, 就能解读相应的元数据格式。通用标准是可扩展标记语言和资源描述框架, 由于两者在应用中各有优缺点, 所以有人提出将XML和RDF模式相结合的元数据互操作机制[11]。

5.3 元数据复用

通过在一个元数据格式中, 引用其它元数据格式的部分元素或属性, 用来描述复杂资源, 从而扩展元数据格式适用范围, 以促进元数据的相互转换。

5.4

元数据开放搜寻利用元数据来进行资源搜寻和发现时, 可以采取元数据开放搜寻机制来实现元数据互操作。

5.5 元数据语义转换

通过元数据语义定义和元数据概念集, 支持两个元数据格式间元素通过语义分析进行转换。

5.6 数字对象方式

通过建立包含元数据及其转换机制的数字对象, 来解决元数据互操作。

6、元数据标准

6.1 定义

元数据标准是指描述某些特定类型信息资源的规则集合, 一般包括语义层次上的著录规则和语法层次上的规定。主要用于数据发布、数据集编目、数据交换、网络查询服务等, 同时也是数据集整理、建库、汇编、发布的依据。元数据标准一般具有适时、灵活、可扩展、易兼容和互操作性。

6.2 结构

元数据标准体系整体上采用层次式的树状结构。即先由管理部门制定根级元数据标准, 然后各学科领域根据根级元数据标准制定各自学科的领域元数据标准。由于相同层次上元数据标准的父标准都是统一的, 所以很容易对数据进行整合, 并保证元数据的通用性, 互操作性, 也保证专业元数据标准可以为自己专业服务。通常一个元数据标准主要包括:前言、适用范围、参考标准、术语、元数据分级、元数据内容及定义、元数据扩展原则及相关附录等。

6.3 制定原则

元数据标准的制定须遵从一定的原则, 即标准要支持元数据在行业或其他领域的应用;标准以提供数据的轮廓为目的;标准要提供一个实体与元素集, 并定义元素的性质 (如必选, 一定条件上可选及可选等) 。元数据标准定义的对象是数据, 而非定义与数据相关的计算机系统, 传输手段和信息表现方式等。

6.4 国内外应用的元数据标准

目前有几十种元数据标准, 这些标准可简单划分为两大类:一类是针对互联网上信息资源的, 典型的是都柏林核心元数据标准;另一类是针对行业的, 如美国联邦地理数据委员会地理空间元数据内容标准等[4,6]。

7、元数据技术在科学数据共享中的应用

7.1 元数据系统的组成

元数据系统主要由三部分组成:元数据编辑软件, 用于编辑生成符合特定元数据内容标准规范的元数据文档;元数据库系统, 由元数据库维护平台和元数据服务器两部分组成, 用于元数据的管理、维护、网络发布;元数据网关, 用于实现元数据的互联网发布, 代理用户对多个元数据发布服务器的访问。

7.2

元数据系统对科学数据共享的作用包括规范元数据;发布共享信息;促进元数据管理;减少重复生产和促进科学数据共享等。

7.3 元数据共享体系的建立

首先, 各科学数据提供机构建立自己的元数据系统, 然后, 将各参与机构的元数据系统的网关逐级联接, 就形成了元数据共享体系。在这个体系中, 网络用户可以通过任意一个元数据网关查询到所有在线元数据库中的元数据记录, 从而实现元数据共享。最后, 为实现科学数据的共享和交换, 科学数据提供者可以根据自身条件和实际需要, 建立相应的科学数据交易系统, 以实现科学数据共享。

8、元数据在医学科学数据共享中的研究进展

8.1 国外

当前在医学领域有多种元数据方案并存, 而这几种元数据方案都是基于Dc元数据标准。医学核心元数据方案 (Med。ical Core Metadata, MCM) 。该方案是由美国完成, 它是基于DC的医学核心元数据集, 主要用于描述和组织网络医学信息资源。MCM继承DC的语义及语法结构。为适应对医学信息资源的组织和描述, MCM在DC基础上进行扩展。主要体现在两个方面:McM—MeSH Term表和MCM—Resource Type表。MCM—MeSH Term表采用MED—LINE数据库中的医学主题 (MedicalSubjectHeadings, MeSH) ;MCM—Resource Type表是为适合网络医学信息资源的新类型, 在原出版物类型基础上扩展而来的, 共有19项, 其中新增类型有主页、文摘、新闻、图像、视频、音频、软件、病人教育和论坛等。此外, McM采用能够被网络系统识别和传递的超文本标记语言HTML予以标识, 主要使用HTMI/Meta元素, 用以标记关于资源整体的有关信息。法国医学资源元数据叫岫, 是由法国Rouen University Hos.pital (RUH) 发起, 于1995年实施, 主要用于描述和索引法语网络医学信息资源。法国医学资源元数据的设计思想与MCM基本一致, 即基于DC元数据集和MeSH词表来组织医学信息资源。在医学资源类型描述控制方面, 扩展MEDLINE出版类型列表, 根据网络医学资源特性增加一些新的资源类型。EBM元数据方案的特点是:提供原始研究的结构式摘要;除MeSH主题词表以外, 提出EBM实践中作为重要因素 (研究类型、临床展望) 的另外两个编码体系;提出EBM元数据用于因特网资源的可能性。它采用基于XML/RDF的可扩展标记语言, 面向内容描述, 文档结构灵活, 自定义标记, 增加了元数据的互操作性滔]。元数据及其技术在科学数据共享中的应用典范是“美联邦科学联盟元数据通道, 该元数据整合中心集结各个学科领域的30个数据库和1 700多个科学网址, 其中与医药卫生有关的数据库有5个, 用户发一个检索指令, 可以同时检索分布于美国的科学数据信息。其目的是为从事科学工作的公民及任何对科学有兴趣的公众, 提供跨部门的检索通道来查找和使用政府提供的有关科学技术的信息资源。

8.2 国内

我国是一个国有科学数据大国, 政府拥有的科学数据遍及科学研究的各个领域, 其中在医学研究领域, 已积累大量的基础、临床、预防和中医药方面的科学研究和观察数据, 如中国医学科学院建立的基础医学数据库 (包括中国人生理常数数据库、中国生物医学数据库、基因数据库等) 和临床数据库 (包括心血管病防治数据库、肿瘤数据库、高血压数据库和原发性骨质疏松症与老年性疾病数据库等) , 其中基础医学数据库的数据量已达到10GB左右;中国疾病预防控制中心 (CDC) 建立的数十个同规模的预防医学数据库, 其数据总量超过300GB;中国人民解放军总医院存有30多万份电子病历的电子病历数据库;中国中医研究院建立的中药科技基础数据库、古代本草文献数据库、针灸文献数据库等多个数据库, 其累积数据量已达到25GB, 并且每年新增与更新数据约4G。随着医学发展, 更多医学科学数据在不断产生, 这些医学科学数据形成我国医学科学研究的重要科学资源。但是由于国内还没有制定专门针对医学科学数据共享的标准和构建医学科学数据共享体系, 所以无法实现这些医学科学数据资源的检索、选择、交换、共享和有效利用。为实现医药卫生科学数据共享, 充分发挥其应有的效益, 2004年4月启动“医药卫生科学数据管理和共享服务系统”项目, 其总体目标是建立基础医学、临床医学、公共卫生、中医药学、特种医学、药物与创新药物6个科学数据中心, 并利用互联网技术将这6个科学数据中心连接起来, 构成一个物理上分布、逻辑上统一的医药卫生科学数据管理和共享服务网。主要工作包括整合现有医学科学数据资源, 建立50个主体数据库;制订数据共享规范及元数据标准;创建医药卫生科学数据目录查询系统等。现在国家信息中心正与相关单位协作制订有关科学数据共享工程的系列技术标准, 包括:《科学数据共享元数据标准》、《科学数据共享概念与术语》、《数据模式描述规则和方法》、《元数据标准化基本原则和方法》、《元数据检索和提取协议》等。目前中国医学科学院、中国人民解放军总医院、中国中医研究院、中国疾病预防和控制中心等机构已联合制定《医药卫生科学数据共享元数据标准》。

参考文献

[1]Cathro W, 袁芳, 苑二坡.元数据研究概述[J].现代情报, 2004 (4) :195—198.

[2]马费成.信息资源开发与管理[M].北京:电子工业出版社, 2004:122—129.

[3]张敏, 张晓林.元数据的发展和相关格式[J].四川图书馆学报, 2000 (2) :63—70.

[4]冯项云, 肖珑, 等.国外常用元数据标准比较研究[J].大学图书馆学报, 2001 (4) :15—21.

[5]张晓林.元数据研究与应用[M].北京:北京图书馆出版社, 2002:11—12.

[6]王国复, 吴增祥, 臧海侍.气象元数据标准与系统建设[A].见:孙九林, 施慧中.科学数据管理与共享[M].北京:中国科学技术出版社, 2002:187—188.

[7]秦笃烈.从VHP看医学科学数据共享政策的重大意义和实施[A].见:数字化可视人体国际研讨会论文集[C].Chongqing:International Workshop011Visible Human, 2003:91—96.

[8]李郎达.Metadata初探[J].情报科学, 2001 (6) :58—61.

[9]刘嘉.元数据:理念与应用[J].中国图书馆学报, 2001 (5) :32—36.

[10]高建勋, 吴开华.元数据发展中的热点问题讨论[J].图书馆, 2002 (5) :41—44.

[11]盛小平.元数据的互操作研究[J].图书馆, 2002 (2) :30—32.

医疗数据篇5

先进经验分享

作者：金豆数据DRG专家盛天奇

乱刷卡、违规操作……近几年来，基层定点医药机构的恶劣行为对百姓就医造成了不良影响，社保经办机构对此做出正确判断，运用信息化监管有效遏制了这些恶劣行为，为百姓就医带来福音。基层定点医药机构进销存信息管理

各地医保在前几年存在的问题中，以乱刷卡的社会影响最为恶劣。为此，社保经办机构组织实施统一的基层定点医药机构进销存信息管理平台，并要求全部基层定点医药机构按标准上传数据可以有效解决“乱刷卡”问题。

社保经办机构要求基层定点医药机构将全部药品的采购、销售信息逐笔导入“进销存信息管理平台”，进货的每一批药品的批号、来源、规格、数量、有效期等信息都需要清晰完整的填入并及时上传。并对照原始进货单和发票实施“全盘库”与重点药品抽查，确保每月对所有基层定点医药机构的进货凭证、销售记录和药品库存进行核查，并且每年对A类基层定点医药机构（可刷卡使用医保统筹基金的基层定点医药机构）全部药品盘库不少于3次，B类基层定点医药机构（只能刷医保个人账户的基层定点医药机构）全部药品盘库不少于1次。社保经办单位稽核部门每年抽样检查基层定点医药机构，并根据相关分析数据找到高风险的基层定点医药机构。

药品进销存管理系统逻辑模式与环节控制图

这一措施在上线地区一般能取得立竿见影的管理成效。“进销存”系统实现了对定点药品经营全过程监管，加强了对基层定点医药机构进货渠道的管控，遏制售出药品回流现象，并有效防止了基层定点医药机构销售假冒伪劣药品行为。建立外配处方电子化管理机制

打造医保外配处方电子化管理平台，参保人持纸质处方到其自主选择的基层定点医药机构进行购药时，基层定点医药机构将核对纸质处方与医保外配平台电子处方等详细信息，两者一致方能完成外配处方配药，严控配药监管。同时，还可以探索开展医保外配处方O2O线上线下一体化服务，规范处方药外配购药流程，实现外配处方的规范化、电子化流转，对外配处方进行实时化、全流程监管。基层定点医药机构远程视频监控

在“乱刷卡”现象基本销声匿迹的同时，新的问题又凸显出来。个别违规定点单位打“时间差”，利用社保经办机构下班的时间进行违规操作。例如，社保经办机构的工作人员利用录像回放功能，在审查前一晚下班至次日上班之间时间段的录像时，可以发现某基层定点医药机构存在违规刷医保卡的异常行为，并迅速锁定证据。当天，就可以对该基层定点医药机构执行取消定点资格的惩罚，并在媒体发布公告，可以产生极大的震慑作用。

为有效防范代刷医保卡、冒名刷卡等行为，要建立 “医保定点零售药店云”，应用社保卡智能身份、人脸信息采集、指纹静脉和比对识别技术，配合医保外配处方电子化管理。

通过启用远程视频监控系统，可以建成一个实现影像和实时刷卡数据同步上传的“医保远程视频监控中心”。该系统覆盖所有的一级定点医疗机构和定点零售药店，实现对基层定点医药机构的实时在线动态管理。监控范围应该覆盖了基层定点医药机构收款台、药品柜台、康复诊室出入口等区域。这样有利于社保经办机构监管部门在第一时间锁定违规骗保的证据。在总结经验的基础上，在视频监控深度应用上又进行了创新，对参保人员高额诊疗行为（如终末期肾病透析、工伤康复、化疗放疗等）进行精细化监管，开发“实名就医认证系统”，在国内首推指静脉认证复合远程视频监控，积极探索破解患者诊疗行为监控难题。参考资料：

（1）《医保定点药店：戴着镣铐起舞》作者：杨剑英

大数据深化医疗信息化篇6

“1+19”的顶层设计

上海的医疗卫生信息化工作在全国起步较早，逐渐形成医疗卫生机构内部信息化（如医院内部系统）、跨机构条线信息化（如公共卫生的专病管理）、机构互联（区域卫生信息化）三个层面的信息系统，按照谢维的说法，就是形成了“点”、“线”、“面”的信息系统建设框架。

之后，上海市着重考虑并论证下一步卫生信息化建设发展的方向，基本形成了打破“孤岛”、“烟囱”，实现“互联互通，共享互用”的区域卫生发展框架，根据上海的实际，规划了“1+19”框架。谢维解释说，“1”是指上海市卫生局的主数据中心，“19”是指上海17个区中心卫生信息中心、1个由所有三级医院形成的医联数据中心、1个公共卫生数据中心，通过“+”字，完成所有医疗卫生机构信息的交换和共享，进一步支撑业务协同，从而形成了“1+19”的顶层架构设计。通过这些数据中心的互联互通，已将上海市500多家公立医疗机构全部纳入区域卫生信息化体系中，未来还将把上海市的3000多家民营医疗机构也全部吸纳进来，从而实现广域的、互联互通的区域卫生信息化体系。

谢维介绍说，“1+19”的顶层设计分三个阶段实现。第一阶段是以医联网为代表的上海市所有三级甲等医院进行互联互通，首先实现了市属24家三级医院基于电子病历的互联互通。第二阶段是针对上海“基于健康档案的卫生信息化工程”（简称健康信息网）的建设，先试点6个区加所有三级医院的互联互通，之后扩大战果，实现上海市所有公立医疗机构的互联互通。谢维说：“建设健康信息网经历了复杂的上下联动的过程，我们克服了许多体制机制上和管理秩序上，以及互联互通技术上的困难。”目前整个市级数据中心可以实现与所有医院的数据共享，后台数据库每天入库数据1600万条，至今已累积数据43亿多条，形成了数据量很大的核心数据库。此外，在分布+集中的数据管理模式下，各分中心还有自己的数据库，相互联动，共同形成了上海市的健康档案数据库。

接下来，在“1+19”顶层设计下的区域信息化将进入第三阶段。谢维说，这一阶段的工作目前正在规划中，“其发展目标可能会重点围绕涉及医药卫生全领域的整合。”他说，只有形成数据在更大范围的交换、共享、整合和协同，才能更好地利用数据，“交换、共享、整合、协同”，这是在建设区域卫生信息化进程中的关键词，其中整合最重要，而交换则是手段。”谢维说。

大数据缓解“压力”

面对每天进账1600万条数据的海量数据库，如何管好、利用好这些数据，着实让谢维他们费了脑筋。他们担心，这么大的数据量，现在的技术搞得定吗？可持续吗？

2010年，健康信息网开始规划时，项目工程指挥部组织专家进行了长时间的、多方面的论证，在架构设计上同时参考了国际上各类模型，研究了云计算等技术，并得到了英特尔和集成商万达信息股份有限公司等的大力支持。谢维说，当时，他们一直面临着巨大的压力，因为海量的数据一旦进入了数据库，就转变成了对数据中心的直接压力，规划中巨大的访问压力和集成压力更加重了负担和难度。

谢维举例说，上海市有近12万台医生工作站，在医生工作站上提供了一个基本服务——“智能提示系统”（指针对医生诊疗过程中的重复检验、重复检查、重复用药进行后台监督，这一方面为了避免不必要的医疗资源浪费，另一方面是降低医疗质量和医疗安全上的风险。系统对于这三大“重复”将出现提示框，而最终的决定权在医生。），可以想象，12万台医生工作站当诊疗高峰时同时在线对后台的压力有多大。

类似的访问和处理压力还有很多，这使得项目开始之前的论证极为谨慎和严谨。谢维说，他们得到了上海市科委和市发改委的大力支持，前后花了一年多的时间进行论证，最终形成了基础框架。他们先试验用了40台虚拟机作为主要的分布式存储和分布式计算节点，利用Hadoop的核心技术来完善系统，并通过了上海市软件测评中心的测评。目前，在数据I/O层面上，5000次I/O并发之下，可以做到响应时间为1秒以内，而如果采用传统技术达到同样水平的话，投入将增加数倍。

新技术的应用鼓舞了谢维他们，“我们已经开始向云计算和大数据迁移，同时，还要在数据中心进一步深化，将更多的服务迁到医生工作站上去。”谢维说，下一阶段，他们打算重点围绕分布式存储、分布式计算能力，在综合管理、辅助决策、数据挖掘、数据探索领域进一步应用新技术。不过他强调说，“选什么样的技术要建立在需求的基础上，我更关心的是这项技术是否能满足我的需求、是否能解决我的问题，它的成熟度有多高、风险有多高，未来有没有发展。”

总结上海市区域卫生信息化项目取得的成果，谢维认为其中有三点值得借鉴，一是前期的咨询工作到位。万达信息股份有限公司是为该项目提供服务的集成商，万达卫生服务事业部副总经理孙嘉明说，他们把国外的一些先进的方法和实例给客户做了详尽的介绍，使他们增强了采用新技术的信心。二是采用了成熟厂商的放心产品。采用新技术有一定的风险，该项目所采用的是Apache Hadoop的英特尔发行版及英特尔至强解决方案，来自于成熟厂商的产品级的解决方案使他们用着放心。三是在后期实施过程中，用户、集成商和相关的公司共同协作，其中英特尔提供了很多测试设备和环境，保证了项目的顺利进行。

大数据推动个人医疗信息开放篇7

今天上医院看病基本上都离不开“医疗数据”,国内外医疗服务已走到数据驱动的年代,不管是数据获取,还是诊断、检测及后期的治疗干预。利用最新的云计算和大数据技术进行诊疗越来越常见。然而医疗健康数据的开放至今仍是一大难题,个人是否应该获得自己的医疗数据信息?如何获得其完整的医疗健康数据?目前前景还很模糊,但是充分利用IT技术和医疗相结合,已经是正在发生的事实。

潘多拉的盒子?

在3月27日博鳌亚洲论坛《智能医疗与可穿戴设备》分论坛上,华大基因CEO王俊表示医疗和IT实现完美结合,最重要的基础是数据、数字化,生命中很多体征都是可以被数字化的。他说,“这并不是硅谷型的IT,更多的是以生命为基础的IT。其实生命自己本身又何尝不是建立在代码和基因排序基础上的呢?我们可以用计算机分析众多的数据。比如移动医疗穿戴设备是很好的媒介,可以实时传达和生命、健康有关的信息,和医院实现互联互通。”

大数据与健康的关系日益紧密,用王俊的“基友论”来解释,这也意味着硅基数据对碳基生命越来越重要了。医疗信息涵盖许多,包括CT、核磁共振、血液检测、基因检测结果,接种经历,医生诊断,手术视频……这些数据都是无价之宝。

开放数据的价值,不仅在于病人可以从电子病历中获得数据,他们同样也可以向电子病历提供数据,辅助诊断。

开放数据的价值,不仅在于病人可以从电子病历中获得数据,他们同样也可以向电子病历提供数据,辅助诊断。目前市场上已有一些应用和项目,比如苹果的Health Kit,能够让用户定期提交健康数据,而且苹果已和Cerner和Epic Systems等电子病历系统建立合作,这对用户进行慢性病管理能起到一定作用。除了Health Kit之外,苹果还针对医护人员发布了Research Kit,医学研究者可通过苹果终端收集各类病患的健康数据,辅助诊断疾病。

一些医疗机构还提供一种“以病人为核心”的解决方案,开放公共应用程序接口,帮助人们在不同平台间共享数据。这一项目还努力打造一种保护患者隐私的工具。“如果患者的健康数据需要被应用程序或者其他设备分享,他们能够知情并选择是否同意这种做法”。

据了解,开放医疗数据遇到的阻力既来自医生,也来自医院方面。首先医生担心会提高沟通成本。其次,担心是否会影响医院的“生意”。再次,是否会让患者进行不当的自我诊断/评价。最后,也是最重要的,数据安全性是否有保障。

类似于这样的担心非常多,那么个人医疗数据真的就像打开潘多拉的盒子那样释放魔鬼了吗?答案显然不是,随着近年来医疗事业发展和大数据分析的逐渐增加,业界仍有不少声音在呼吁开放个人医疗数据。

值得一提的是,我国最高人民法院在2014年10月10日公布实施的网络侵权司法解释中,再次强调了对包括基因在内个人信息的保护力度,即任何人不得非法公开。业内人士在分析之后认为,用户行为信息和实时监控信息是典型的大数据信息,只要这些信息在搜集、使用或利用时符合《关于加强网络个人信息保护的决定》规定的合法性、正当性和必要性的基本原则,没有将这些信息公开特定化到个人,那么运用大数据信息的行为不仅不是非法的,甚至应该是得到鼓励的。

如何把数据还给个人?

目前,我国患者难以得到来自不同医院完整的个人健康数据,加之数据格式不一致,难于管理和充分应用,亟待规范。为了推动医疗、健康产业信息开放、共享、开源,国内出现了一些民间非盈利性组织,由国内优秀的相关HIT及医疗健康应用开发商、各类医疗及健康服务机构、医疗器械及健康类消费电子产品生产商、运营商、互联网公司、媒体等相关产业链机构和个人组成。开放医疗与健康联盟(OMAHA)就是这样一个组织。

在今年3月14日OMAHA成立大会上,其筹备会负责人郑杰呼吁,医疗数据应该还给患者。“当前一些机构的健康数据泄露问题是很突出的,比如一些云计算企业经常爆出存在大面积账户数据泄露问题。从安全的角度来看,我们提倡把个人的数据还给个人,个人为自己的数据安全负责。数据大集中管理的方式是双刃剑,虽然会带来一些方便性,但是数据泄露几率也比较高。”

由于国内医院已经实施了不同规范的HIS独立信息化平台,患者个人难以获得、自主管理自身的电子病历等电子健康档案,同时手写病历难以辨认,不方便查询、统计,会影响医患关系和服务质量,要解决该问题,需要完整、统一、普适的电子病历标准,及综合性强的操作平台系统,以及实用性强的运行机制。

因此,医疗信息数据的完整性对患者治疗非常关键,并有助于多专科协作。郑杰介绍,OMAHA联盟将推动数据开放,让老百姓可以用U盘拷取个人健康信息;推动建立源代码开放的电子生物档案,希望整合医院、健康管理机构,甚至包括可穿戴设备收集的数据在内的全民健康数据,构建个人全生命周期的“健康云”。

全世界在健康信息存储和使用方面,价值取向趋同。《美国联邦政府医疗信息化战略规(2015~2020)》中提到,要建立一种电子健康信息存储和使用文化, 营造安全、全面的健康信息交换和使用的环境,使每个人都能受益于简单、及时、公平、高效及恰当的信息获取和分享,并通过鼓励创新和竞争培养优质的医疗信息化解决方案。另外,苹果公司的researchkit就是源代码开放的数据存储模式,数据的使用者要自己解决海量数据的保存及传输问题,数据存储与公司服务器无关,符合美国医疗电子交换法案中关于个人健康信息的隐私保护标准及规定。

据了解,OMAHA联盟将联合健康报社移动健康研究院,在全国范围内征集志愿者,对国内三级以上医院的数据开放情况进行调研,了解患者拿到的数据类型及方式,如纸质病例、打印报告、在线浏览、可下载电子档案等,并了解患者所得数据的完整性及方便性。该调研活动产生的数据结果将纳入健康报社移动健康研究院倡导的“医患友好度”评价体系中,成为该评价体系的一个重要维度指标。

大数据在医疗行业中的应用场景

近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。因此,医疗行业将和银行、电信、保险等行业一起首先迈入大数据时代。

通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。研究表明,对同一病人来说,医疗服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从长远来看,不管是过度治疗还是治疗不足都将给病人身体带来负面影响,以及产生更高的医疗费用。

大数据分析技术将使临床决策支持系统更智能,这得益于对非结构化数据的分析能力的日益加强。比如可以使用图像分析和识别技术,识别医疗影像(X光、CT、MRI)数据,或者挖掘医疗文献数据建立医疗专家数据库,从而给医生提出诊疗建议。此外,临床决策支持系统还可以使医疗流程中大部分的工作流流向护理人员和助理医生,使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。

数据分析可以带来业务流程的精简,通过精益生产降低成本,找到符合需求的工作更高效的员工,从而提高护理质量并给病人带来更好的体验,也给医疗服务机构带来额外的业绩增长潜力。

医疗数据二次应用探析篇8

关键词：医疗数据,二次应用,机器学习

1 引言

医院信息系统(hospital information system,HIS)的迅速发展,促进了医疗信息的数字化,同时,电子病历的大量应用、医疗设备和仪器的数字化,使得医院数据库的信息容量不断地膨胀。这些宝贵的医疗信息资源对于疾病的诊断、治疗和医疗研究都是非常有价值的。然而,目前大多数医院对数据库的处理仅限于数据的录入、修改、查询、删除及一般的统计处理过程,属于医疗数据库的低端操作,缺乏对数据的集成和整体分析,更谈不上用于医疗决策和知识的自动获取,出现了“数据丰富,信息贫乏”的现象[1]。

2 医疗数据的特点

医疗信息涵盖了医疗过程和医院活动的全部数据资源,包括医院管理信息、临床医疗信息及区域卫生服务信息。在医院管理信息建设的基础上,以电子病历为中心的临床医疗信息系统正在医疗行业展开,包括医学影像PACS、检验信息LIS、心电信息系统和重症监护等信息系统,医疗数据二次应用的主要对象也是针对这部分信息资源的。医疗数据由于其特殊性,存在着不同于其他应用领域数据的诸多特点,使得医疗数据的二次应用与普通数据的二次应用存在较大的差异[2]。

2.1 多样性

医疗数据是从影像、实验数据以及医生与患者的交流中获得的,所以具有多种不同的形式,包括影像(如B超、CT、MRI、DSA、ECT、DR、CR等医疗成像设备的检测结果)、信号(如ECG、肌电信号、脑电信号等)、纯数据(如体征参数、化验结果)、文字(如患者的身份记录、症状描述、检测和诊断结果的文字表述)以及用于科普、咨询的动画、语音和视频信息。

2.2 不完整性

病例和病案的有限性使医疗数据库不可能对任何一种疾病信息都能全面地反映,表现为医疗信息的不完全性。同时,许多医疗信息的表达、记录本身就具有不确定和模糊性的特点。疾病信息所体现出的客观不完整和描述疾病的主观不确切,形成了医疗信息的不完整性。

2.3 时间性

医疗检测的波形、图像都是时间的函数;还有一部分医疗信息,比如患者的身份记录等静态数据,虽然不带有时序性,但都是对患者在某一时刻医疗活动的记录。

2.4 冗余性

医疗数据库是一个庞大的数据资源,每天都会有大量相同的或部分相同的信息存储在其中。比如,对于某些疾病,患者所表现的症状、化验的结果、采取的治疗措施都可能完全一样。

2.5 隐私性

医学数据不可避免地涉及到患者的一些隐私信息,当这些隐私信息使患者在日常生活中遭遇到不可预料的侵扰时,就产生了隐私性问题。隐私性不同于安全性和机密性,当未被授权的个人或机构设法取得这些隐私信息时,就产生了安全性问题;当拥有隐私信息的研究人员与未经授权的个人或机构共享这些患者信息时,就暴露出了机密性问题。医学数据挖掘者有义务和职责在保护患者隐私的基础上进行科学研究,并且确保这些医学数据的安全性和机密性。

3 医疗数据二次应用的提出

美国医学(http://www.amia.org)信息技术协会(AMIA)于2006年召开首脑会议,明确了医疗了数据二次应用的重要性,并发布了《面向国际架构的健康数据二次应用:美国医疗信息协会白皮书》。从保存和销毁数据、数据访问政策和联动能力、安全保障、审查和监督机制、数据保护立法等方面指导和促进了医疗数据的收集、存储、集合、链接和传输等过程。该架构将为合法的医疗数据的二次应用提供适当的保护,为今后的研究、分类、用途及政策的制定奠定了基础。

医疗数据二次应用是对医疗中产生的各种数据进行的再次开发使用的知识发现过程,是在医疗事实或观察数据的集合中寻找模式的决策支持过程。

广义的医疗数据二次应用是基于区域医疗卫生信息化基础上的,又称为健康数据二次应用。它适用于个人健康信息(PHI)的使用,超越了直接的公共卫生传送,包括诸如分析、研究、质量和安全测量,公共健康,费用,提供认证或委任,行销和其他的商业应用,还包括一些严格的商业活动。健康数据二次应用可以提高医疗经验,扩展对疾病和相应治疗的了解,增强对卫生保健系统的效力和效率的理解,支持公共卫生和安全并迎合商业客户的需求,如监测人群的健康情况;确定高危人群的疾病及治疗效果;量化愈后生存概率;评估有用的疾病预防策略;判断是否有足够的公共卫生、行政监管等。

狭义的医疗数据二次应用是医疗机构组织范围内数据的处理过程,将分散的或跨平台的数据经过重新组合和加工,构成面向决策的数据存储库,并在此基础上进行数据的深层挖掘、多维分析、动态查询和动态报表等。医疗数据二次应用是基于决策的,为决策者方便地分析医疗机构的发展状况,进而为做出决策提供有效的途径。

4 医疗数据二次应用中使用的方法

医疗数据二次应用是从大量的医疗数据中发现有趣的模式,其中数据可以存放在数据库、数据仓库或其他信息库中。这是一个年轻的跨学科领域,源于数据库系统、数据仓库、统计学、机器学习、数据挖掘、信息检索、数据可视化等学科,还涉及到神经网络、模式识别、图像数据库、信号处理和生物信息学等领域。

4.1 统计学方法

包括概率分析、相关分析、回归分析、聚类分析和方差分析等。

概率分析说明某种现象发生的频率或强度。医学中常用的有:发病率、感染率、治愈率、死亡率、误诊率等。

回归分析用来由一个或多个独立预测的变量预测一个响应变量的值,其中变量都是数值,其形式有线性、多元、加权、多项式、非参数和鲁棒。

聚类分析又称集群分析,是研究“物以类聚”的一种数理统计方法,凡是具有多个决定质的量的界限的事务都可以进行聚类,也可以对一些指标归类找出具有代表性的指标来进行分类,如在解剖学上依据骨骼的形状大小,采用聚类分析的方法可区别人和猿,还可区别性别和年龄等。

方差用于分析从一个数值响应变量和一个或多个分类变量描述的两个或多个总体的实验数据。

4.2 机器学习方法

4.2.1 决策树

决策树是一种逼近离散值函数的方法,对噪声数据有很好的健壮性,它是以实例为基础的归纳学习算法,在学习过程中不需要使用者了解很多的背景知识。构造决策树的目的是找出条件属性集和决策类别属性集的关系,用它来预测未知的类别记录。决策树是一种用树枝状展现数据受各变量影响情况的分析预测模型,根据其对目标变量产生效应的不同而制定分类规则,它是建立在信息论基础之上对数据进行分类的一种方法。决策树方法是功能相对比较全面的一种技术,是应用最广的归纳推理算法之一[3]。

ID3是1986年J.Ross Quinlan提出的决策树分类算法,采用基于信息熵定义的信息增益来选择内节点的测试属性。在1993年由其本人改进的C4.5/C5.0新算法,在对预测变量的缺失值处理、剪枝技术、派生规则等方面作了较大的改进。不同的决策树算法,如CHAID、CART等,会产生不同的决策树,其不同主要体现在3个方面:(1)树的每一层允许的拆分点的树目;(2)建树时拆分点的选择标准;(3)为防止过度拟合应如何限制树的生长。

利用决策树的回归树方法可以对患者住院时间长度、住院费用等进行预测。

4.2.2 粗糙集理论

粗糙集理论是由Z.Pawlak教授于1982年提出,利用粗糙集合中的属性约简和规则约简理论来对数据进行客观而有效地处理,从而更迅速地获得知识,是一种用于处理不确定性和含糊性知识的计算方法。其基本思想是:在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则,并从中发现隐含的知识,揭示潜在的规律,为处理不精确、不完全等数据的分类问题提供了更符合人类认知的数学工具;在处理大数据量、消除冗余信息等方面具有一定的优势;被广泛应用于知识发现过程中的数据预处理、属性约简等方面。

粗糙集理论在医疗数据应用中可用于肺癌的诊断、预测脊髓损伤患者的下床活动时间和检测宫颈癌病变的不同阶段等。

4.2.3 人工神经网络

人工神经网络方法源于神经生物学家以及心理学家对于研究及测试模拟神经计算的探索。人工神经网络是一种模仿生物神经网络的,以人工神经元为基本运算单元的一种互联的、分布式存贮信息的智能信息处理系统,是近年来颇受关注的一种算法,它为解决复杂的问题提供了一种相对有效且简单的方法。该方法模拟人脑神经元结构,是通过训练来学习的非线性预测模型,可以完成分类、聚类、关联规则挖掘等多种数据挖掘任务。它具有很强的自组织性、鲁棒性和容错性[4]。

Rumelhart和Mcclelland提出的误差逆传播算法和R.Setiono提出的带权衰减的误差逆传播算法都是用于训练神经网络的著名方法。

在医疗数据应用中,采用Bayesian神经网络结构能够找出服用抗精神病药物与心肌炎和心肌病发作的关系;运用组合神经网络可对危及生命的心律失常进行归类;还可以通过神经网络来动态检测患者的麻醉深度和控制麻醉药物的用量等。R.Setiono提出了用人工神经网络的方法从乳腺癌诊断数据中提取出简洁准确的分类规则,并总结了神经网络方法的3个基本步骤———神经网络的训练、神经网络的修剪、分类规则的提取[5]。

4.2.4 支持向量机

1995年由Vapnik等人提出的模式识别的方法———支持向量机是基于统计学习理论的、针对小样本学习问题的一个理论框架,它根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以期获得最好的泛化能力。支持向量机的最大优势在于:其计算复杂性与数据的维数不成正比,只和样本的数量有关;支持向量机对数据库中模式分类的准确率一般要高于神经网络[6]。

支持向量机可以用于分子生物学中基因的分类、蛋白质二级结构的识别和预测蛋白质亚细胞水平的分布等。

4.2.5 模糊系统

模糊逻辑及系统理论是1965年由美国科学家L.A.Zadeh提出的,建立在模糊数学基础上的一种推理方式,是用于解决复杂的非线性系统决策所使用的一种方法,它将人的定性思维和判断方法定量化,以适合计算机对信息处理的需要。对于不易建立精确数学模型的、具有多种不确定性和非线性的系统,应用模糊逻辑往往可以处理常规方法难以解决的问题。模糊逻辑经常与神经网络或最邻近技术联合起来应用。

利用模糊神经网络可以从心跳记录中鉴别心室的过早收缩,还可以用来分析肝脏的超声图像等[7]。

4.3 数据库方法

4.3.1 数据仓库

数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。

4.3.2 联机分析处理(OLAP)

联机分析处理(on-line analysis processing,OLAP)是一类软件技术,它可使数据分析人员通过对信息的多种可能的观察角度进行快速、一致和交互性的存取,以获得对信息的深入理解。OLAP有2个特点:(1)在线性,表现为对用户请求的快速响应和交互式操作;(2)多维分析,可提供数据多层面、多角度的逻辑视图。用户提出问题或假设,OLAP负责提取关于该问题的详细信息,并将结果呈现给用户。

在实际的数据二次应用中,针对具体的医疗数据和不同的应用目标,往往要将几种数据分析方法结合起来,以发挥各自的技术优势。

5 医疗数据二次应用中尚待解决的问题

5.1 电子健康记录的使用水平仍然较低

电子健康记录的使用仍属于较新领域,涉及到法律、制度、管理、信息技术等多方面,完善和成熟的电子健康记录仍需要进一步普及。

5.2 电子健康记录尚未包含许多临床资料

以“电子病历”为核心的临床信息系统目前正处于建设时期,尚有大量的临床信息资料由于种种原因未能在个人健康记录中保存或共享。

5.3 缺乏统一的标准和政策、法规

医疗数据的二次开发应用需要一个标准,以强大的基础设施建设以及制定相关的政策,标准和最佳做法。这种标准可以指导公共医疗质量和可持续性的医疗保健体系及健康的研究,为医疗卫生保健改革提供信息帮助和指导。

5.4 数据质量需要改善

数据质量是信息系统的生命线,要建立健全数据质量管理规范,建立行之有效的管理和监督机制,信息系统的应用管理和质量管理需要进一步加强。

参考文献

[1]Jiawei Han,Micheline Kamber.数据挖掘—概念与技术[M].范明,孟小峰,译.2版.北京:机械工业出版社,2007:2-4.

[2]徐蕾.决策树技术及其在医学中的应用[D].上海:第二军医大学,2004:20-32.

[3]Ian H Witten,Eibe Frank.数据挖掘—实用机器学习技术[M].董琳,邱泉,于晓峰,等译.2版.北京:机械工业出版,2007:127-180.

[4]高隽.人工神经网络原理及仿真实例[M].北京:机械工业出版社,2003:92-108.

[5]孙佰清,张长胜,王雪峰,等.人工神经网络在医疗智能诊断系统中的应用[J].哈尔滨商业大学学报,2002(4):394-395.

[6]朱凌云,吴宝明.医学数据挖掘的技术、方法及应用[J].生物医学工程学杂志,2003,20(3):559-562.

医疗数据篇9

网络条件下，病案质量管理要做好质量监控，它是一个过程模式，数据质量问题不应等到输出结果后解决，而是在产生过程、服务过程中解决。每个环节都应第一次就把事情做对，发现问题立即纠正。输入符合要求，过程得到控制，输出必定合格。因此，过程控制就是质量管理的主线，过程就等于流程。

综合分析我院在医疗数据质量上存在的问题主要是质量监控过程不合理，环节质量监控不到位，没有一个有效的流程来落实，存在滞后性。从这一认识出发，为确保网络数据质量，我们探索出一些网络数据质量环节监控的方法和措施。

1 规范质量监控管理，明确分工，提供有效方便的技术保障平台

目前我院质控的重点是对出院病历的终末质控，这种质量管理模式，有其必要性，但存在质量控制的滞后性和不可弥补性，因为出院病历的终末质控检查即便发现问题，也只能做一些适当的修正处理，对医疗质量没有起到实时监督作用，达不到质控的目的。针对这些问题，我们及时调整质控管理办法，加强了全过程管理，对质量管理控制进行了三个层次的责任划分，并选择使用了现有实用的《病案质量监控系统》和《数据质量核查系统》做为技术保障工具。

我们采取三级质控，层层抓落实，将问题消灭在各数据点发生的环节。科主任负责对本科所有在科病历质量进行实时监控；院质量管理办公室设置专人负责对全院在院病历进行实时质量监控；信息科对全院出院病历进行终末质量监控。

临床科室在主任办医生工作站模块上进行环节质量实时监控检查，并督促主管医生及时修改、完善;院质量管理办设置两台工作站终端，使用《病案质量监控系统软件》浏览全院在院病人，每天有目的按科室、床号、入院日期进行滚动检查，真正起到实时监控的作用;信息科做为数据管理部门，使用《综合统计信息服务系统》中的数据核查软件进行全面地数据核查，保证归档和上报数据的完整性、准确性。

2 监控信息反馈及时，保证效果

环节质量监控发现的问题，及时通知当事人主管医师，立即修正错误，做到把问题及时消除，确保病案质量。《病案质量监控系统》软件是一个很好的监控工具，通过它，质量管理人员可以实时查阅医生的病案记录、医嘱、护理记录、病人的检查、检验结果等信息，对病案记录的及时性、规范化进行检查；对发现的问题可以通过系统直接反馈给医生工作站，使医生能及时知晓并改进；病案质量检查结果可以进一步进行统计分析。通过本系统可以建立病案质量的反馈控制，将传统的终末管理发展到环节质量管理，为提高医疗质量提供了有效手段。要很好地利用它，就需要对"质控反馈信息字典"进行详细地规范，我们尽可能收集病历常见错误的类型及问题，制定了质量管理控制标准化检查内容，并把此标准制成表格文件印发到全院，以便在实际工作中认真对照执行。同时对质控人员必须检查的内容及科室医生修正的时限做了要求。质控人员在检查过程中及时将发现的问题反馈给科室主管医师本人，主管医师接到信息提示后，24小时内必须修改，如不按规定时限修正，医务处将在科室质量管理中扣分，进行处罚。

3 根据电子病历的使用特点，规范质量控制流程

我们发现打印出的纸质病历与电子病历内容不一致，分析原因就是质量控制流程不合理。病人办理出院时，科室打印病历交核算室办理结算，病历在医生工作站移出"提交"。如果终末质控发现问题，所做修改、补充也仅仅是对病案首页的完善，且都是在微机上进行的，此时，修改后的电子病历无法再重新打印，造成纸质病历与电子病历内容不一致的现象发生。对此，我们认真做了分析调查，及时地调整了工作流程和质控流程。

3.1 临床科室医师在病人出院医嘱下达第2d，将病案首页全部内容填写完毕（除疾病、手术编码外），完善所有的电子病历内容。填写出院通知单和出院结算单，交核算室办理病人出院结算。首页中病人的基本信息由住院登记处在病人办理入院登记时完成。

3.2 质控室在病人出院后第3d内完成对其病历的终末检查，并向科室反馈修改意见。临床科室根据修改意见，完善出院病历，做最后检查修改。

3.3 病案室在病人出院的第4d内完成对出院病历的诊断编码。

3.4 临床科在病人出院后的第5d内打印病历首页，并完成各级医师的手写签名。

3.5 完整地打印病历，在病人出院后的第6d内由科室交病案室，同时电子病历从科室医生工作站移出"提交"。

3.6 打印病历在交至病案室后，进行最后的质控检查，整理装订、归档入库。

3.7 死亡病人病历可推迟到第8天完成上述过程。

4 保证电子病历的安全性和一致性

病人出院后，电子病历不按时限提交归档，有的甚至长达二、三个月，医生可以随时对病历进行修改，严重地影响了电子病历的法律效力和安全性，是一个非常严重的问题。为了杜绝此类事情的发生，我们针对病历的管理要求，开发了"出院病历自动提交"软件，对未按时限要求提交的出院病历每天晚上8时，由系统自动启动软件，对在病人出院6天后未提交的病历进行提交处理，并记录下自动提交病人病历的科室、主治医师、ID号、病人姓名，出院日期, 提交日期等情况，月终由质量管理室提交医务处进行科室质控管理扣分，对当事人进行处罚。这样，有效地保证了电子病历的安全性和与纸质病历的一致性。病案归档入库后，如需再修改，必须经过严格的审批手续，对何人何时修改的病案内容记录在案，这种修改只针对纸质病历而言，电子病历一旦"提交"入库是不准修改的。所以，要求主管医师一定要在时限范围内完成电子病历，使归挡的电子病案为最终稿本。

我们通过改进质控流程，加强网上各环节监控管理力度，狠抓病案质量，不断完善病案管理，确保了电子病案的完整性、准确性。以上是我们调整质量控制流程的一点体会与思考，还有许多深入细致的工作有待与大家一起探讨与实践。

参考文献

[1]曹荣桂, 朱士俊.医院管理学质量管理分册.北京:人民卫生出版社, 2003.

医疗数据篇10

另一方面,传统的关系数据库在应付Web2.0网站时暴露了很多难以克服的问题[1],主要包括:不能满足对数据库高并发读写的需求;不能满足对海量数据的高效率存储和访问的需求;不能满足对数据库的基于大数据分析模型的存储访问需求。

鉴于上述问题,本文提出采用No SQL数据库对量大、频率高的生命体征医疗监护数据进行存储,满足后期数据回放以及基于海量医疗数据的医学学术分析应用。

1 医疗实时监护大数据的特征及应用模型

1.1 医疗实时监护大数据的特征

生命体征医疗实时监护数据具有如下特性:(1)临床事件记录。在对患者进行临床医疗干预时,实时记录对患者的干预事项、处方、剂量、执行者、时间、患者生命体征等信息;(2)非间断性;能够全天候、不间断地对患者的生命体征信息进行记录,准确地记录并存储患者的心电、呼吸、血氧、体温、血糖、心率、脉率、呼吸波、血氧波、处方、临床干预措施等信息;(3)按照时间排序,量大,结构简单;(4)基于网络化的生命体征医疗实时监护数据,数月后,数量呈指数增长。

主要的患者生命体征数据格式与内容见表1、表2。

趋势数据包括心率、脉率、血氧、血压、体温等,医疗监护波形数据包括心电、血氧波、呼吸波等波形数据,数据体积及频率计算如下:

m1=12导联心电数据为每人平均1.2K/S,m2=心率数据每人平均0.05K/S,m3=脉率数据每人平均0.05K/S,m4=血氧趋势数据每人平均0.05K/S,m5=体温数据每人平均0.05K/S,m6=呼吸波数据每人平均0.13k/S,m7=血氧波数据每人平均0.13k/S,K=每人1.66k/S。

所以进行监护的患者每人每秒的数据量为1.66k。

心电是每15s是12条,呼吸波和血氧波每15s均是1记录,每种趋势参数都是5s一条记录,如果100个人并发执行36小时后,每种趋势参数表内的数据记录均会达到129万条,心电、呼吸波、血氧波数据的记录总计会达到2400万条,数据表的存储容量达到41GB。

1.2 医疗实时监护大数据的应用模型

居民全生命周期的心电、呼吸、血氧、体温、血糖、心率、脉率、呼吸波、血氧波、处方、临床干预措施等信息,是居民电子健康档案的主要组成部分,具有很高的统计分析价值。主要的业务应用模型如图1所示,有地域病种分析、病种病理分析、人群群体健康分析、健康数据回溯、药品疗效分析和个性化诊疗等业务应用模型。

医生或医疗卫生科研学者基于不同地域、不同年龄、不同病种的患者健康档案,可以分析出病症的特征和分布情况,可以对患者进行疾病预警、预防、诊断、控制和健康促进,为诊治提供有效的数据参考依据。

2 No SQL数据库

2.1 No SQL数据库概述

在传统的关系型数据存储系统中,数据按照字段和行存储在表中,表之间的相互关系通过外键和主键建立关联,而管理表的外键和主键关系的正是SQL。而在No SQL的数据库中,不存在传统的外键关系。No SQL主要用于解决业务模型中遇到的大容量扩展等难题。No SQL的真正优势不是用来支撑实时的业务和决策,而在于它能够处理海量的数据。

No SQL的出现弥补了SQL数据库因为事务等机制带来的对海量数据、高并发请求处理的性能上的欠缺。No SQL不是为了替代SQL而出现,它是一种替补方案,也不是日常业务应用关系数据库解决方案的首选。绝大多数的No SQL产品都是基于大内存和高性能随机读写的,需要性能较好的数据库计算与存储设备。No SQL数据库它们普遍存在下面一些共同特征[1]:

(1)支持海量数据(huge amount of data):可以处理超大量的数据;

(2)模式自由(schema-free):不需要事先定义数据模式,预定义表结构;

(3)No SQL往往将数据划分后存储在多个本地服务器上;

(4)系统在运行的时候,系统可动态增加或者删除结点,数据可自动迁移,实现弹性可扩展;

(5)简单的应用程序接口(simple API);

(6)最终一致性(或者说支持BASE特性,不支持ACID)。

2.2 No SQL数据库分类

2.2.1 No SQL存储模型和特点分类

No SQL数据库自从问世以来,在数据量暴增的互联网应用系统上得到了广泛应用,得到了快速的发展,按照存储模型和特点,主要有如下的分类[2],见表3。

2.2.2 依据CAP原理分类

在计算机科学中,CAP定理[3],又被称作布鲁尔定理(Brewer's theorem),它是分布式系统设计的一个关键定律,即在设计分布式系统中,通常需要考虑如下三个应用的属性:

(1)一致性(Consistency):在对系统执行完一次写操作之后,未来的读操作一定可以读到这个新写入系统的值,即所有节点在同一时间具有相同的数据;

(2)可用性(Availability):系统总是可读可写的;

(3)分区容错性(Partition tolerance):系统被分成多个节点的分布式系统,任意一个节点无法通信或出故障后,系统仍然可以继续运行。因此对于分布式系统而言,必须支持分区容错[6]。

但是在实际的设计中,不可能这三方面同时满足得很好。CAP定理指出对于一个分布式计算系统来说,不可能同时很好地满足一致性、可用性以及分区宽容性这三个需求,最多只能同时较好的满足两个。

因此,No SQL一定程度上就是基于这个理论提出来的,因为传统的关系型数据库都是具有ACID属性,对一致性要求很高,因此降低了A和P,所以,为了提高系统性能和可扩展性,必须牺牲C,摒弃关系型数据库中ACID这一套原则[4]。根据CAP原理将No SQL数据库分成了满足CA原则、满足CP原则和满足AP原则三大类:

(1)CA-单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大;

(2)CP-满足一致性,分区容忍必的系统,通常性能不是特别高;

(3)AP-满足可用性,分区容忍性的系统,通常可能对一致性要求低一些。

满足CA原则的数据库有vertica;满足CP原则的主要是一些Key-Value数据库,比如Mongo DB、HBase、Redis、Hypertable、Memcache DB、Berkeley DB等;满足AP原则的,主要是一些面向文档的适用于分布式系统的数据库,有Simple DB、Couch DB、Cassandra等[4]。

3 No SQL数据库的选择

不同的应用场景必然会选择不同的No SQL数据库来进行存储操作,根据健康监护数据的应用需求,一般作业务逻辑简单的数据写操作,但是数据量可以达到上亿、上十亿级的数据。还有就是简单的、基于列的海量数据计算和查询显示操作,基本不需要二级索引。基于上述需求,健康监护数据存储需要满足CP原则的No SQL数据库。

HBase是一个运行在Hadoop上的No SQL数据库,是一个高可靠性的、高性能的、面向列存储的分布式存储系统。它能够对大型数据提供随机、实时的读写访问,目标是存储并处理大型的数据[5]。

目前,HBase数据库是安全特性最完善的No SQL数据库产品之一,支持面向列(族)的存储和权限控制,这一特性非常适合对患者的医疗健康数据进行基于权限控制的隐私保护,而其他的No SQL数据库多数没有提供内建的安全机制,这符合健康监护隐私保护的设计要求[6]。

另一方面,HBase已经成为Apache的顶级项目,开源社区发展很快,得到了Twitter,Facebook,Adobe,一淘,淘宝…等应用。

根据以上分析,医疗监护数据适合采用基于列存储的No SQL数据库HBase进行大数据存储。

4 医疗实时监护大数据存储设计

4.1 实现过程概述

根据HBase特性,在HBase中的表创建的可以看成是一张很大的表,这个表的属性可以根据需求去动态增加,在HBase中没有表与表之间关联查询。只需要指定数据存储到HBase的Column Family、Column就可以,Column也不需要指定它的具体类型:char,varchar,int,BLOB,text等。主要步骤如下:

(1)先按照业务需求,设计数据查询模型,在HBase建表;

(2)业务系统在通过UDP/IP或TCP/IP解析终端的数据流时,分为两路处理,一路处理是直接将获取的数据实时在人机交互界面上以图表、数字和波形的方式展示,另一路处理是调用HBase提供的put()方法将数据插入HBase对应的数据库表中;

(3)用户在前台页面查询数据时,调用get()方法或者scan()方法获取HBase中的一行或者一个Timestamp区间范围的数据。

4.2 表设计

根据相关研究成果,在HBase中建表应该满足以下原则:在HBase中建立的Row Key名称和列族名称尽可能要短,每一行数据中存储的数据尽可能要少,列族的数量最好只有一个,列的数量也应该有所限制,过多的列也会降低存储性能。另外,HBase的表空(null)列并不占用存储空间,表可以设计的非常稀疏。基于此,设计的医疗监护数据的如图2所示。

在HBase数据库下,患者健康监护HBase数据模型Health File如下表,Row Key为Table的主键,Table中的记录按照Row Key排序。说明如下:

(1)Row Key:Table的主键,以每个人的健康档案号为行的主键,健康档案号采用固定17位编码制,以国家统一的行政区划编码为基础,以乡镇(街道)为范围,村(居)委会为单位,编制居民健康档案唯一编码,这样将会方便基于区域的查询和统计。即:省、市、县(各2位共6位)+乡镇[社区](3位)+村[居]委会(3位)+居民个人序号(5位),每一个健康档案号就唯一标识一个人。这样,通过Row Key,就可以很快的进行某个人的健康监护信息进行一次性存储和查找,解决了原关系数据库中需要数十张关系表关联查询的数据,一次性就可以获取到所有数据。

(2)Timestamp:时间戳,每次数据插入对应的时间戳,可以看作是数据的version number;

(3)Column Family:列簇,HBase表在水平方向有一个或者多个Column Family组成,为了不影响性能,最好是1~3个列族。一个Column Family中可以由任意多个Column组成,即Column Family支持动态扩展。根据业务需求,把Health File表分为一个列族,如图2所示:

Health File表如图2所示设计,就可以把关系数据库中的数十个表化解为一张大表,在这张大表里没有外键等跨表数据引用,没有级联数据修改,处理这样的大表是HBase的优势,Health File表数据行数或列数再增加,也不会对性能影响很大。

列是可以动态增加的,可以为以后加入尿常规、血常规、X影像数字照片、CT影像数字照片、基因组图像等进行在不修改数据库结构的情况下进行扩展。

列簇,Table在水平方向有一个或者多个Column Family组成,一个Column Family中可以由任意多个Column组成,即Column Family支持动态扩展,无需预先定义Column的数量以及类型,所有Column均以二进制格式存储,需要时自行进行类型转换。

4.3 部署设计

HBase自动把表Health File按行划分成多个region,每个region会保存一个表里面某段连续的数据。每个表一开始只有一个region,随着数据不断插入表Health File,region不断增大,当增大到一个阀值的时候,region就会等分成两个新的region;当表Health File中的行不断增加而变大后,会逐渐分裂成多份splits,这样一张完整的表被保存在多个Region上,成为regions,一个region由[startkey,endkey)表示,不同的region会被Master分配给相应的Region server进行管理[7],如图3所示。

部署分布式HBase数据库平台,包括存储层hadoop中的hdfs,HBase数据库,分布式协调系统zookeeper。

集群中每台机器都需安装hdfs/HBase/zookeeper;对于hdfs/HBase来说,其中一台为master,其他机器都作为实际存储数据的datanode/Region server。

zookeeper的集群数推荐配置奇数,Leader选举算法采用了Paxos协议,该协议的核心思想是当多数Server写成功时,则任务数据写成功,如图4所示:

4.4 HBase表数据访问

使用Native Java API,是最常规和高效的HBase表访问方式。也可以通过使用Hive,可以使用类似SQL语言来访问HBase表。

针对健康监护数据的存储访问,需要注意以下几点:

(1)row key作为唯一标识,数据在插入过程中,按照row key排序后存储,若表名、row key、列簇名、列名相同,数据值会被覆盖;数据在查询过程中,get()方法按照row key查找数据;

(2)row key是一个长度不限的byte[]数组,可以并最好是按照业务的需求来设计,譬如userid+时间+参数id;可以通过row key直接定位到某一次要展示的波形信息;

(3)列簇里的列数不限,可以并最好根据业务数据需求来设计,这样,当通过row key定位到某一个用户具体要展示的波形信息时,该列簇的数据可以包括该波形实际展示的所有数据,譬如采样频率+最大值+最小值+原始数据的组合。

5 结束语

本文基于No SQL类型的数据库HBase,根据健康监护数据的特征,给出了健康大数据的一种存储与实现方法,能有效解决时间跨度大、信息格式多样复杂、海量等健康监护大数据的计算存储、访问效率低下和实时性问题,有利于进行单个患者健康大数据的个性化健康评估算法计算。

经过实际业务系统的搭建和数据迁移,系统的稳定运行和相关数据表明基于HBase搭建的集群平台性能与目前采用的关系数据库存储访问相比,其整体计算性能更强,扩展性与容错性均优于传统架构,更适合解决医疗健康监护的大数据分析问题。

参考文献

[1]孟小峰慈祥.大数据管理:概念、技术与挑战.计算机研究与发展[J],2013,50(1):146-169.

[2]覃雄派王会举.李芙蓉,等.数据管理技术的新格局.软件学报[J],2013,24(2):175-197.

[3]陈明.分布系统设计的CAP理论.计算机教育[J],2013(15):109-112.

[4]陈莉莹,双锴.No SQL数据库综述[EB/OL].北京:中国科技论文在线[2012-12-17].http://www.paper.edu.cn/releasepaper/content/201212-356.

[5]陈明.No SQL数据库系统.计算机教育[J],2013(11):107-111.

[6]吴秀娟.基于No SQL框架的数据查询技术的应用研究[D].南京:南京邮电大学,2014:40-49.

医疗数据篇11

在总人口为13亿多的中国人中，中国高血压人口有1.6～1.7亿人，高血脂的有将1亿多人，糖尿病患者达到9240万人，超重或者肥胖症7000万～2亿人，血脂异常的1.6亿人，脂肪肝患者约1.2亿人。有研究数据显示：平均每30秒就有一个人罹患癌症，平均每30秒就有一个人罹患糖尿病，平均每30秒，至少有一个人死于心脑血管疾病。

中国医疗大数据现状：压在百姓身上的3座健康大山

第一座健康大山

——跑步进入老龄化社会

之所以会出现上述触目惊心的数据结果，根据德勤最新发布的《2020年健康医疗预测报告》，中国的老龄化趋势严重。

到2012年止，世界经济合作与发展组织国家(Organization for Economic Co-operation and Development，OECD)人均寿命预期为80岁，相比1990年呈现大幅老龄化现象。

其中日本最为严重，平均寿命预期为84岁，英国为81岁，美国79岁，中国75岁，而印度为66岁。

预计到2018年，超过65岁人群数量会达到5.8亿，占全球人口10%，也就是说，其中每10个日本人中就有一位超过65岁的老年人。到2020年，我国正式进入老龄化严重阶段！

在发达国家，发达国家进入老龄化时，人均GDP在5000～8000美元，2014年健康医疗支出占总支出77%。

相比在中国，从2003年开始我国未富先老，人均GDP为1000美元。2014年的健康医疗支出占总支出23%，预计到2020年，健康医疗支出占总支出上升到32%。

全世界痴呆病人已达2400多万，平均每7秒增加一个，中国老年痴呆患者约占全世界病例总数的1/4，平均每年增加30万的新发老年痴呆病例。

骨质疏松症已跃居常见多发病的第七位，60岁以上的人群患病率为56%，女性发病率为60～70%。其中骨折率发生率接近1/3，每年医疗费用按最保守的估计需要人民币150亿。

第二座健康大山

——癌症年轻化

根据统计数据：2005～2015年间中国因疾病而导致生产力丧失将累计给中国造成5500亿美元的经济损失，其中中国一年用于心脑血管疾病的治疗经费达到3000亿人民币元人民币；中国的肝炎的直接经济损失达3600亿。2013年到2014年，35～46岁死于心脑血管病的人，中国是22%，美国是12%。

目前我国主流城市的白领亚健康比例高达76%，处于过劳状态的白领接近六成，真正意义上的健康人比例不足3%。白领女性更容易受到妇科、心脑血管疾病的威胁，男性则面临猝死、过劳、癌症等问题！

根据不完全统计，中国平均每个月都有报道较为年轻的企业高管、影视明星患有癌症或者离世，最高个人资产可达14个亿，包括百视通COO吴征、德尔惠股份创始人兼原董事长丁明亮、兴民钢圈董事长王嘉民、成都百事通总经理李学军等12位高管，均因疾病离世，比例高达63%，其病因主要是癌症和心脏病，其中，像吴征、李学军等近半数为突发疾病逝世。

2013年，慢性病患病率已达20%，死亡数已占总死亡数的83%。过去十年，平均每年新增慢性病例接近了2倍。心脏病和恶性肿瘤病例增加了近1倍！

美国《保健事物》杂志报告，中国人的腰围增长速度将成为世界之最。肥胖人口将达到3.25亿，未来20年将会增长一倍，腰围只要增长一英寸(2.54厘米)，血管就会增长4英里，患癌风险高8倍！

在中国人群中，糖尿病或许成为最为常见的慢性病，全球糖尿病患者将达到3.82亿，而每四个人中有一个是中国人。总患病人数将比德国和葡萄牙人群总数之和还要多。

从2014到18年，全球药品支出将以每年6.9%增长，从2014年的1.23万亿美元到18年的1.61万亿美元。其中肿瘤疾病花费最高。

医疗支出上，基因工程将占有最大比例，从26.1亿美元(2012年)上升到42.1亿美元(2017年)，涨幅36%。

第三座健康大山

——新生儿生命 "先天缺陷"

每年的9月12日是我国“预防出生缺陷日”，2009年监测显示，每隔30秒就有一个缺陷儿出生，相当于每小时30个，每天720个！

导致出生缺陷的因素非常多，最常见的就是遗传有关，此外还有环境因素和感染因素。一些问题我们可以通过预防来解决，比如积极治疗基础病、避开危险环境、避免滥用药物和防止病毒感染等。但是还有些问题我们是很难阻断和改变的，例如遗传因素，我们只能做到尽早发现异常、尽早采取措施，因此必须采取规范的产前检查。

遗传代谢病很多人觉得陌生它是导致儿童夭折或残疾的主要病因之一。我国婴儿患病病例较高，每年约2000万的出生人口中，有40万到50万名儿童患有遗传代谢病。可怕的是，患儿在新生儿时期常没有特别的临床表现，一旦出现异常，孩子已经造成智力和身体的终生残疾。一般地，每当一个普通家庭出现了患有“先天缺陷”的新生儿，这个家庭将永远被压在健康大山之下，难有出头之日。

除此之外，2013—2014年度，北京中小学肥胖检出率为19.5%，其中10%出现脂肪肝，而全国肥胖儿中脂肪肝发生率40～50%。Ⅱ型糖尿病发病率20年间增长了11～33倍。

教育部《2013年全国学生体质健康监测报告》显示近年来小学生近视率32.5%；初中生59.4%；高中生77.3%；大学生80%；沿海城市高中毕业生视力低下率85%，高度近视率呈急剧上升趋势。

面对严峻的健康挑战怎样推翻压在身体上的“三座大山”？

nlc202309012129

2014-2018的年平均医疗支出预计将从西欧国家的2.4%增长到北美的4.9%；从亚洲和澳大利亚的8.1%到中东和非洲的8.7%；全球医药支出总额预计将从2014年的1.23万亿美元以每年6.9%的速度增长到2018年的1.61万亿美元，而肿瘤将成这个领域的主要贡献者；仿制药将占取全球药品消费市场更大的份额，从2012年的27%(2610亿美元)增长到2017年的36%(4210亿美元)；内服药领域销售预计将从2013年的3638亿美元增长到2020年的5135亿美元，体外诊断将达最高；2013年，纵观七国(G7)市场，几乎每个工作日都有226个伴随诊断协议交易，而2009年每天仅有8个交易。

在中国，每年卫生资源消耗6100多亿元，因疾病、伤残造成的损失约7800多亿元。总计一万四千多亿元。这是个惊人的数字，因为“三峡工程”十五年的总投资才是2000亿。

面对越来越称重的“三座健康大山”，我们应该尽早改变意识，未雨绸缪，认识到“预防大于治疗”才是健康的真谛。

在此，德勤咨询也预测了2020年医疗服务可能发生的变革。

1.实现患者、医疗机构、企业之

间的互动

医疗机构与患者通过社交媒体接触，根据预算和医疗要求定期评估需求和向他们推荐合适的产品与服务；在线病人社区呈指数级增长，并且成为众包数据的丰富来源，也成为药物和医疗保健的评级系统；通过分析社区病人的聊天信息，提供一个更好的治疗方案，允许实时截取药品信息和服务。提供疾病早期警报，如流感；企业和政府部门与社区的病人、医院和纳税人一起找出最佳实践和具有高效益的治疗方法；新的供应商和行业模式，包括互助组织和其他形式的协作与合作方式，帮助降低成本，改善护理。

2.建立医疗新观念

消费者学会主动，对健康更加关注，更加坚定良好行为如锻炼，从降低支付到减少税收(例如，不吸烟)；

数据的隐私和安全仍然令人担忧，但有一个好处就是数据共享了；

纳税人和提供者能接受复杂的患者，找寻通向治疗新途径的分析方法和项目；

医生们从不愿意参与电子健康信息到积极参与并发展和改善技术；

在发达国家，大多数病人已经有了自己的电子健康记录，并分享在社交网站。

3.新的商业模式和概念

在未来，新的商业模式和概念会大面积在移动健康领域爆发，病了都有APP。举个例子：玛丽知道她有患乳腺癌的风险，在她母亲死于这种病后，基因测试显示她携带相同基因。然而，更令她担心的是最近飙升的体重意味着她的糖尿病越来越难控制，并附带增加乳腺癌的风险。这一切都始于她不得不放弃工作来照顾重病的母亲，于是“吃”成了她主要的安慰方式。她手机APP上的数据暗示她的健康恶化，包括记录健康的家庭秤。更重要的是，她的糖尿病护理专家已经在三个月里每两周来检查她的身体。

她也知道她没办法既控制体重又能降低血糖水平。如果她没有让她的BMI指数降到一个可接受的水平，她希望在线支持组织和APP“Be the Local Loser”能帮助她减肥和降低风险。

4.健康数据化，市场对相关器具

和计算模型需求增加

根据《2020年健康医疗预测报告》，初级保健医生如何充分利用新技术的在线互动课程推出，他们中许多人往往比医生更了解；且医学模型逐渐向“4P”医学（预测性、预防性、个体化、参与性）迈进。到时候会有针对“P4-Medicine”医药新规范出台，以及将会出现一些类似于PatientPeoplePower.com的新兴互动平台，在病人中宣传运动具有极高的影响力。

5.相关监管会更为完善

从2014年开始，病人越来越像消费者，然而就目前来说，虽然大多数行业已经接受了“客户第一”的意识，但医疗行业还远远落后。才意识到医疗服务提供者今天遇到的挑战是，他们仍停留在把顾客放在做事上，而要从根本上改变家长式的管理方法，重塑患者、供应商和纳税人之间的关系。因此，伴随着人民对健康要求的越来越高，相关监管会更为完善，特别是针对新的技术和研究成果。

就像2014年10月，沃尔玛开了一系列诊所，在那儿人们有没有买保险也有一个高效率的医疗治疗，而且在那有大量员工，不用担心拥堵，并推出了在诊所看病仅需40美元的诊治服务(是目前行业标准的一半左右)，且沃尔玛美国雇员和家属看病只需要4美元，怀孕检验只需3美元，胆固醇检验仅需8美元。

6.新进入者们正在改变医疗健康

例如，美国零售商店为响应消费者的需求开始提供初级医疗服务。提供廉价、快速、方便的医疗，一周七天，每晚都可(找一个初级保健医生成了一个挑战)，服务包括接种疫苗、筛查和慢性病的管理，大多数零售诊所同意承保和以现金支付。逐渐地，诊所有了合作关系，当地的医疗保健系统使他们能够共享数据和访问病人的电子健康记录。消费者不需要预约，直接输入在数字屏幕上输入信息，就能在几分钟内接受治疗。

来源：生物探索

医疗数据篇12

关键词：数据融合,医疗监护,融合模型

1 引言

数据融合技术最早起源于军事领域,它利用计算机技术将来自多个传感器的观测信息按一定规则加以分析综合,并自动化地完成各项决策评估任务。随着信息科技的不断进步,各种信息呈爆炸式增长。为了减轻人工处理工作量,释放冗余的存储空间,降低网络传输负担,提高信息处理系统的整体性能,满足海量信息的处理需求,数据融合技术被越来越多地应用在了民用领域,智能机器人技术、智能交通、工业过程监控等系统均以数据融合为其核心技术。在现代医学诊疗领域,融合多体征传感信息智能化诊断患者身体状况已成为一种不可或缺的技术手段。

目前的医疗监护系统,多是根据预设的阀值,对多项生理指标进行门限值告警,这种方法灵活性差,无法根据实际情况予以客观综合的评判,其较高的误判率也使患者和医护人员对系统的信任度大打折扣。数据融合技术为解决这一问题提供了出路,它综合信号处理、模式识别、人工智能多项信息技术,将采集到的生理信号经过去噪处理、参数提取,并利用多种生理信息综合判断患者病情。医疗数据融合系统正如一位陪伴在患者身边的电子医生,能够为患者提供及时的、全面的、个性化的诊疗服务。

2 医疗数据融合模型概述

数据融合是一个很大的概念,其使用方法和实现手段是多种多样的。学界普遍将数据融合系统按融合层次划分为数据层融合、特征层融合与决策层融合三类[1],三种融合模型各有其特点及应用价值。三个层次之间的关系如图1所示。

●数据层面向未经处理的海量多源信息,在这一层进行融合信息处理量大,融合后信息保真度高,可用于信息的去噪和对融合结果完整性要求较高的场合。

●特征层信息是从海量源信息中提取出的对后续处理有价值的特征信息,而将大量无用信息滤除,在特征层进行融合是目前应用最广泛的融合类型,它既能保证结果的准确性,同时减轻了系统的处理负担。

●决策层的处理对象是各决策子系统提交的局部决策信息,由分布式子系统进行局部初级融合,并将判决结果输入总系统决策层进行更大的综合处理。决策层融合处理数据高度精简概括,适用于子系统相对独立或较大型的融合架构中,但其信息保真度略低,融合结果依赖于各子系统的局部判决。

一般医疗数据融合系统中,由多种人体传感设备采集到的体征信号在数据层、特征层及决策层分别进行信号预处理、特征提取和模式识别的操作。

在实际应用中数据在哪一层实现融合,应取决于应用场景与功能需求,每一类融合模型均有其特殊的应用价值:在数据层融合能大幅提高信号去噪强度;在特征层融合可实现疾病的综合诊断;在决策层融合可对单体征诊断结果提供反馈机制,并为患者构建个性化的诊断方案。本文三、四、五节分别论述数据层、特征层及决策层医疗数据融合模型的实现方案、功能特性及典型应用案例。第六节对三种模型的使用性能进行总结,并探索其未来的发展趋势。

3 数据层医疗数据融合模型

数据层医疗数据融合模型多被用在传感信号复杂、极易受噪声干扰的情况下,对这类信号进行常规的预处理无法达到精度要求,因此需要引入冗余机制,通过信号间的协同机理评判信号质量的优劣,提高信号传输质量,增强系统预处理性能。

文献[2]提出一种利用心电信号实现血压参数准确检测,抑制血压值错误报警的方法,血压测量值易受人体内外环境的影响,容易造成误判,因此利用容易检测且相对稳定的心电监测信号评判血压信号质量,仅保留信号质量高的血压检测值作后续处理。文献[3]提出基于质量评估机制的自适应滤波法,在卡尔曼滤波算法的基础上,加入质量评估机制,不直接消除信号中混有的噪声,而是根据多导联检测信号形成质量系数,再根据质量系数调整滤波参数,从而实现噪声的自适应滤除。

数据层医疗数据融合模型大大提高预处理信号输出质量,使后续操作多依赖于高质量信号,少依赖或不依赖与低质量信号,减轻了网络传输负担,在长期监控应用环境下具有良好的实用性。但其对终端设备及传输节点计算性能要求高,信号需要在前期进行大量的处理,且需要样本数据的支持,比较适合在大型医院或监护中心使用,难以在日常家庭中普及。

4 特征层医疗数据融合模型

特征层数据融合模型是目前应用最为广泛的医疗数据融合模型,它通过多体征信息协同作用,检测出单体征信息无法检测的病症,扩展出单一体征信息无法完成的功能。

多体征医疗数据融合的方法多种多样,目前研究较多的有心电、血压、脉搏等心血管疾病融合判决方法,以及心率、血氧、呼吸等呼吸道疾病综合判决方法等。

心电、血压、脉搏等体征信号都是对人体心血管健康状况的反应,三者具有相似的数据形式和相关的特征信息,且都易于检测,将上述体征信息进行融合,可得到更加准确更加全面的心血管状态信息。文献[4]通过检测心电与脉搏波之间的特征参数变化,用线性分析法实时反应被监测者的情绪波动。文献[5]通过检测心电信号峰值与动脉搏信号波峰,计算两者时间差,即脉搏传导时间,作为一些疾病的重要诊断参数。文献[6]基于心电波形稳定可靠的特性,结合心电波形与脉搏传导时间无缝生成血压波形,新生成的血压波形具有更高的可信度,解决了传统血压检测中的诸多问题。

心电-呼吸融合判决法在对某些疾病的诊断中具有重要意义,如睡眠呼吸暂停综合症。该类疾病,其病症大多表现为呼吸阻塞或低通气等呼吸道问题,然而其病因往往与心血管疾病有关,长年累积的内在病症更会导致心血管疾病的恶化。因此,需要通过心电-呼吸协同判决机制来检测患者呼吸道及心血管状况,帮助患者及早发现内部病症对症治疗,也能通过心电血压数据监测患者的治疗情况。文献[7]运用最小二乘支持向量机检测识别被监护者心电特征,帮助呼吸疾病患者在外在病症显露之前,及早发现心电异常状况,及早获得有效治疗。文献[8]将血氧饱和度作为重要诊断依据,结合传统心电信号分析,检测患者异常呼吸的频率及危险程度。文献[9]在前人研究的基础上,提出将光体积描记术(PPG)等先进技术用于异常呼吸状态检测的方法,发现了多种生命体征与呼吸率之间的联系方式,为呼吸疾病的诊断方法开拓思路。

5 决策层医疗数据融合模型

决策层医疗数据融合模型将融合作用于单体征模式识别之后,运用协同技术对其诊断结果进行反馈,判断诊断结果的准确性,同时还能利用患者电子病历等制定出个性化的诊疗方案。由于医疗数据库与知识库的缺乏,这类模型在实际应用尚不多见,但随着医用数据库的逐步建立,数据融合在医疗决策层的应用前景广阔。

目前国外已形成一些综合性的医疗决策融合系统。文献[10]利用一定数量的样本数据建立起综合诊断系统,检测内容包括体温、心率、血压、血氧等一些常规生理参数,温湿度等环境信息,以及一些运动模糊信息。系统能实现基本的分类诊断,但由于样本相对缺乏,所用的算法也相对简单,错检率较高。文献[11]在社区网关中构建伤检分类引擎,由多项生理检测信息,将患者身体状况分为高危险级、低危险级和正常级三个级别,并能检测出被监护人的活动范围和运动状态,具有很高的创新性和实用价值。

6 结论与展望

随着人民群众对日常保健要求的不断提高,医疗监护设施势必走出医院向广大社区家庭普及。医疗数据融合将以轻量级、智能化、个性化为主要发展趋势,广泛应用于家庭医疗、智慧养老等新一代信息化服务系统中。

纵观上述三类医疗数据融合模型:数据层融合模型能在提高系统处理精度的同时适当减轻传输负担,满足轻量级网络传输的需求,但其对检测终端的计算能力和存储能力有一定的要求,对终端的数量要求也大大增加了使用成本,难以在日常家庭中普及;特征层融合模型目前已广泛应用于专业医疗领域,融合方法以专业知识为依托,将来等医用数据库、知识库发展成熟,融合诊断方法也能够依靠人工智能技术,向日常家庭普及;决策层融合模型目前应用还不够成熟,它不依赖于专业医学体征参数的提取,但需要以大型医用数据库为支撑,随着数据库知识库的逐步建成,它的应用前景不可估量,结合用户的电子病历和历史数据,决策层融合模型能够为广大用户提供量身定制的诊疗建议,发展出更多人性化服务模式。

参考文献

[1]Arcelus,A.;Goubran,R.;Sveistrup,H.;,"Context-aware smart home monitoring through pressure measurement sequences,"Medical Measurements and Applications Proceedings,2010IEEE International Workshop on,vol.,no.,pp.32-37,April302010-May12010.

[2]Zong,W.;Moody,G.;Mark,R.;,”Reduction of false arterial blood pressure alarms using signal quality assessment and relationships between the electrocardiogram and arterial blood pressure,”Engineering,Medical and Biological Engineering and Computing,vol.42,no.5,pp.698706,Sep2004.

[3]李桥.危重病人生命体征信号质量评估与分析[D].山东大学,2008.

[4]Kato,T.;Kawanaka,H.;Bhuiyan,M.S.;Oguri,K.;,"Classification of positive and negative emotion evoked by traffic jam based on electrocardiogram(ECG)and Pulse wave,"Intelligent Transportation Systems(ITSC),201114th International IEEE Conference on,vol.,no.,pp.1217-1222,5-7Oct.2011.

[5]Veerabhadrappa,S.T.;Vyas,A.L.;Anand,S.;,"Estimation of pulse transit time using time delay estimation techniques,"Biomedical Engineering and Informatics(BMEI),20114th International Conference on,vol.2,no.,pp.739743,15-17Oct.2011.

[6]=Ahmad,S.;Chen,S.;,"Electrocardiogram-Assisted Blood Pressure Estimation,"Biomedical Engineering,IEEE Transactions on,vol.59,no.3,pp.608-618,March2012.

[7]Yldz,A.;Akn,M.;Poyraz,M.;,"Automated recognition of obstructive sleep apnea syndrome from ECG recordings,"Signal Processing and Communications Applications Conference(SIU),2010IEEE18th,vol.,no.,pp.97-100,22-24April2010.

[8]Ali,S.Q.-u.-A.;Jeoti,V.;,"ECG and blood oxygen level based Sleep Apnea study and detection,"Biomedical Engineering and Sciences(IECBES),2010IEEE EMBS Conference on,vol.,no.,pp.285-290,Nov.302010-Dec.2,2010.

[9]Madhav,K.V.;Ram,M.R.;Krishna,E.H.;,"Estimation of respiration rate from ECG,BP and PPG signals using empirical mode decomposition,"Instrumentation and Measurement Technology Conference(I2MTC),2011IEEE,vol.,no.,pp.1-4,10-12May2011.

[10]Bellos,C.C.;Papadopoulos,A.;,"Extraction and Analysis of features acquired by wearable sensors network,"Information Technology and Applications in Biomedicine(ITAB),201010th IEEE International Conference on,vol.,no.,pp.1-4,3-5Nov.2010.

【医疗数据】推荐阅读：

医疗数据交互06-07

医疗机构数据01-16

医疗数据分析05-15

医疗卫生数据05-31