传染病预警信息

2024-07-10

传染病预警信息(通用7篇)

传染病预警信息 篇1

传染病自动预警信息系统(以下简称预警系统),指中国疾病预防控制中心在“中国疾病预防控制信息系统”平台中新建的一套专用于传染病自动预警的信息系统。该系统以县(区)为单位,建立法定管理传染病报告病例历史数据库,采用移动百分位数法,根据时间进程动态计算病例数历史基线,每日将当前观察周期内病例数与历史基线进行比较,当观察周期内病例数达到预警阈值时,系统可自动发出预警信号[1]。南昌市西湖区作为2008年全国108个试点市县区之一于2008年4月21日-2009年4月20日期间参与重点传染病监测自动预警试点工作,现将南昌市西湖区重点传染病自动预警信息系统应用情况报告如下:

1 资料与方法

1.1 预警重点病种

麻疹、风疹、流行性腮腺炎、感染性腹泻、细菌性痢疾(痢疾)、丙型病毒性肝炎(丙肝)、甲型病毒性肝炎(甲肝)、流行性感冒(流感)、伤寒副伤寒、流行性出血热。

1.2 资料来源

资料来源于2008年4月21日-2009年4月20日南昌市西湖区重点传染病监测自动预警信息系统异常报告资料与月统计报表、中国疾病监测信息报告管理系统报告的相关重点传染病发病例数。

1.3 方法

采用控制图法为预警的基本方法,回溯年数为3年,周期为7d,前后各偏移2周。以其历史发病总数为计算基数,计算重点疾病的百分位数(P50~P90)为预警界值,以7d为一个预警单位,每日预警1次[2]。采用Excel软件对预警信息系统异常报告资料与月统计报表进行分析。

2 结果

2.12008-2009年重点疾病预警次数构成

2008年4月-2008年12月共预警351次,前三位是其他感染性腹泻(28.5%)、流行性腮腺炎(27.6%)、痢疾(15.7%),2009年1月-2009年4月共预警114次,前三位疾病是其他感染性腹泻(30.7%)、麻疹(22.8%)、痢疾(16.7%)。

2.2 2008年-2009年各重点病种预警次数重复率比较

2008年4月-2008年12月预警重复率为42.5%,2009年1月-2009年4月预警重复率为36.8%,二者预警重复率无明显差别。(表2)

2.3 异常信息报告中疾病预警的当前值和实际个符合率案数符合情况比较

2008年重点疾病中当前值和实际符合率达100%有甲肝、流行性出血热、伤寒和副伤寒,达90%以上有丙肝,2009年重点疾病中当前值和实际符合率达100%有甲肝、丙肝、伤寒副伤寒、流行性腮腺炎、流行性出血热、风疹,达90%以上有痢疾、麻疹、感染性腹泻,最低是痢疾。(表3)

3 讨论

2008年4月南昌市西湖区传染病预警系统开通以来,对本区重点疾病进行预警,2008年4月—2008年12月预警次数前三位是其他感染性腹泻、流行性腮腺炎、痢疾;2009年1月—2009年4月预警次数前三位是其他感染性腹泻、麻疹、痢疾;麻疹发病有显著的季节性变化,因此,2008年感染性腹泻预警次数比例最高,甲肝预警次数比例最低。由表2可见,2008年4月—2008年12月预警重复率与2009年1月—2009年4月有一定差别,重复率从42.5%下降至36.8%,主要是2009年1月预警系统进行了改进,对重复预警有了很好的筛查:在系统发出预警前检查系统中此项计算参数历史预警情况,如果昨日数值超过预警值,则直接发出预警;如果昨日预警已经超过预警值,且本次数值比昨日数值增大,也发出预警;其他情况则不发出预警。在实际工作意义中,减少了重复核实,重复填表,提高了工作效率。

当系统自动按统计时间节点计算出疾病预警的当前值(固定不变),疾控中心经过传染病疫情审核后,更正了传染病现住址或出现重复疫情删除后,会出现实际统计病例个案数(有变化)与系统的当前值不完全一致现象。2008年4月—2008年12月二者符合率为81.40%,2009年1月—2009年4月二者符合率为96.50%。建议处理异常信息报告时,有刷新钮让系统重新计算疾病预警的当前值,这样实际值和当前值应该是一致的。以上信息充分表明预警系统可靠,显示出高度敏感性[3]。

传染病预警是一项长期性的工作,结合地区实际情况与充分利用国家疾病监测信息报告管理系统的传染病疫情数据,做到早发现传染病暴发苗子,及时进行调查核实处理,使传染病暴发得到较早控制,人员、经济的损失降到最小。

参考文献

[1]董立民,张珍珠.虞城县重点传染病监测自动预警信息系统应用[J].河南预防医学,2008,19(2):159-160.

[2]马家奇,王丽萍,戚晓鹏,等.基于网络直报的传染病监测自动预警信息系统概念模型[J].疾病监测,2006,12(30):679-681.

[3]刘永孝,邓舒.传染病自动预警信息分析[J].安徽预防医学,2007,13(6):425-426,433.

传染病预警信息 篇2

1 资料与方法

1.1 资料

从中国疾病预防控制信息系统传染病自动预警信息子系统中导出高州市2008—2013年所有的传染病预警信息。

1.2 方法

用excel软件对导出数据进行统计, 用描述流行病学方法进行分析。

2 结果

2.1 概况

2008年4月—2013年12月, 高州市累计共收到从中国疾病预防控制信息系统子系统传染病自动预警信息系统发出的预警信号397条, 涉及病种17种, 其中初步判断疑似事件数为18起, 疑似事件率为4.53%;经调查确定为暴发/流行9起, 阳性预测值为2.27%。

2.1.1 预警信息种类

397条预警信号中单病种预警166条, 占41.81%。涉及病种有麻疹138条, 手足口病22条, 恶性疟2条, 其余为传染性非典型肺炎、肺炭疽、间日疟和丝虫病各1条。时间预列预警231条, 占58.19%;涉及病种为手足口病96条, 流行性腮腺炎42条, 甲型肝炎22条, 其他感染性腹泻19条, 戊型肝炎14条, 流行性感冒12条, 丙型肝炎8条, 麻疹6条, 风疹和急性出血结膜炎各5条, 乙型脑炎和痢疾各1条。单病种预警疑似事件为0起;时间预列预警确认暴发/流行9起, 阳性预测值为3.90%。

2.1.2 预警信息时间分布

从2008年4月起, 高州市收到的预警信号逐年增多, 2008年最少为13条, 占3.27%;2009年为21条, 占5.29%;2010年32条, 占8.06%;2011年25条, 占6.30%;2012年145条, 占36.52%;2013年最多, 为161条, 占40.55%。在月份分布上, 以6和7月最多。

2.1.3 预警信息响应情况

根据是否填写信号核实卡判断对信息是否回应, 收到的397条信息均填写了信号核实卡, 响应率为100%, 响应时间中位数为1.86 h (P25~P75:0.51~9.44) 。其中及时响应 (信号卡在收到预警信号2 h内填报为及时) 203条, 占51.13%;当日响应 (在24 h内填报核实卡) 135条, 占34.01%;不及时响应 (超过24 h为不及时) 59条, 占14.86%。准确响应 (信号核实卡中填报时间在预警信号发出时间之后者为准确响应) 395条, 占99.50%, 只有2条未能准确响应。

397条预警信息的响应中位数为1.86 h, 其中响应最快的为2011年, 中位数为1.1 h;最慢的为2008年, 中位数为13.5 h。各年预警信息响应率及响应中位数见表1。

按病种区分响应时间, 响应最快的为间日疟, 响应时间为0.17 h;其次为手足口病, 响应中位数为1.6 h;再次为其他感染性腹泻, 响应中位数为1.7 h。

2.2 疑似事件及处理

18起疑似事件经现场调查后确定为暴发或流行9起, 继续关注8起, 排除1起。涉及病种有5种, 其中疑似信息最多的病种为流行性感冒, 有11起, 占61.11%;其余依次是风疹3起, 占16.67%;其他感染性腹泻2起, 占11.11%;流行性腮腺炎及流行性出血性结膜炎各1起, 各占5.56%。疑似信号按病种分布, 见表2。

18起疑似事件开始现场调查时间均在预警信号发出之前, 开始现场调查时间至预警信号发出时间均为负数, 从-24 h至-320 h不等, 中位数为-82 h。

3 讨论

传染病预警是预测方法在实践中的重要应用, 是疾病监测的一项重要功能, 也是疾病监测体系建设的目标之一。早期发现传染病暴发先兆而预警, 可以为及时实施防控措施赢得宝贵时间, 保护更多的潜在人群免受疾病的侵袭[3]。因此, 许多国家开展了传染病预警技术研究, 并逐步建立了各自的传染病监测与预警系统[4]。2003年SARS疫情之后, 传染病预警预测成为我国疾病预防控制研究的重点和热点, 探索行之有效的传染病预警模式是卫生工作者需要解决疾病预防控制的关键环节之一, 2008年, 中国疾病预防控制中心也成功研发了国家传染病自动预警系统[5]。6年来, 高州市共收到从此系统发出的自动预警信息397条, 对收到的每一个预警信息均进行了响应, 响应率为100%, 由此可见, 本市传染病自动预警系统运行情况良好。

从各年收到的信息分析, 我市收到的预警信息有逐年上升的趋势, 这与本辖区内传染病发病率逐年上升的情况相一致。从接收信号的月份分布也反映预警信息的多少与当地传染病发病季节性分布相一致[6]。这进一步说明传染病自动预警信号的发出是以传染病监测信息报告管理系统为基础的。

从涉及的病种看, 我市收到预警信息涉及病种17种, 而疑似事件涉及病种只有5种, 且发出信息最多的为麻疹和手足口病等常见病, 两者收到的信息量占了总信息量的66%, 却没有一起为可疑。但在罕见病的预警上, 尽管不能预示暴发, 却在一定程度上起到了纠错作用, 如2011年本市收到一传染性非典型肺炎病例预警, 由于同一预警信息会同时向省、市、县疫情负责人发送, 因而此短信发出后, 省、市疫情负责人均非常重视, 层层电话核实, 我疾病预防控制中心也立即进行调查核实, 发现为医疗机构新进报卡人员手误所致, 进而及时对卡片信息进行了订正, 由此可见, 传染病自动预警系统对单病例预警特异度较高。

在18起疑似事件中, 经调查确定为暴发/流行的为9起, 总的阳性预测值较低, 只有2.27%, 这与文献[7-8]的研究一致。而从18起疑似事件开始现场调查时间分析发现, 每起暴发事件开始现场调查时间均在预警信息发出时间之前, 这说明这9起暴发事件的发现最早并非由预警信息获得。由此说明, 在实际工作中, 对传染病暴发早期发现的手段多样, 包括医疗卫生人员报告、教师或校医报告、疾病预防控制人员疫情监测、家庭和媒体举报等[9]。而基于法定报告传染病监测数据的预警系统仅是疾病暴发早期探测手段的一个组成部分, 因而不应期望该系统完全取代其他的暴发发现方式[10]。

综上所述, 传染病自动预警系统初步实现了传染病暴发流行的早期探测和预警, 能早期发现异常疫情, 以便及时采取措施, 控制疫情在源头。但实际工作中, 对于常见的疾病如麻疹、手足口病等列入单病种预警, 将会导致假阳性信号过多, 增加基层人员工作量, 导致资源浪费等;对于流行性感冒等易在学校、托幼机构等集体单位发生聚集性疫情的疾病, 病例可能不在同一个地区居住, 在这种情况下, 传染病自动预警信息系统发挥其预警作用就受到一定限制, 同时具有特异度不高、假阳性预警信号较多、有时未起到预警作用等缺点[11]。因此, 在单病种的选择方面, 应考虑各地方实际, 只对罕见病和新发传染病发出预警, 可进一步减少假阳性信号。在时间序列的预警上, 考虑的空间范围可进一步缩小, 如具体到村或各集体单位, 而非现时最小只以县 (区) 为单位, 从而提高阳性预测值。

另外, 由于我国传染病预警系统数据来源较单一 (只来源于国家传染病监测信息报告管理系统) , 而此系统的数据收集、整理以及上报需要一定时间, 同时在不同的环节当中参与的人员不同, 会使信息的滞后性严重, 从而使得预警信息的及时性受到制约。因此, 我国传染病预警系统今后的发展方向应借鉴国际上已经成熟的经验和标准, 将OTC销售记录、救护车派遣记录等纳入国家传染病自动预警系统, 建立覆盖全国各级医疗机构、卫生机构、社区卫生服务站、药店、个体诊所等信息源的网络, 延伸我国传染病预警系统的触角, 拓宽信息来源, 从而提高系统预警的及时性和灵敏性[12]。

参考文献

[1]金连梅, 杨维中.我国传染病预警工作研究现况分析[J].中国公共卫生, 2008, 24 (7) :845-846.

[2]黄春萍, 宋妹娟, 刘牧文, 等.浙江省杭州市手足口病疫情自动预警效果评价[J].疾病监测, 2011, 26 (10) :809-810.

[3]王全意.疾病监测信息报告管理系统数据分析手册[M].北京:中国协和医科大学出版社, 2010.

[4]Desenclos JC.RAISIN-a national programme for early warning, investigation and surveillance of healthcare-associated infectionin France.Euro Surveill, 2009, 14:1-8.

[5]中国疾病预防控制中心.全国传染病自动预警 (时间模型) 试运行工作方案[Z].北京:中国疾病预防控制中心, 2008.

[6]吴小玲, 胡乐.2004—2011年高州市法定传染病流行特征分析[J].预防医学论坛, 2013, 19 (5) :370-372.

[7]李宏, 欧剑鸣, 黄文龙, 等.福建省2008—2009年传染病自动预警信息系统运行情况分析[J].中华疾病控制杂志, 2011, 15 (11) :993-996.

[8]罗宏伟.周口市传染病自动预警 (时间模型) 信息系统运行分析与探讨[J].职业与健康, 2013, 29 (23) :3210-3211.

[9]冯子健, 李克莉, 金连梅, 等.中国突发公共卫生事件发现人及报告人职业特征的研究[J].中华流行病学杂志, 2008, 29 (1) :l-4.

[10]杨维中, 兰亚佳, 马家奇, 等.国家传染病自动预警系统的设计与应用[J].中华流行病学杂志, 2010, 31 (11) :1240-1244.

[11]孙文军, 陆武, 周俊燕.无锡市某区传染病自动预警信息分析[J].中外医学研究, 2014, 12 (5) :81-82.

传染病预警信息 篇3

关键词:传染病,自动预警,时间模型,信息系统

“传染病自动预警 (时间模型) 信息系统” (以下简称预警系统) 是“中国疾病预防控制信息系统”平台中新建的一套专用于传染病自动预警的信息系统。该系统以县 (区) 为单位, 利用传染病疫情监测报告数据建立数据库, 采用时间预警模型每日自动运算, 将探测到的病例异常增加或聚集的信号, 以手机短信的方式自动发送给各级疾控机构疫情值班人员, 提醒其及时关注和处理。目前系统共设置了29种预警传染病, 并对鼠疫、霍乱、SARS、脊髓灰质炎、人感染高致病性禽流感、肺炭疽及不明原因肺炎等重点传染病, 采用单病例实时预警[1]。该系统于2008年4月21日在全国正式启动试运行工作, 至2012年12月31日, 该系统惯性运行。为进一步优化该系统的预警效果提供依据, 笔者现对周口市传染病自动预警信息系统应用5年效果进行分析, 对系统的运行功效与改进完善进行探讨。

1 资料与方法

1.1 资料

《中国疾病预防控制信息系统》的子系统《传染病自动预警 (时间模型) 信息系统》、《疾病监测信息报告管理系统》和《突发公共卫生事件管理信息系统》中2008年4月21日—2012年12月31日周口市的传染病预警信号、预警信息处理以及预警相关的传染病和突发公共卫生事件资料与数据库。

1.2统计方法

采用描述流行病学方法对相关资料进行分析。采用SPSS 13.0和Excel 2007软件对数据进行分析处理, 率的比较采用χ2检验, 相关分析采用Pearson。

2 结果

2.1 预警系统运行情况

2008年4月21日—2012年12月31日, 全市共收到预警信号7 464条, 初步判断结果排除7 462条, 疑似事件数2起, 预警信号中疑似事件比例为0.03%;经现场调查核实为暴发/流行2起, 预警信号阳性率为0.03%。见表1。

2.2 预警病种分布

预警病种共24种, 各病种的预警信号数与该病的网络直报发病数呈正相关 (r=0.75, P<0.01) ;初步判断结果:疑似事件数2起 (麻疹1起、流行性腮腺炎1起) , 预警信号中疑似事件比例0.03% (麻疹0.15%、流行性腮腺炎0.09%) ;现场调查366次, 结果:暴发/流行2起 (麻疹1起、流行性腮腺炎1起) , 预警信号阳性率0.03% (麻疹0.15%、流行性腮腺炎0.09%) 。其他病种均为0.00%。见表2。

2.3 预警信号地区分布

各县 (市、区) 预警信号从多到少依次为西华县1 174条, 沈丘县1 061条, 淮阳县947条, 鹿邑县858条, 商水县698条, 太康县697条, 郸城县671条, 项城市615条, 扶沟县477条, 川汇区266条。各县 (市、区) 间百万人口自动预警信号发生率差异有统计学意义 (χ2=297.78, P<0.01) 。对各县市区单病例模型和时间模型的预警信号数与同时期法定传染病发病总数进行Pearson相关分析, 存在相关性 (r=0.89, P<0.01) 。

2.4 预警信号响应及时性、核实方式与疑似事件处理及时性

所有的预警信号中, 2 h内得到响应者占71.44% (5 332/7 464) , 2~24 h内得到响应者占26.15% (1 952/7 464) , 24 h后才得到响应者占2.41% (180/7 464) ;所有响应的信号中, 主要采用了监测数据、电话、综合分析、现场调查等4种核实方式。其中以监测数据分析和电话核实居于核实方式的前2位, 分别占总信号数的88.75%和12.48%;所有疑似事件调查过程中响应—调查的中位时间为4 h, 调查—判断的中位时间为10.5 h。

3 讨论

从周口市近5年的传染病自动预警 (时间模型) 信息系统运行情况来看, 以传染病实时报告信息为依据和以历史疫情资料为基础建立的传染病自动预警系统, 对传染病相关的突发公共卫生事件均能及时预警, 提示其敏感性很高, 提高了传染病疫情监测的预警能力, 但存在几个问题, 一是与系统的部分病种预警阈值设置偏低有关, 预警信号较多但阳性结果极少。二是对于基层的小概率误报事件响应过于迅速, 导致个别敏感病种出现假阳性预警信号。三是地市级与省级预警仅接受部分单病例信号, 对于较大规模的时间序列信号无法响应。四是仅有时间上预警, 而缺乏与以乡或村为单位的空间上及人群的预警相结合。预警系统对数据的空间及人群属性特征设计不够, 无法同时实现时间、空间和人群三个维度的预警, 成功预警的准确性不高。这些问题的发现与其他文献报道的一致[2,3,4,5,6,7,8,9,10]。传染病历史的报告水平在一定程度上影响了预警的效果, 报告质量也是预警效果的重要影响因素。在12种单病例的预警中, 有脊髓灰质炎、人禽流感、丝虫病、不明原因肺炎、白喉、霍乱、钩体病等7种是因为网络直报单位的误报而引起, 提示应加强传染病报告质量的规范管理。现阶段, 预警系统无效预警过多, 增加了基层工作人员不必要的工作量。应根据不同地区和不同传染病的需要, 不断完善和优化参数设置及预警实现的模式, 以提高系统的特异度, 提升系统的运行效能。应研发由单维的“时间模型”向二维的“时空模型”及三维的“时空人群模型”的转变, 引入分级预警机制, 改善系统的性能, 以切实提高各级疾病预防控制机构早期发现和识别传染病暴发、流行的能力。

参考文献

[1]中国疾病预防控制中心.全国传染病自动预警 (时间模型) 试运行和传染病自动预警 (时空模型) 试点工作方案 (内部资料) [R].北京:中国疾病预防控制中心, 2008.

[2]陈敏.湘西自治州传染病自动预警系统运行情况分析[J].实用预防医学, 2011, 18 (11) :2096-2098.

[3]叶敏, 易波.2008—2010年浙江省宁波市传染病自动预警信息分析[J].疾病监测, 2011, 26 (7) :531-534.

[4]徐旭卿, 鲁琴宝, 王臻, 等.浙江省传染病自动预警系统暴发预警效果评价[J].中华流行病学杂志, 2011, 32 (5) :442-445.

[5]杨诚晨, 刘景壹, 汪澜, 等.上海市徐汇区传染病自动预警信息系统运行评价[J].中国初级卫生保健, 2012, 26 (8) :29-31.

[6]陈碧云, 高立冬, 李忠杰, 等.湖南省传染病自动预警系统预警效果分析[J].实用预防医学, 2012, 19 (12) :1767-1771.

[7]吴隽, 安庆玉.2008—2011年辽宁省大连市传染病自动预警信息分析[J].疾病监测, 2012, 27 (8) :660-663.

[8]宋静, 叶建华, 赵瑞芳.衢江区传染病自动预警系统运行状况[J].浙江预防医学, 2012, 24 (6) :90-91.

[9]金丹.2009—2011年徐州市传染病自动预警信息响应工作评价[J].中国校医, 2012, 26 (7) :538-539.

人工智能可实现传染病早期预警 篇4

据物理学家组织网报道, 大部分新兴传染病都是从动物传染给人类, 全世界每年有超过10亿人感染。保障公共健康需要有效的监测工具。卡里生态系统研究所疾病生态学家芭芭拉·汉说:“从历史上看, 人们对新兴传染病都是被动应付, 所有措施都集中在疾病出现后遏制其传播。我们是利用机器学习, 绘制出受各种疾病影响的啮齿类动物分布, 实现疾病的早期预警监测。”

研究人员利用机器学习来揭示一套庞大数据库的规律, 该数据库包括2000多种啮齿类动物, 并描述了它们的生活历史、生态环境、行为、生理特征和地理分布情况。他们开发出一种模型, 能预测可能存在的啮齿类物种, 并能识别出潜在啮齿类和非啮齿类动物的特征, 准确率达到90%。他们发现了超过150种新的潜在啮齿类动物和超过50种新的活跃型动物, 可能携带多种病原体并传染给人类。

汉解释说:“我们得出了一份高危啮齿类物种观察目录, 这些动物的本能特征让它们易于携带可传染给人类的疾病。由于环境变化速度加快, 这份目录极为重要。”

研究人员还指出, 啮齿类动物传播疾病的能力不同。风险最高的种类是那些成熟早、繁殖迅速的动物, 大多生活在生物多样性水平低的北温带地区。从生物学角度看, 那些在短时间内能繁育更多后代的物种, 在免疫方面的投入更少, 这让它们更容易成为疾病携带者。

传染病预警信息 篇5

1 材料与方法

1.1 设计思路

实时采集医院管理信息系统(HIS)和实验室信息管理系统(LIS)、医学图像存储与传输系统(RIS)、门诊医生工作站等医院系统中传染病相关数据,通过数据访问中间件,建立动态的传染病信息基础数据库,实现对病人从门诊、入院到出院全过程的在线监测。通过嵌入的依据传染病诊断标准制定的传染病筛查策略,对基础数据库中的信息进一步分析,实现疑似传染病病例智能识别,并进行传染病个案、医院传染病暴发预警,以方便传染病防控专职人员判别。通过建立交互平台,实现疑似传染病病例实时预警推送给临床医生,进行及时确诊和上报。若医生对疑似病例不予确诊,则进入与传染病防控专职人员的讨论对话模块,要求医生针对病人病情提出非传染病依据。通过系统提示功能和对话交流进行有效干预与反馈,实现传染病防控专职人员与临床医生共同参与传染病监测与防控工作。同时,在临床医生对传染病确诊的同时,系统自动生成传染病报告卡,点击实现院内网报。系统结构和流程见图1。

1.2 支持技术与开发语言

利用数据挖掘技术和J 2 E E、AJAX、FLEX技术等进行“医院传染病实时监控及预警系统”开发,该系统在Oracle10.0数据库和Tomcat6.0运行环境上,实时采集HIS和LIS、RIS等系统中医院传染病相关的信息。采用院局域网浏览器模式,设立专用服务器与HIS系统进行连接,不影响院内网运行速度;系统根据设置每日定时自动进行数据采集,一般1时和13时各一次,每次数据采集、分析在10分钟以内完成。

1.3 制订传染病病例个案、暴发预警策略

依据《传染病诊断标准》,收集重要及新发现的传染病诊断条件、危险因素及鉴别诊断的相关资料,运用循证医学理念、Meta分析等统计分析方法和数据挖掘技术,对资料进行科学地整理、统计、分析、优化和总结,构建下列传染病和症候群的病例个案筛查策略和暴发事件的预警条件:(1)50余种重要传染病(含39种法定传染病、12种常见传染病);(2)20余种新发传染病病例;(3)五大症候群(发热呼吸道、腹泻、发热伴出疹、发热伴出血和脑炎脑膜炎)病例;(4)肿瘤和脑卒中;(5)儿童残疾;(6)急性迟缓性麻痹(AFP);(7)食物中毒;(8)性病监测要求等,各种传染病的临床表现、检验结果、影像学结果、病程记录与护理记录中各种传染病病人特点等,根据各信息与各种传染病发生相关程度进行权重排序,整合分析后输出传染病疑似病例预警信息。各个筛查条件“或”“与”组合其它筛查条件,运行后筛查出疑似病例,进行特异性与灵敏度分析,不断调整筛查策略。最终制订出筛查针对每种传染病疑似病例、确诊病例的筛查策略和预警条件。

2 结果

2.1 传染病病例智能预警与判别

系统通过传染病筛查策略,每天自动按时间序列对患者门诊、入院以来传染病相关数据,包括:病原学检查;流行病学史;实验室(临检、生化、免疫、分子生物学等)检查、临床症状和体征;诊断和鉴别诊断依据;病理学检查、影像学检查及特殊表现;治疗药物及疗效;疾病预后及转归等,进行多参数综合分析、智能化判别,对达到预警标准的病例以红色标识提示,并按疑似程度以个案预警的方式排序展示。系统同时提供从门诊、入院至出院全过程的传染病相关要素时序图和检验阳性结果汇总,实现对病人从门诊、入院到出院的全过程追踪;通过爬虫技术产生病历概要,在原始病历和影像学结果等界面标识传染病关键词,方便对复杂病例的快速判别,提高传染病诊断的效率和准确性。发现重点或法定传染病致病菌进入重点关注预警栏,用于专职人员关注及临床干预处理。经专职人员判别后,个案预警病例成为疑似传染病病例,然后推送给临床医生判别和确诊。临床医生确诊的病例另存储于传染病病例数据库内,并进行统计分析,同时自动生成医院传染病各种统计报表及网络报告卡。

2.2 传染病暴发预警

系统根据传染病防控专职人员针对不同传染病指标设置的暴发预警阈值,每天进行综合分析,对超出阈值的病区自动报警,并以明确的颜色标记进行提示;同时提供病区所有传染病患者的感染信息时空分布图,即对感染时间、病区内床位分布、传播的相关性等情况按顺序排列,及时发现暴发苗头。

2.3 传染病疫情报告

依据《传染病防治法》、《突发公共卫生事件与传染病疫情监测信息报告管理办法》、《传染病监测信息网络直报工作与技术指南(2005年试行版)》、《医疗机构从业人员规范》等文件要求,按照国家疾病预防控制中心传染病信息编码,设计相应传染病报告卡,通过医院传染病监测预警系统的交互平台,当医生确诊病人患某种传染病后,系统利用HIS系统已有的数据自动生成传染病病例报告卡,只需临床经医生补充少量内容和审核后,点击上报即可完成医院内传染病病例的上报程序。报告卡上传到传染病管理专职人员工作站审核,然后,通过采用Web service技术构建的与中国传染病网络直报系统连接接口,导出报告卡,上报至国家传染病网络直报系统。

2.4 统计分析

本系统对确认后的病例另行存储和统计分析,同时自动生成医院传染病各种数据,并可分层次进行统计分析与结果展示,即每个病区、每个部门均能提供任何时点、任何时段的分析结果,并可提供传染病发病率月变化趋势。各类统计分析结果均以表格、图形等多种方式展示,并可随时导出E X C E L、W O R D等格式,方便专职人员使用。

2.5 传染病防控干预与干预效果评估

传染病防控专职人员根据临床各种传染病特点,参考国内外传染病防控经验,制订适合各传染病防控标准操作流程,建立传染病防控知识库;利用交互平台将重要及新发传染病诊断建议、防控要点及标准操作流程等内容及时推送给医生进行干预,并提供重要及新发传染病防控知识,进行在线培训与学习。同时,系统将每次对话和执行情况进行记录和统计分析,并将分析结果展示给专职人员,便于及时进行干预效果评估和根据评估结果进行绩效考核,从而强化医生参与传染病防控和落实防控措施,降低传染病传播风险。

3 讨论

医院传染病实时监控及预警系统将HIS、LIS、RIS和门诊医生工作站等多个资源点自动捕获相关信息,实现对门诊和住院传染病患者全过程监测。通过筛查策略的分析整合,实现了传染病疑似病例的自动筛查,具有实时性强、准确性高、工作效率高、监测功能强大,界面友好,主动性强等特点。通过对传染病患者之间的居住地位置关系和感染致病菌种类、临床证状等因素分析,提示传染病暴发相关事件,解决了目前我国传染病监测体系存在的医疗机构监测能力不足问题[7],填补了国内无传染病智能监测的空白。

医院传染病实时监控及预警系统交互平台的构建,为传染病防控专职人员与临床医生提供了及时便捷的沟通渠道,使传染病防控专职人员与临床医生对某个疑难传染病病例进行针对性讨论,从而提高传染病病例诊断的准确性和及时性。传染病病例一旦被确诊,系统自动弹出并生成传染病报告卡,临床医生只需要填报补充极少内容,即可完成医院内网络报告。通过设置传染病报告卡必填项提醒填写功能,避免了传染病报告卡必填项的缺项、漏项、空项、报告内容不准确、不完整等现象,也避免了报告卡传递过程中出现的问题和不便,上报国家疫情监测网也不需要再进行重复录卡。实现了医院内传染病报告卡的自动生成和网络报告,改变了以往只能通过手工方式进行传染病报告和专职人员收卡的模式,缩短了传染病病例从发现到诊断和报告的时间,提高了疫情报告的效率和质量,也为实施有效的预防干预措施赢得了宝贵的时间。交互平台的应用强化了临床医生的参与意识,提高了传染病防控工作效率。使原来主要靠临床医生报卡后才能发现传染病的被动监测,变为计算机智能识别预警的主动监测,创建了国内医疗机构传染病监控工作的新模式。同时,系统对每个操作过程均有记录,也便于传染病防控与疫情报告工作的质量控制,追踪迟漏报病例的责任归属,也便于检查工作的开展,增加了监督管理深度和可操作性,相关记录也可作为定期检查传染病防控工作的考评依据。

系统对在一定时段内,同一病区或同一医院相同传染病的患者数量设立预警机制,使传染病防控专职人员可以在临床医生报告前,及时发现潜在的传染病风险、流行趋势或暴发苗头,从而实现传染病的动态监测,强化了过程监控,使传染病防控的关口前移。系统的建立及采用标准化字典,将为实现医疗机构和疾病预防控制机构传染病疫情信息整合和数据共享提供良好的工具。未来可利用传染病暴发预警的思路,采取区域联网的方式,将一个区域数家医院的传染病发生情况进行综合分析,实现区域传染病的暴发预警。

医院传染病实时监控及预警系统尚处在研发的初级阶段,其开发的关键在于疑似传染病病例的筛查,如何确定诊断条件内在的逻辑性,提高传染病病例筛查结果的敏感度和特异度,使传染病智能判断更为科学、合理,是系统今后仍需研究解决的问题。同时,由于系统功能的完善依赖于医院其他信息系统的不断完善,包括临床数据的全面电子化和电子病历等数据的结构化。另外,系统导出报告卡直接上传至国家传染病网络直报系统功能尚未实现,需要有关部门提供建立接口的相关信息。

摘要:研发医院传染病实时监控与预警系统,实现医院传染病病例的自动筛查和分析,实现实时监测预警与及时控制。方法:依据各种传染病诊断标准中的诊断条件和危险因素,参考以往传染病监测报告经验,利用医院感染实时监测系统和现代信息技术,研制传染病实时监测系统,收集医院内各信息系统中传染病相关数据。结果:制订出医院传染病疑似病例、确诊病例的筛查策略和预警条件;开发出“医院传染病实时监控与预警系统”,实时采集医院内各信息系统中传染病相关数据,根据各信息与传染病发生相关程度进行权重排序等策略,自动整合分析后输出传染病疑似病例预警信息,反馈给临床医生进行确诊,并生成报告卡,并通过交互模块,实现传染病预防与控制措施的干预。结论:研发的“医院传染病实时监测预警系统”,实现对患者从入院到出院的全过程传染病信息追踪,实现传染病疑似病例的自动筛查。提高了传染病管理专职人员的工作效率,具有实时、高效、准确的特点。

关键词:传染病,实时监测,医院预警

参考文献

[1]施小明,马家奇,杨功焕.我国医疗机构传染病疫情报告管理工作中存在的问题及改进对策[J].疾病监测,2006,21(5):225-226.

[2]田铁南,贾春花,刘学芳.综合性医院传染病报告卡管理中的问题及对策[J].中国医学工程,2010,18(2):167-168.

[3]邢玉斌,索继江,杜明梅,等.医院感染实时监控系统的开发与应用[J].中华医院感染学杂志,2011,21(24):5241-5243.

[4]索继江,杜明梅,邢玉斌,等.基于医院感染实时监控系统的交互平台设计与实现[J].中华医院感染学杂志,2011,21(20):4293-4295.

[5]杜明梅,邢玉斌,索继江,等.医院感染实时监控系统中疑似感染病例智能判断的实现[J].中国感染控制杂志,2012,11(2):115-118

[6]杜明梅,刘运喜,索继江,等.医院感染暴发实时监测预警的实现及临床应用[J].中华医院感染学杂志,2012,22(14):3104-3106.

传染病预警信息 篇6

目前大数据分析技术[1,2]在经济和公共事务领域扮演至关重要的角色。为保证在研发、公共事务、内部运营、精准营销等领域保持可持续的竞争力,越来越多的科研与商业机构,开始抓取机构内外上万亿字节的数据[3,4,5]。毫无疑问,医疗行业也已经进入了大数据时代[6]。

近年来越来越多的国家和地区频繁受到传染性疾病的困扰,特别是广东地区成为了各种传染性疾病爆发的重灾区。SARS、人感染禽流感、埃博拉病毒、MERS等多种传染性疾病先后对广州市的民生造成了恐慌,近年来登陆广州地区的频率有了极大的缩小倾向[7,8]。因此,研究传染病传染机制、扩散原因以及预测爆发周期和爆发区域变得尤为重要。除却医疗环境等因素的影响,传染病还受到诸多社会因素的影响,例如: 社会行为学、气象学、地质学等。而这一部分社会因素的数据量化指标可以部分通过社交媒体获得。因此,大数据技术可以发挥其多元化、多领域、可扩展的特点,更好地应用在流行病领域。2014 年秋季广州大范围内爆发了登革热疫情,本次研究以登革热为例。此次疫情爆发具备三个特点: 1) 登革热不是首次发生在广州,但仅2014 年达到了数万人次的感染; 2) 广州周边城市,如佛山、顺德等地也有所感染,但是传播数量仅为几百例,未达到疫情大爆发的程度; 3) 自进入互联网+时代后,登革热是首个在广东地区爆发的传染性疾病。

因此,本文通过建立大数据分析模型分析导致登革热爆发的可能因素及潜在爆发区域。这里的大数据包括了传统统计分析中常用到的医疗系统内部的结构化数据,如发病患者基本信息、发病时间、就诊时间等信息; 也包括了来自于互联网领域的各种社会属性的数据,如气温、地势、小区房产价格、距离批发市场距离等。2014 年登革热在广州爆发,超过4 万人感染了登革热病毒。病毒的爆发从2014 年8 月份开始,在10 月份到达峰值。然而广州附近的几个城市登革热的确诊数仅有几百例,并且在很短的时间内得到了控制。因而本文试图回答以下两个问题: 是什么原因导致了广州2014 年登革热疫情爆发?未来哪些区域更易爆发登革热疫情?

2 文献回顾

以往的登革热研究中,绝大部分流行病学家依托于流行病等数据,加以统计分析对疾病爆发规律及爆发原因进行探索研究。例如,滑动自回归模型常常被用来预测登革热的发病情况,同时赤池原则和绝对平均错误率常被用于预测模型的评价。时间序列模型常被用于确定登革热爆发的成因。然而数学模型还有其他两个目的: 决定参数是否可以被实验室数据所刻画和预测疾病在未来特定条件下的爆发情况。本文主要通过时间序列和相关分析法研究疾病爆发的成因,运用分类方法预测未来特定条件下疾病的爆发数。

支持向量机[9]是一个被用于解释和预测模型的典型分类方法,同时在统计学习里被称为一种监督式的模式识别方法。其主要优势是建立在结构风险最小化的原则上而不是基于错误率的方法。支持向量机关注使泛化误差最小化而不是训练误差。给定一些气象学的数据,它能够判别输出样本数据是处于登革热爆发年或非爆发年。这种方法已经被用于预测登革热的爆发[10]。

本文研究的创新点在于结合了医疗、社会和气象学的数据。由于涉及许多的分类变量,一些经典的统计判别方法,如线性判别分析在这里就失效了。数据挖掘技术[11]常被用于从大量的数据集中挖掘未知的模式和信息,同时也提供了预测未来的方法,例如预测一名顾客是否会在某家超市里花上100 美金。当然,其他的数据挖掘技术,如决策树,最近邻分类器,贝叶斯分类器,神经网络和随机森林等模型也可用于疾病预测模型。对于贝叶斯分类器,它通常较强地依赖于稳健性测试。最近邻分类器是一种弱分类器,对于每一次分类都需要模型的重建。例如对于每个新加入的实例,都得计算其与分类器现有样本间的距离。通常这种计算是非常耗时的。

3 方法和数据

3. 1 方法

由于各地区的环境不一样,本研究认为登革热病毒的爆发是带有区域性质的。那么,在登革热病毒区域传播的过程中,不同区域所表现出的发病率趋势是否有所不同? 按照发病时间-新增发病数量绘制每个区域间的爆发曲线,登革热爆发的区域特征包括以下4 种:

在安全区域,由于输入案例的影响,发病率在初期呈现上升趋势,过段时间后发病率又平缓的下降接近于0; 在爆发区域,自发生首个病例后发病率快速上升且一直保持较高水平;在控制区域,发病率在初期呈上升趋势,经过控制发病率迅速下降; 在复发区,登革热的发病率在得到一段时间的控制之后,又呈上升趋势。根据每个区域时间与发病率的曲线图,不同区域可分为上述4 种类型。另外探寻登革热传播的潜在因素可通过搜索引擎针对这个区域该段时间内发生的相关事件做相应的搜索,这种寻找爆发因素的途径类似于文本挖掘里面的情感分析。针对每个关键词,可通过量化作为模型的一个变量。

3. 2 变量

3. 2. 1 因变量

理想状态为,绘制每个小区的时间-发病率曲线,根据该曲线图形判断该小区属于4 种爆发区域中的哪一类别,并以此作为分类变量。但是,由于本研究所得到的爆发区域颗粒度仅局限在行政区级别,无法下沉到患者的居住小区,因此样本颗粒度仅能以行政区作为单位。

3. 2. 2 自变量

3. 2. 2. 1 流行病学变量

卫生环境是登革热爆发的一个主要因素,建筑材料的浪费、垃圾的回收频率、建筑的使用年限等因素都是卫生环境的一部分[12]。为了消除地理位置对房价的影响,本文将该小区二手房价格除以周围小区二手房均价作为量化指标。该指标通过网络爬虫技术从互联网中获得,标的网址为安居客网站广州区域。由于蚊虫在较为干净和安静的水域中容易滋生,本研究将该行政区域内所含有的河流面积、汽车修理厂数量、批发市场数量作为量化指标。

人口密度是传染病爆发的一个主要因素。随着人口密度的增长,所在区域每个人患病的可能性也随之增加。人口密度= 在地区人口数/ 所在地区区域面积。本研究中该指标的量化是在中国经济普查网站中得到相应的数据。

城市化进程在一定程度上也刺激了所在地区的人口流动,也就增加了登革热扩散的可能性。本研究利用所在地域的国民生产总值来刻画城市化进程。这些数据可以在中国经济普查网站中得到。

医疗环境因为流行性疾病更易在贫困人口中传播,所以所在区域的医疗环境对于登革热的传播扮演着至关重要的角色。如果医疗资源足够覆盖该地区的所有患者,那么疾病将会被有效的控制。本文利用所在区域每千人口医生数来衡量当地的医疗环境。

3. 2. 2. 2 气候变量

温度由于蚊子在闷热的夏天繁殖速度较快,温度理所当然成为登革热传播的一个重要因素。登革热通常爆发于拥有长时间闷热环境的热带地区,例如泰国,印度,越南,南中国等。当然在一些拥有输入病例的城市里,情况也会有例外。为了量化温度这个因素,本研究选择所在区域每天的最高、最低和平均气温。

湿度一些证据表明湿度对于蚊子的繁殖有重要的影响。在本文中,所在区域的平均湿度、最大湿度和最低湿度被纳入回归模型中。

露点指的是空气中水气含量达到饱和的气温,低于此温度时水气从空气中析出凝成水珠。没有任何证据表明露点和登革热的爆发有直接的关系。我们在文中也将它纳入模型中。

风速是一个基本的大气比率。它是由于空气从高压往低压移动形成的。风速影响着天气预报,航空航天和海上作业,建筑项目的施工,动植物的生长等一些无法量化的活动。

3. 2. 2. 3 社会环境变量

地形登革热爆发区域通常保持着较高的降雨量。积水也给该区域的蚊虫繁殖提供绝佳的场所。积水量与地形相关且积水坑不好量化,因此我们将不同小区所在地形分为高地、中地和低地。相对于高地,低地的蚊虫繁殖较为快速。但是由于城市地势图为高密数据,因此,本研究无法获得具体的量化数据,会在后期讨论中给予解释。

3. 3 关键因素选择

建模的第一步就是决定哪些自变量对于登革热的爆发有决定性的影响,即确定导致登革热大规模爆发的原因。对此,本文将上述中所有的变量一起进行回归,欲通过逐步回归法[13]拟合出具有表达因素的影响因素。相应的回归模型可以表示为:

其中MRc,t表示每个区域的日患病率,Toc表示所在地区的地形信息,HEc,t表示所在区域的卫生医疗条件,POPd表示所在区域的人口密度,URd表示所在区域该时间段的GDP,HENd表示所在区域该时间段每千人口医生数,SPc,t表示所在区域人群的平均特征,Td,t HUd,t DPd,t,WSd,t表示所在区域该时间段的气温,湿度,露点和风速。

3. 4 预测

支持向量机作为分类器判别某区域是否为登革热的爆发区。根据4 种登革热区域: 安全区,控制区被标记为非爆发区,其它区域被标记为爆发区。将通过上述回归模型得到的因变量纳入支持向量机模型中。通过模型分析,可以得到哪些因素是构成登革热爆发的主因并为来年登革热的预测提供数据支持。

4 模型结果

为提高预测的准确性,本文采用5 折交叉验证法[14]。所谓的5 折交叉验证是将数据集随机分割成5 个子样本,一个单独的子样本被保留作为验证模型的数据,其他4 个样本用来训练。交叉验证重复5 次,每个子样本验证一次,平均5 次的结果,最终得到一个单一的估测。

为了得到登革热爆发的关键因素,我们利用广义线性混合模型得到通过P值检验的变量: 人口数,当年8-10 月份最低温度超过22 度的天数,当年6-8 月份平均气温超过27 度的天数,当年8-10 月份最大温度超过32 度的天数。当年9 月份最低湿度超过70%的天数,7 月份降雨量超过0. 1 毫米的天数所在地区每千人口床位数,人口密度,所在地区汽修厂数,城中村数量,隧道数量,绿化面积,房价。

利用AIC准则,可以得到模型的变量是: 人口数,当年8-10月份最低温度超过22 度的天数,当年6-8 月份平均气温超过27 度的天数,当年8-10 月份最大温度超过32 度的天数。当年9 月份最低湿度超过70% 的天数,7 月份降雨量超过0. 1 毫米的天数,所在地区每千人口床位数,人口密度,所在地区汽修厂数,城中村数量,隧道数量,绿化面积,GDP,GDP增长率,公园数量,房价。

通过回归P值和AIC准则初步选取的变量差别不大,我们选择通过AIC准则选取的变量。利用支持向量机模型,我们得到如图2 所示的结果。模型的训练误差是2. 75%,说明模型拟合数据的效果较好。模型的测试误差是22. 28%,说明利用该模型预测来年的登革热是否爆发有将近78%的准确度。

与此同时我们利用随机森林的变量重要性指标,为通过AIC准则选取的变量按照对模型预测准确度的影响大小排序。可以得到几个变量重要性较大的变量是: 房价、人口密度、人口数量,当年9 月份最低湿度超过70%的天数,当年6-8 月份平均气温超过27 度的天数,当年7 月份降雨量超过0. 1 毫米的天数。

5 讨论

通过模型的建立过程可以看到,气候因素变量起着重要的作用。但是如何量化气候因素对登革热传播的影响还是一个公开的难题。本文利用的一些指标是Descloux在参考文献中的方式。按照一般的观点,房价越高的地区卫生条件越好,登革热爆发的可能性也就越低。可利用决策树理论,可以得到房价越高的区域登革热爆发的可能性越高。其实这并不矛盾。在广州房价较高的区域人口密度也相对较高,流动性也较大,经济发展水平和城市化程度相对其它区域较高。这也说明了登革热的爆发不是单一因素决定的,是由于环境,气候,卫生条件等多方面因素综合决定的。同时更加说明建立一个有效的数据模型,对登革热的防控与预警具有重大的意义。本文主要是利用了回归模型来做变量的初步选择,用支持向量机来构建模型,用随机森林来选择对模型预测准确度影响最大的几个变量。无法说明支持向量机针对这个模型是最合适的,一切都是根据实际问题来决定选用的模型与方法。

摘要:目的:通过整合医疗卫生、气象地质、社会环境等相关因素的全数据,基于大数据分析技术,研究某种传染病(登革热)爆发的原因及潜在爆发区域,对该传染病的扩散实现有效的预判与防控。方法:通过数据清洗,模型建立、拟合和检验,以及预测结果的对比分析等过程,运用支持向量机、回归分析、随机森林等方法建立相关模型,提高预测准确性。结果:传染病的爆发不是单一因素决定的,是由相关性较大的几个变量综合决定的。结论:利用大数据分析技术,能够比较快速和有效地建立一个数据模型,对传染病的防控与预警具有重大的意义。

传染病预警信息 篇7

据物理学家组织网报道, 大部分新兴传染病都是从动物传染给人类, 全世界每年有超过10亿人感染。保障公共健康需要有效的监测工具。卡里生态系统研究所疾病生态学家芭芭拉·汉说:“从历史上看, 人们对新兴传染病都是被动应付, 所有措施都集中在疾病出现后遏制其传播。我们是利用机器学习, 绘制出受各种疾病影响的啮齿类动物分布, 实现疾病的早期预警监测。”

研究人员利用机器学习来揭示一套庞大数据库的规律, 该数据库包括2000多种啮齿类动物, 并描述了它们的生活历史、生态环境、行为、生理特征和地理分布情况。他们开发出一种模型, 能预测可能存在的啮齿类物种, 并能识别出潜在啮齿类和非啮齿类动物的特征, 准确率达到90%。他们发现了超过150种新的潜在啮齿类动物和超过50种新的活跃型动物, 可能携带多种病原体并传染给人类。

汉解释说:“我们得出了一份高危啮齿类物种观察目录, 这些动物的本能特征让它们易于携带可传染给人类的疾病。由于环境变化速度加快, 这份目录极为重要。”

上一篇:应急食品下一篇:粉煤灰应用技术