在线数据库系统

2024-05-21

在线数据库系统（精选12篇）

在线数据库系统篇1

随着网络化时代的到来, 人们的生活方式已经发生了极大改变, 对于网络的依赖程度日益加深。在网络环境中, 现代教育方式有了新的突破, 在线考试系统成为一种有效的教学手段, 能够提高教学管理的规范性、科学性, 减轻教师的工作负担, 提高教学水平。数据库作为在线考试系统功能实现的基础, 做好数据库的设计和应用十分必要。

1在线考试系统数据库设计的流程

在线考试系统主要包括3个部分, 分别是用户部分、考试部分和成绩部分, 通过3个部分的协调作用, 充分发挥在线考试系统的功能。而数据库的设计是保证在线考试系统各个部分、各个功能模块作用发挥的根本, 所以, 势必要设计合理的概念和有效的逻辑[1]。

1.1概念设计

在数据库的概念设计中, 主要是根据在线考试系统的实际情况, 对用户、考试部分内容设计相应的概念, 并得到相应的实体, 具体有:

(1) 教师档案实体, 主要属性有教师姓名、用户名、编号、密码、院系以及联系方式等。

(2) 考生档案实体, 主要属性有考生姓名、编号、密码、性别、年纪和班级、专业以及学号等。

(3) 试题库实体, 主要属性包括课程名称、考试内容、答案、题目类型和难易度以及备选答案A-F等。

(4) 试卷组成实体, 主要属性有课程名称、试卷代码和编号、考试日期以及试题类型、题目难易度和分数等, 具体如图1所示。

(5) 试卷实体, 主要属性有课程名称、试卷编号和状态、大小题号、数据库中序号以及学生考号、答案、得分等。

(6) 考生成绩实体, 主要属性包括试卷编号、学生准考证号、题目分数、合计分数以及所属课程等。

在上述基础上, 数据库、教师、学生和试卷实体的关系可以描述为: 教师根据考核的目标确定试卷组成题目类型和多少, 数据库根据要求生成相应的试卷, 用于学生的在线考试中, 并得到相应成绩, 确定学生学习情况。

1.2逻辑设计

数据库的包含的信息量十分庞大, 各种数据十分繁杂, 为提高数据库的使用效率, 需要采取高效的管理模式。在数据库的管理中, 采用的通常是关系模型, 这就需要设计合理的逻辑, 将概念设计的相应实体转化为关系模型。

在逻辑设计中, 应当遵循的原则有:(1) 设计应当规范化, 避免发生数据重复和冗杂, 提高数据使检索效率;(2) 在设计中, 在考虑结构合理的同时, 要尽量提高设计的可操作性, 确保逻辑的实用性;(3) 设计后的数据结构应当保持足够的稳定性, 可以实现在新、旧系统间的有效转化, 不会发生数据丢失、错码等问题。

在经过逻辑设计后, 可以得到数据库的逻辑结构, 根据概念设计的内容创建对应的数据表, 具体有:

(1) 用户专用表, 分别有教师信息表、管理人员信息表和考生信息表, 作用分别是保存教师、管理人员和考生的基本信息。在教师信息表中, 主要字段有教师编号、姓名、用户名和权限及密码等, 不同教师还应当对设置一个权限字段; 在考生信息表中, 主键为学号, 主要字段有学生姓名、学号和密码等。

(2) 套题和试题信息表, 其功能是保持套题和考试题目的有关信息。其中, 试题信息表的关键字段中有课程ID、套题ID, 通过查询ID, 即可得到某课程某套试题。

(3) 成绩信息表, 主要保存的是考生的成绩信息, 关键字段为所属课程和课程名称, 采取级联更新方式, 来查询某个年级、某个课程考生的成绩信息。

2在线考试系统数据库的连接

2.1选择合适的数据库系统

数据库系统是概念设计能够经逻辑设计后生成相应表格的保障, 是概念设计数据库语言表达的重要依据, 也是数据库连接实现的基础。目前, 数据库系统有很多类型, 包括My SQL、 SQL Server、 Oracle等, 选择一个合适的数据库系统,是在线考试系统数据库开发的首要环节[2]。

2.2选择合适的在线考试系统开发平台

在线考试系统的开发平台有多种, 比如PHP、 Net、 JSP等, 通过运用开发平台, 可以建立与数据库系统相适应的在线考试系统, 提高数据库的使用效果。以PHP为例, 属于HTML内嵌式语言, 具有C语言、 Java等语言的特点, 此种开发平台得到的数据库集成层能够符合绝大部分数据库系统的要求, 支持SQL标准, 提供标准数据库接口, 具有较强的兼容性, 能够提高数据库访问速度, 在校考试系统的操作更为方便, 性能稳定且运行效率较高。

2.3做好数据库的连接

在数据库访问过程中, 通常需要先建立系统与数据库间的连接, 会造成一定资源的损耗, 导致访问时间延长, 如果数据库访问量较大时, 数据库系统的性能会受到严重影响。针对此问题, 可以采用数据库连接池技术来解决, 此技术是通过在数据库当中预先建立部分常用连接, 放置于连接池中, 具有重复利用资源、提高系统响应速度和优化资源配置等优点。

在数据库连接池技术基础上, 在从在考试系统向数据库进行访问时, 同样的访问内容无需重新建立连接, 连接池中预建的空闲连接会直接分配出一个来, 完成该请求; 在程序执行完成后, 该连接又会回到连接池中, 而不会释放消失, 减少了访问连接建立过程, 提高访问速度。

此外, 在数据库连接池技术中, 为保证所有请求都能够得到及时响应, 会在预建连接低于下限时, 按照管理机制再次建立部分连接; 而超过上限时, 则会主动释放部分连接, 避免占用资源导致的浪费。

3在线考试系统数据库应用的安全

在应用在线考试系统的数据库过程中, 安全是一个十分重要的因素, 为此, 需要建立一套有效的安全系统, 主要包括3个层次内容, 具体为:

3.1网络系统

数据库系统与在线考试系统之间的连接是通过网络完成的, 网络的安全是数据库应用的主要外部环境, 也是数据库系统功能发挥的重要基础和途径。在数据库系统入侵过程中, 首先要突破的就是网络系统, 因此, 要加强对网络系统安全的建设。

为保证网络系统安全, 应当加强安全防范技术的应用, 主要包括防火墙建设、入侵检测系统以及协作式入侵检测技术等[3]。

3.2宿主操作系统

宿主操作系统是在线考试系统从数据库中提取相应资料、完成在线考试功能的重要依据, 是数据库系统的运行平台, 对数据库系统安全起着一定程度的影响。

当前宿主操作系统主要有两种, 即Windows和Unix, 安全级别可以分为C1和C2。从技术层面而来, 操作系统的安全主要包括3个方面, 分别为安全策略、安全管理策略和数据安全, 其中, 数据安全可以从以下几点来解决, 包括应用数据加密技术、对数据进行备份、提高数据存储的安全性、保证数据传输的安全等, 具体的技术包括Kerberos认证、 SSL、 TLS技术等。

3.3数据库系统

数据库系统的安全主要取决于数据库管理系统, 只有保证数据库管理系统安全机制的完善, 才能有效提高数据库系统的安全性。就当前数据库管理系统而言, 常用的是关系式数据库管理系统, 其安全性能存在一定不足, 降低了数据库系统的可靠性。对此, 可以通过加密数据库数据来保障数据库管理系统的安全, 主要包括3个方面, 分别是OS层、 DBMS内核层和DBMS外层。其中, OS层由于数据文件数据关系的识别难度较高, 密钥生成较为困难, 且不易管理和使用, 并不适用于大型数据库数据的加密。

DBMS内核层加密是指在物理存取完数据文件前, 对其进行加密, 具有加密效果强、不会干扰DMBS正常运行的优点, 加密功能可以与数据库管理系统实现无缝耦合; 但是, 此种技术存在服务器荷载加重、需要专门接口的弊端。

DBMS外层的加密是通过将书库加密系统当做DBMS的外层工具方式实现的, 可以根据相应要求实现数据库数据的加密操作, 其加密运算是由客户端完成的, 不会加重服务器荷载, 而且能够在网络传输中同步加密; 但也存在加密功能限制、无法有效耦合数据库管理系统的不足。

4结语

在现代教学当中, 在线考试系统是一种有效、普遍的教学手段, 对于教学工作效率、教学效果提升等有着重要作用。一个可靠、完善的在线考试系统离不开数据库的支持, 所以, 加强对在线考试系统数据库设计的研究, 根据在线考试系统的需求设计与之对应的数据库, 并做好数据库应用的连接、安全处理, 有着十分重要的现实意义。

参考文献

[1]刘洪江.在线考试系统的数据库设计与实现[J].电脑知识与技术,2012,03:508-511.

[2]张桂英.标准化在线考试系统的设计与数据库建设[J].内蒙古农业大学学报(自然科学版),2012,Z1:222-225.

[3]雷晓敏.网络在线考试系统的数据库设计[J].中小企业管理与科技(上旬刊),2011,11:297-298.

在线数据库系统篇2

数据的在线分析与知识发现是开发信息资源的高级形式.为了挖掘关于水的运动变化规律和对环境的作用的`知识,作者提出了水文数据的在线分析与知识发现系统模型.文章对模型采用的在线分析处理与数据挖掘相结合的分层次结构进行了详细阐述,并重点介绍了模型中的关键技术应用.

作者：艾萍王志坚索丽生倪伟新作者单位：艾萍,王志坚,索丽生(河海大学,)

倪伟新(水利部水文局,)

在线数据库系统篇3

关键词：污染源；监测系统；监测数据；数据传输

一、数据传输有效性不高的具体原因

经过一段时间的运营，污染源在线监测系统可以有效的提升管理污染源排放的能力，对污染源监控中心进行监控与监督提供必要的支撑，同时也可以为相关领导阶层进行环境管理决策提供帮助。但应用污染源在线监测系统，也表明我国一些企业额污染源排放情况还尚未符合国家的排放标准，同时监控数据传输的有效性与国家百分之七十五的考核标准不相符合。

1、传输效率不高的具体原因

所谓传输效率就是实收数据和应收数据两者的比值。所谓应收数据就是依照考核标准所要求的全部检测项目及监测点的数据和，应收数据的数量是比较固定的。所谓实收数据指的就是实际平台收到的数据和，其相关因素包括数据传输的稳定程度、数据监测标准、数据种类以及監测点的数量。

通常情况下，数据传输效率不高的原因包括如下几个方面：第一，没有严格按照国家标准监测相关指标。其考核监测的主要指标包括氨氮、氮氧化物、二氧化硫以及化学需氧量四大类。我国很多企业尚未严格按照国家标准监测监测如上指标。第二，没有严格按照国家标准监测主要监测点。我国一些企业污染源排放口的设施设备落后、存在诸多问题，必要要对其进行改进。部分企业没有按照国家标准对数据采集传输设备及在线监测设备进行安装管理。第三，没有严格按照国家在线监测标准开展污染源排放监测工作。通常情况下，国家考核污染数据传输效率的要求为对小时数据及日数据进行考核，国家考核废气的具体要求为对排放量、流量、折算浓度以及实测浓度进行考核。而我国一些企业在考核的时候会存在指标检测数据丢失的问题。第四，数据传输稳定性不高。通常情况下，是在现场部署安置各个数据传输设备，同时传输数据应用无线传输及有线传输。传输信号的稳定程度不高、传输设备无法进行断点续传，远程控制无法开展等就会导致监测数据丢失，传输效率不高。

2、有效率不高的具体原因

所谓有效率指的就是实收有效数据组合应收有效数据组之间的比值。所谓应收有效数据组指的就是全部监测项目及监测点的排放量、流量及实测浓度所构成的数据和。应收数据组的数量是相对固定的。而实收有效数据组指的就是实际情况下，中心平台受到的有效数据组的和。

导致有效率不高的具体原因有如下几个方面：第一，没有修正系统异常数据。如果没有及时修正由于进行比对监测或设备故障而导致的异常数据，这些异常数据将会变成无效数据，进而也就无法参加有效率的计算与分析。第二，实收数据不完善，存在缺失。如果数据传输中没有实际的折算浓度及流量数据，就会致使实收数据组数据不完善，实收数据组进而就会变成无效数据组，最终就无法参加有效率计算。第三，没有及时补遗缺失数据。如果设备发生故障或装置已经提产就会导致数据出现缺失，在这种情况下，若没有及时对缺失数据进行补遗，就会致使缺失数据转化为无效数据，最终无法参加有效率计算工作。通过对自动监控数据传输有效率的分析与研究可知，数据传输有效率不高的主要原因是网络条件及设备配置等导致的，数据有效率不高的原因是人工对数据补遗、数据审核的干预所导致的。

二、有效提升数据传输有效率的具体措施

通过对污染源自动数据传输有效率不高原因的分析探讨，本文对如上原因提出了提升数据传输有效率的具体措施。首先，按照国家相关要求，对污染源排放口进行在线监测。结合国家相关的标准及规范，将数采仪及在线监测设备安置在考核范围内的污染源排放口，限时间整改尚不拥有安装资格的排放口。如果排放口不能在短时间内进行整改，应将其暂时关闭，以确保可以将在线监测系统覆盖所有考核范围中的排放口。其次，结合我国212协议采集和传输在线监控数据进行监控。具体内容如下，各个监测点要依照相关标准对污染源排放的日数据、小时数据、分钟数据及实时数据加以采集和传输。同时在进行废气监控的时候，要实时采集及传输折算浓度、排放量、二氧化硫、流量和实测浓度等。在进行废水监控的过程中，要实时采集及传输废水排放量、流量、氨氮浓度及化学需氧量。结合企业相关需求，也可以传输包括氧含量、烟尘在内的相关数据。再次，加强设备运行的维修管理工作。企业要定期或不定期的对设备进行维修管理，确保监测设备的稳定安全运行。但我们知道，我国各个地方都分布有监测点，一些企业位于偏僻山区，交通状况不佳，难以进行维修保护。因此，开展远程维护是相关关键的。再次，企业要管理监测数据的有效性。结合国家相关管理标准，由于装置停产或设备故障所导致的数据丢失或数据异常，要及时进行补遗。企业要结合国家的标准，加强对异常情况的审批、申报工作，对无效数据进行管理与干预，有效的确保传输数据的有效性。最后，相关监督部门要定期核查现场情况，制定合理的制度，提高企业对污染源在线监控的重视程度。通过实时监督企业自动监控数据，对现场设备进行审查，确保数据传输的有效性与稳定性，确保设备的稳定与安全运行，确保数据传输有效率符合国家标准。

结束语

本文重点分析了确保污染源在线监测系统数据有效性的具体措施，以供参考。

参考文献：

[1]许煌伟.面向冲突治理的晋江市环境自动监测监控系统有效性研究[D].华侨大学，2014.

[2]李雪莹.哈尔滨市地表水环境污染在线监测系统的构建研究[D].东北林业大学，2014.

[3]江雪娟.城市环境在线监控系统的设计与实现[D].吉林大学，2014.

在线数据库系统篇4

现在,在以学分制为主导的课程教学改革思路的指引下,学生选课成为每一个学期初的重要环节,其要求学生在一定时间内选择该学期要开设的所有选修课。因为选课时间较短,学生在选课时往往无法了解完整的课程体系,有时选课太盲目。学校为提升学生的自主学习和选课能力,在深入调研、广泛探讨的基础上,设计出一套基于My SQL数据库的在线选课系统。

1 在线选课系统需求分析

基于My SQL数据库的在线选课系统开发目的是针对学生自主选择选修课和加强教学组织管理。通常,该系统包括申报选修课、审核选修课、学生在线选课、查询选修结果、学生信息管理、通知通告发布等功能。

基于My SQL数据库的在线选课系统的功能突出表现为管理员、教师、学生和教务管理员的身份上。应用者的需求主要表现为以下几点:

1)提供选修课程信息并审核。

2)管理用户信息。

3)课程的智能化推荐。

管理员具有超级用户的权限,可以对系统进行全方位的管理。教师和学生分别有不同的权限,登录后显示出对应的界面,然后选择必要的操作。教师可以提供该学期要开设的选修课程,维护课程信息,管理学生选修成绩等等。学生可以阅览、查阅选修课数据库,可以自主选课,也可以按照选题智能推荐的课程进行点选。

2 在线选课系统设计思想

为强化学生的自主选课能力,在线选课系统要存储并处理大量的数据。所以,该系统以业内常用的My SQL数据库进行挂接,采用PHP进行程序设计,智能排列管理员设置的课程,按院系和专业构建相应的专业课程表,为学生提供课程介绍展示,以此实现选修课的自主化选择。

3 在线选课系统总体设计

按照以上需求分析和设计思路,系统的主要子系统有:用户登录校验子系统、管理员后台维护子系统、教师管理子系统、学生选课子系统。

学生在系统中注册后,第一次登录要填报课程爱好调查表,提交调查表后,系统会汇总、整理调查表结果。为实现智能推荐课程和提供必要的选课建议,系统经过核对信息、汇总统计等环节后,引导学生指向选课控制台。控制台中可以显示学生信息、调取选修的课程,查看选修课的得分、参考系统对所选修课程的建议等。依照系统的推荐功能,学生可以快速选课,也可以展开选修课列表进行重新选择。每选择一次课程,该课程就会添加到已选课模块。选择完课程,点击选课结束,系统会对选课结果进行分析并给出选课提示。学生可以调整课程顺序或再次点选课程。选课操作完毕后,系统结束后台算法的运行程序。

4 在线选课系统数据库设计原则

系统在开发之处要做好数据库的设计,主要包括数据的内容和数据的组织方式。数据库的设计目标是数据库设计的重要环节。科学合理的数据库,要避免荣誉数据,对某个记录的定位要准确迅速,且维护方便。为了兼顾对数据库记录定位的速度,有要避免冗余数据,对数据库的设计采取了如下措施:

4.1 规范数据库

对数据库的设计,组织数据库尤为重要,主要指在一个活多个表中存储数据并建立关系。为了避免数据的不统一性,从减少冗余数据存储的角度出发,要规范数据库。要规范命名、规范括号以及孤帆注释等。

1)规范化命名。命名要表意,这是程序的构成基本要素之一。如果数据库所有字段能贴近于其功能,可以使代码编写者和系统维护者更便于理解。比如“nianling”、“shezhi”、“banji”等,可以提升系统的维护性,保持程序的健壮性,更为明晰系统之间的关系。否则,如果命名不能表达系统的含义,后期维护系统时就会困难重重。

2)代码的大括号和缩进要规范。在设计中,常用到大括号等字符。大括号与制表符相结合,构成规范的代码缩进式样,会增强代码的层次感和逻辑感,提高程序的可读性和复用性。

3)小括号的规范使用。代码中也常用到小括号,其使用也要保持一致,便于代码的维护。

4)注释的规范。为了增强程序的易维护性和可读性,注释的标注是重要方式。在代码的设计过程中,为便于开发者理清代码逻辑关系,简单且高效的操作就是基于关系模型的结构化查询语言。

4.2 数据库设计的重要考虑因素

数据库的设计还要考虑到下面的因素:

1)与选课过程的流程相匹配。数据库的设计要与教学管理的课程参数相适应,选课中课程所对应的相关数据,以及对这些数据的处理方式。

2)数据库要符合逻辑,层次合理。数据库结构要科学合理,容易理解,便于维护,可以高效率运行。

3)数据库的结构化要合理,数据库的结构要符合行业标准,要与编码的使用相一致。

4)减低冗余。为了提高系统的运行速度,要降低数据库的冗余度,减小开发难度,使数据库易于实现。

5)数据库要保持数据的一致性和准确性。该系统要面对庞大的用户群体,会有多个用户并发访问数据库,在处理数据时,可能会影响数据的一致性。所以必须对有些数据采取锁定的措施来避免数据的不一致性。

6)确保安全机制。数据库的用户信息和课程的设置带有一定的保密性,安全机制要保证。

7)良好的兼容性。为提升系统的可复用性和可移植性,要遵循兼容性原则。

5 数据库中的数据表

在遵循数据库的设计原则的基础上,要考虑数据表的设计,对设计的性质、特性要细致处理。该系统要包括以下数据表:

5.1 学生基本信息数据表

学校的学生管理处有所有学生的信息,其可以作为学生信息数据库的基本表,但要留出预留字段,以备扩充。其字段主要有学生姓名、年龄、所在院系班级、性别、专业、兴趣等。

5.2 选课逻辑规则表

不同的专业包括不同的课程,具有一定的逻辑关系。为了有效、规范使用这些规则,数据表要存储这些规则。比如那些专业的学生对课程有什么特殊要求,那些专业的学生必修课程要注意什么,课程的选择有没有冲突等。数据表中要注意存储规则,以备调用。

5.3 课程信息数据表

课信息数据表要包括教师提交的课程名称、学分值、学时等信息。

5.4 选课数据表

选课的模块与两个数据表相关,学生表和课程表。课程表在数据库中的操作最频繁,操作性能对全系统的性能影响极为关键。选课表的字段有ID号、学生学号、课程编号、选修成绩、课程类别和备注信息。

因系统采用B/S结构设计,所以浏览器即为结果的展示窗口。用户在表单上输入信息,浏览器将其发送给服务器,服务器的运行平台上的程序就把信息输入到数据库,最后将结果返回到浏览器端。

6 选课系统中数据库操作实例

下面以修改选修课的操作来展示对数据库的处理过程。通过表单的值来判断该操作是否是修改,进而调取数据库,进行后续操作。代码如下:

7 结束语

该在线选课系统是采用浏览器/服务器模式开发的基于数据库的选课信息管理系统,其逻辑结构清晰,数据库设计科学合理,功能的开发采用模块化方式,缩短了开发周期,使系统的运行并行化。依据该模式,不同组的编程人员可以分头进行,不至于因为其他开发者所设计的模块没有完成而妨碍自身所开发的模块。这对于加快开发进程、节约开发成本有很大的帮助。系列模块的设计科学合理,界面友好,应用方便,数据库的信息达到了规范化的要求,统计更为快速、直观,满足了学校教务管理的要求,强化了学生自主学习和选课的能力,提升了教学管理的效率,宜进一步推广应用。

摘要：文章探讨了基于MySQL数据库的在线选课系统的设计。通过分析基于MySQL数据库的在线选课系统的实际需求,阐述了系统的设计思想。在探讨选课系统总体设计的基础上,对数据库的设计原则进行了深入分析,指出了规范数据库、规范命名的原则,对数据库设计的重要考虑因素做了概括。对基本的数据表的构成进行了列举。最后,通过实例展示了选课系统中对数据库操作。

在线数据库系统篇5

股份有限公司：

我公司承建的XXX锅炉烟气处理系统中，CEMS在线监测系统采购贵公司产品。当锅炉停炉和闷炉时，CEMS仍然在检测和不断的由下位机上传数据，容易引起固定污染源监控系统的误判，造成上传数据失真，为保障真实数据上传环保部，根据环保部下发《固定污染源烟气排放连续监测技术规范》（HJ/T75-2017）第十二条及附录C8的相关规定，特请XX科技股份有限公司人员对焚烧炉异常下对上传数据进行参数设定，即焚烧炉闷炉或停炉时，流速显示为2m/s以下，氧量显示为19%以上，下位机就判断为焚烧炉已经停运，上传排放数据就显示为0。

特此申请！

有限责任公司

在线数据备份注意事项等篇6

为了支持商业网络的各种服务蓬勃发展，越来越多的公司正在考虑将他们的关键数据进行在线备份。在跨出这一步之前，有一些重要的因素需要考虑。

安全性：确保你的供应商有能力提供详细的信息，比如数据是如何传送至和传送回备份网站的，备份地址的安全性是如何保障的。应该选择拥有强有力的文件加密方法和访问控制标准的知名在线备份服务提供商。

可靠性：要弄清楚如果数据丢失，需要花多长时间才能恢复，对于不同类型的数据是否有不同程度的可靠性。你要了解万一发生事故，重新获得大部分重要数据所花费的准确时间。

服务水准协议：各种不同服务商的程序进程的恢复速度有多快，有什么能保证响应时间?以书面的形式将这些内容规定下来。

经济上的风险：你要知道面临的风险的是什么。如果服务失败或是经过备份的文件损坏了，确定其经济责任。最安全的是，对你的备份数据另外再做一份备份，在服务价格呈下滑之势的时候这样更可行。

(译梁晓平)

利用RSS增加网站流量

Francine Kizner

RSS是一种很方便的功能，如果加以有效利用，可以为网站带来很大流量。

有博客站点吗?它有RSS种子(RSS feeds)。正在eBay上做销售吗?它也有RSS种子。现在几乎所有网站都提供RSS功能。现在不要让它们被浪费了，你可以利用自己的RSS种子来增加网站访问量，达到你的目标市场，让网站与时俱进。从何入手呢?

建立一个你所有在线活动的主要来源。找到FriendFeed.com网站，输入你的各种社交网站、博客站点和其它消息来源，创建一个“lifestream”，它能让人们阅读你所有的在线内容，并且还能让他们发表评论。

创建不同的小部件放在网站上。去Widgetbox.com网站输入你的RSS种子的链接地址。然后加上一个自定义页眉，再美化一下外观设置，并把它放在MySpace、Facebook或是允许粘贴HTML文件的地方。

把博客站点变成一份新闻列表。注册FeedBumer，并激活电子邮件订阅，或是建立一个FeedBlitz.com新闻列表，好让你的受众每天都在他们的收件箱中收到最新消息。

获得Amazon网站访问者的注意。如果你发表过著作，可以在AmazonConnect背景资料中加入你的RSS种子。如果你没有著作，申请将你的博客站点列入Alnazon Kindle阅读器的订阅清单上，你会得到每位订阅者所缴费用的30％。

别忘了寻找其他你能放置RSS种子的地方(比如新闻服务和社交网站的个人资料中)，将链接返回到你的网站，从而创造出更多的流量。

在线数据库系统篇7

随着计算机技术的发展, 利用网络进行远程教育成为教育发展的一个方向。学习作为延续人类已有物质文化成果、并在原有知识基础上创造出前所未有的内容的活动, 已从传统的基于课堂的“教师讲授-学生学习”的模式转变为通过多种途径而实现。网络突破了时间与空间的限制, 给予学习者更加灵活的学习方式, 并为一些无法走进高等教育殿堂的求知者开辟了另一条获取知识与学历的途径。

基于网络的在线学习系统是对传统教学的辅助, 强化推广在线学习, 可以弥补学生因课堂的进程教学固定而带来的被动学习模式, 尽早更快的汲取更多知识, 主要突出以下几点:

第一, 师生可以突破时空的界限, 打破了传统课堂授课固定模式, 大大的节省了教育教学资源, 而且师生间可以实现互动, 实施有效的沟通, 反馈和交流方便, 效率高。

第二, 可共享丰富的网络教学、学习资源给师生提供了有利的学习支持。

第三, 在线学习系统可以改变学习模式, 变被动为主动。把学习的集中化, 变为分散的, 有效的满足不同知识基础学生的学习。教师负责网络课件的设计、开发以及维护, 并能及时了解学生们的思维和缺漏, 对学生个人情况熟悉掌握, 这样就能及时对课件予以补充和纠正。

第四, 在线学习可以提高学生的主动性, 通过设计进阶练习、在线测试、网上互动等功能使被动的接受学习变成自我探索、发现、协作学习等多种形式的组合学习。同时, 由于学生天生的好奇心, 对于这样一种突破传统的全新的学习模式, 可以调动学生主动学习的兴趣, 可以提高学生的学习效率及掌握知识的程度。

第五, 由于现在推行的老年教育和终身教育, 根据学习者的情况设计系统, 使那些无法走进高等教育殿堂和有求知渴望的人们, 通过这样一个教学平台来实现自己的梦想, 提高自身的素质。在开放和远程教育中, 学生也可以做到“无师自通”。

基于以上特征, 对该系统的研究可以起到对课堂教学的辅助作用, 提高学生的自主学习能力;促进学校教育体系的完善, 全面实施课程在线学习的功能, 将有助于学校整体教学水平的提高, 并可把握学生动态学习情况以及统计整体学习水平。

2 课程在线学习系统研究的目的

《SQL Server2000课程的在线学习系统开发研究》[1]课题研究的目的主要是基于提高学生学习方式、方法为出发点, 同时提供更丰富的共享学习资源。对课堂教学的起辅助作用, 提高学生的自主学习能力;促进学校教育体系的完善, 有助于学校整体教学水平的提高;拓展学生的知识面, 并可动态统计、评估学生的学习情况;提升信息化教学水平, 带动教学改革快速发展。

3 课程在线学习系统总体设计方案

综合我们对在线学习系统功能调研以及借鉴国内外先进的在线学习系统的优缺点分析, 同时, 满足学院教育教学体系以及今后的课程开发的链接, 该项目的总体设计方案主要划分:课程介绍、课程学习、在线测试、在线考试、在线交流、帮助等模块。设计框架如图1。

各个模块的主要功能简介:

1) 课程介绍模块

课程介绍对使用的技术版本以及知识点的关系给出点评式介绍, 主要介绍课程中知识点的相互联系和进阶顺序。全面概括课程的应用范围和技术功能, 使读者在学习前对课程有较完整的认识。

22) 课程学习模块

课程学习模块是读者学习课程的具体内容。本模块嵌入富有丰富教学经验的教师制作的课件及教学视频。知识的衔接按章节划分, 便于读者选择学习。本模块的核心是采取多样性的教学方式、方法传授知识。对应的相关知识点与在线测试模块、在线考试模块相呼应。

3) 在线测试模块

在线测试模块是学生检查自我学习效果的评价模块。在线测试系统自动出题, 自动阅卷直接给出分数结果。并对学习者给出相应建议, 便于继续学习。在线测试可以按单元测试, 检查单元学习情况, 也可按知识点组成的模块测试。模块的划分基于工作过程, 与教学体系相吻合, 实用性、针对性强。

4) 在线考试模块

在线考试模块是在在线测试模块的基础上全面考察学习者的学习效果的功能模块。题库量大、内容多。暂作为后续开发项目。

5) 在线交流模块

在线交流模块是学习中很重要的环节模块。学习者在学习遇到的问题, 可以在线寻求他人的帮助, 通过留言的方式向同学或老师提出问题。同学或老师在线回答。同时, 可以多方交流讨论问题, 使学生有了新的学习交流平台。

6) 帮助模块

帮助模块主要提供学生在学习过程、登录、注册等过程中遇到的相关问题的帮助指导。

4 课程在线学习系统开发的设计

针对课程的在线学习的特点, 在线课程学习的主要流程如图2。2

用户通过正常注册、登录后, 进入各个模块, 在线学习模块链接后台数据文件库, 在线测试、在线交流等数据部分保存于后台数据库种。便于数据记载以及查询。

前台页面与数据库连接部分代码实现

在线学习模块部分代码实现

在线学习系统在网络上运行正常, 各个功能达到预期要求效果如图3

5 课程在线学习系统运行的效果分析

通过一段时间的运行, 注册、登录、浏览课程大纲、课件流畅。在线测试以及网上留言等功能达到预期要求的功能。在我们在线问卷的调查中, 参加留言总数72人, 学生反映情况:1) 能帮助更好掌握课程知识的45人占62.5%;2) 可以补充对课堂教学的34人占47.2%;3) 网页内容充实的37人占51.3%;4) 在线测试方式能帮助学习的61人占84.7%;5) 你认为可以替代课堂教学的4人占5.5%;6) 你提出的问题得到及时回答的8人占11.1%;7) 系统保持主流, 但需要修改的69人占95.8%。从调查的结果分析。课程在线学习系统得到了大部分学生的肯定, 可以帮助学生补充学习, 在线测试方式等方式可以帮助更好的掌握知识。但需要老师在课下及时与学生互动, 解答问题。学习内容还需要及时更新和系统维护。

参考文献

在线数据库系统篇8

关键词：在线考试系统,数据库

1 引言

随着信息化社会的迅速发展, 在线考试已经逐渐在高校中流行起来, 数据库作为在线考试系统功能实现的基础, 做好数据库的设计和应用十分必要。

2 需求分析

本系统作为一个通用的高校在线考试系统, 可以满足高校各科目的考试需求, 因此在系统的分析设计阶段需要充分考虑不同考试科目的公共特性, 具备一定的可设置的弹性化设计空间。

本系统主要有教师、学生、监考人员和管理员四种用户, 其中教师主要完成试题库管理、试卷管理等功能;学生主要完成在线考试功能;监考人员主要完成监控考场、启动考试、回收试卷等功能;管理员主要完成对用户、权限、考试课程和考试等管理功能。

3 概念设计

E-R图是一种用于描述静态数据结构的概念模型, 提供表示实体类型、属性和联系的方法, 用来描述现实世界的概念模型。把该系统的需求说明抽象为信息世界的概念模型, 采用自底向上的方法, 进行系统的概念设计, 部分E-R图1 所示。

选择题实体, 包含编号、课程编号、题目、选项A、选项B、选项C、选项D、答案、章节、知识点、难易度等属性;

一般题实体, 包含编号、课程编号、题目、答案、章节、知识点、难易度等属性;

试卷规则实体, 包含规则编号、课程编号、单选题数量、多选题数量、填空题数量、判断题数量、综合题数量、单选题分值、多选题分值、填空题分值、判断题分值、综合题分值、总分和考试时间等属性;

试卷实体, 包含编号、学号、规则编号、题型、题目编号、题目序号、学生答案、是否正确、得分等属性;

4 逻辑结构设计

逻辑结构设计就是把E-R图中的实体、实体的属性和实体之间的联系转化为数据库支持的关系模式, 在转化过程中, 注意命名问题、非原子属性问题和联系转换问题, 根据设计创建对应的数据表, 具体如下:

管理员表 (编号姓名, 密码) ;

教师表 (编号, 姓名, 密码, 系部, 联系方式) ;

学生表 (学号, 姓名, 密码, 年级, 班级, 联系方式) ;

课程表 (课程编号, 课程名称) ;

班级表 (班级编号, 班级名称, 系部, 专业) ;

上课班级表 (编号, 课程编号, 班级, 上课教师编号, 出卷教师编号, 组卷规则编号) ;

考场表 (考场编号, 课程编号, 班级, 考场人数, 考试开始时间, 考试结束时间, 监考老师编号, 考场密码, 考场状态) ;

单选题表 (编号, 课程编号, 题目, 选项A, 选项B, 选项C, 选项D, 答案, 章节, 知识点, 难易度) ;

多选题表 (编号, 课程编号, 题目, 选项A, 选项B, 选项C, 选项D, 选项E, 答案, 章节, 知识点, 难易度) ;

填空题表 (编号, 课程编号, 题目, 答案, 章节, 知识点, 难易度) ;

判断题表 (编号, 课程编号, 题目, 答案, 章节, 知识点, 难易度) ;

综合题表 (编号, 课程编号, 题目, 答案, 章节, 知识点, 难易度) ;

试卷规则表 (规则编号, 课程编号, 单选题数量, 多选题数量, 填空题数量, 判断题数量, 综合题数量, 单选题分值, 多选题分值, 填空题分值, 判断题分值, 综合题分值, 总分, 考试时间) ;

题型表 (题型编号, 题型名称) ;

试卷表 (编号, 学号, 规则编号, 题型, 题目编号, 题目序号, 学生答案, 正确答案, 是否正确, 得分) 。

5 数据库实现

本考试系统选择SQL Server2005 作为数据库开发平台, 为了充分利用数据库优势提高系统运行速度和效率, 采用数据库连接池技术, 连接池负责分配、管理和释放数据库连接, 它允许应用程序重复使用一个现有的数据库连接, 而不是再重新建立一个;释放空闲时间超过最大空闲时间的数据库连接来避免因为没有释放数据库连接而引起的数据库连接遗漏, 能明显提高对数据库操作的性能。

系统部分功能如随机组卷和客观题自动评阅功能将在数据库端实现。随机组卷功能将通过用户设置的题型、分值、章节、知识点和难易程度等要求通过存储过程完成, 而客观题的自动评阅功能将通过在试卷表中建立触发器来实现, 部分代码如下:

6 小结

一个好的的在线考试系统离不开数据库的支持, 所以, 如何根据系统的需求分析设计出合理的数据库, 对系统的后期实现有着十分重要的意义。

参考文献

[1]钟美莺.在线考试系统数据库设计应用研究[J].数据库与信息管理, 2015 (21) .

[2]刘洪江.在线考试系统的数据库设计与实现[J].电脑知识与技术, 2012 (01) .

在线数据库系统篇9

财经在线包装系统通过在播出串联单中增加图文内容的编排,完成全天包装版面的制定。包装版面中的信息包含股票行情数据和资讯数据两大类。系统可自动调用行情数据、短信数据等自动播出,同时也可手动插入资讯、图片,视频等信息播出。

目前第一财经图文播出只覆盖直播时段,播出工作站直接读取各个数据源数据进行播出。这种方式,由于受到网络环境的限制较多,故在实际播出中容易产生播出卡轮、数据延时较多等现象,这是由于数据入库有延时,播出工作站读不到数据造成播出动画无法完成所造成的。所以在新的系统中,需要建设一个数据缓存库,以避免此类现象。

一数据缓存库设计方案

目前财经各数据源结构相对松散,不利于使用数据的安全和再利用,所以对整个数据源部分做一个整合。提出一个数抿缓存库的概念,以整合行情、短信、资讯、图片视频等信息的存储入库。数据缓存库可作为财经频道各类数据的一个统一的平台发布,满足各种需求。数据缓存库模型如图1所示。

1.方案具体设技思路

数据缓存库是整个在线包装系统的核心,主要包含三部分的数据,如图2所示:

串联单:包括接收到的播出串联单、节目代码表格,数据库和程序运算处理后的图文播出表;

·股票数据:包含行情类,走势数据K线,排行数据等几种不同结构形式的高频率更新数据表,同时这些表格也是作为缓存数据,保存在数据库中备用应急;

·资讯数据:包含短信、新闻资讯等不定期、定时更新的数据,通过外部接口导入,在本地只做对应的缓存和节目匹配。

(1)串联单数据处理方法

频道节目播出串联单是将节目、包装模板信息、行情数据、资讯插入信息等有机结合的主线。节目号是匹配上述信息的唯一标识。编单工作人员根据频道播出计划安排,编排出全天节目播出串联单,并对每条节目配上相应的图文信息,每一条图文信息包含每个场景的类型,起止时间。如图3所示。

编辑完成的串联单以XML的文件方式传输到播出端的接口服务器并入库,由接口服务器转换为傲威播出格式的图文播出单进入自动播出系统。同时,接口服务器将接收到的XML信息写入资讯端的数据库。

串联单XML文件结构如下:

串联单XML文件在导入数据库时,会拆分成2个表:Action图文表与Programs播出表。系统会将串联单中节目的图文信息进行检索,当遇到相邻节目图文信息相同时,图文信息即可合并生成相应的图文播出单。如图4所示。

Action图文表与Programs播出表样式截图见图5。

Action表中Id字段为系统内导入图文模板时,自动生成的对应号,在整个数据库中唯一,这个Id用来标记图文模板的操作编号。比如模板库中目前仅有5个模板,那么次action表中就会根据串联单调用情况,生成10条记录,此10条记录主要包括5个模板每一个的上屏与下屏操作,Name字段为具体执行内容,Template字段为具体图文模板名称。如果图文模板增加至6个,那么此表将会自动变为12条记录。

由于图文模板同时有进场与出场动作,所以每次增加为2的倍数。

播出programs表截图如图6所示。

Programs表中Id字段不同于其他表中Id,具有唯一性,即每一档栏目均有自己在数据库中对应的记录位置。具体格式为SID+播出日期+播出时间+随机4位字母。

Programes表主要用来记录节目的具体信息。同时根据ProgramId排序和归类,最后通过ProgramId与图文播出Schedule表连接,获取PlayData (播出日期),StartTime (播出时间),Endtime (结束时间),精确到毫秒。

Action表与Programs表经过后台处理生成Schedule表,截图如图7所示。

在Schedule表中,第一栏Id为唯一标识,与其他表Id没有直接关系,每条图文播出记录都有对应的ActionId和ProgrameId,每一个图文操作(上屏,下屏)都对应到Action表中特定的操作。即Schedules表中的ActionId其实就是告诉播出程序,该行操作调用Action表中哪一个图文模板进行操作。因为考虑到数据库结构与数据冗余的因素,将Action表独立出来,没有直接与xml表混合导入。否则每一条节目背后都会产生大量关于图文模板的字符串信息,当播出记录长年累积后,这些非冗余数据产生的物理存储空间会非常大,而且对数据库设计来说,并不合理且增加负担。

另外当多档节目连续使用同一个模板时,在ScheduIes表生成前,会自动处理合并,并将相同图文模板的播放时间累加。如果相同图文模板之间存在广告(无图文模板)或者别的节目模板,系统都能够自动判断,分割好图文播出的顺序。

总的来说,每条Schedules记录都需要通过ActionId个ProgramId与Action与Programs两张表相连接。从Action表中获得执行什么操作,而从Programs表通过ProgramId匹配获得播出时间。

(2)股票行情数据结构

行情数据直接读取财经数据中心存储过程,5秒更新一次。更新的数据覆盖上一个周期的数据。若网络等出现问题,此前周期读取的数据不做清空。

行情数据形式如图8、图9、图10所示。

K线走势数据:股票代码CODE,股票名称NAME,最高价MAX_PRICE,最低价MIN_PRICE、开盘数据OL_STRING、高低数据HL_STRING。

播底条数据:股票代码CODE、股票名称NAME、当前价格NOW、涨跌幅DVALUE、涨跌百分比PCENT、成交量AMOUNT。

个股行情数据:股票代码CODE、股票名称NAME、当前价格NOW、涨跌百分比PRICELIMIT。

(3)短信、资讯数据插入形式

a.短信数据

短信数据通过连接财经短信数据库,每4～5秒进行一次数据刷新,由于短信数据库只保存当前节目播出的短信,所以每一次数据刷新时,缓存数据库都会先比对当前节目的programid号,然后对比当前ID与已经储存在缓存数据库中的短信与短信数据库的是否重复,如果不重复,那么将新短信添加到表中,并且programId定为当前节目的Id号,如果内容重复就忽略该条短信。

每条短信都根据日期与programId这两个字段作为标识。可以细化到某一天的某一档节目。

短信数据字段包含数据库内部编号ID、入库日期sdate、节目编号programid、content短信内容。

b.资讯数据

资讯部分数据通过资讯平台数据库接口获得,资讯主要包含的属性包括开始时间与结束时间。资讯内容是即时性的,所以每一条记录都通过使用播出程序的当前时间与表中开始时间和结束时间的区间做比较,若在时间区间里,那么对应的资讯内容,就会被播出程序播出。整张资讯数据表的主要字段是资讯开始时间Starttime与资讯结束时间Endtime。表中其他字段都是图文模板中对应的引出项内容,如图片,视频等素材都以物理路径加文件名的形式记录在这个表中,使用时由播出程序自动加载。文本内容则直接存储在数据表中,播出时直接匹配到引出项中。

最终播出时,播出程程序会根据资讯平台表中ratifystatus与infostatus两个字段先做出筛选,仅将通过审核,并且允许播出的内容传输到播出程序中。之后第二步筛选,会选择当前播出节目所对应的图文模板的资讯,然后再使用播出程序的当前时间去匹配资讯的开始结束时间区间,最终通过3次筛选,从所有资讯数据中,过滤出当前应播出的资讯数据。

资讯数据:模板名称Templatename,创建时间Createtime,节目编号programid,播出开始时间Starttime,播出结束时间Endtime,播出标记时间Currenttime,咨询数据库编号INFO_ID,对应图片素材文件名称Pic1,Pic2、Pic3、Pic4,对应文本内容Text1、Text2、Text3、Text4,对应播出文本时间Time1、Time2,Time3、Time4,对应播出资料标题Title1、Title2、Title3、Title4对应视频素材文件地址Vid1、Vid2、Vid3、Vid4,播出优先级infolevel,内部标记Flag,资讯播出状态infostatus,资讯审核状态ratifystatus,资讯标题TestTitle。

2,数据缓存设计创新点及优

(1)创新点

数据缓存库仅作为数据中转站,将播出使用的数据统一至此,各种数据类型皆可如DB2、MySQL或者ODBC等,由数据缓存库直接获取这些数据内容并统一为SQL格式数据。系统在播出时,直接从数据缓存库读取相关数据信息,避免了播出端与短信、股票和资讯数据库的直接联系,从而不受原数据库问题影响,可以有效避免播出卡轮等现象,保证播出数据的安全。且数据缓存库作为一个数据库服务存在,后台设有存储磁盘阵列保存库文件,以实现热备服务器切换时的数据延续,保证系统整体运行安全,具有一定的可扩展性和扩容性。数据接口图如图11所示。

(2)优点

a.与以往播出方式的比较,

以往播出形式:播出设备直接读取各个数据源进行播出。图文包装与串联单无关需手动执行,只能覆盖直播时段,非直播节目时段无法进行图文包装。如图12。

自动图文系统播出形式:播出设备不直接读取数据源,图文包装遵循串联单的主线,可自动完成图文模板切换播出,覆盖频道全时段播出。如图13。

b.主要区别与优势

如表1所示,数据缓存库的建立,改变了以往传统的播出形式,虽然数据部分可以存在2路(主备)或者多路的备份数据源。但是数据传输、更新产生的延迟以及网络故障,在播出设备与数据源直接连接访问的系统中,会直接影响到播出的质量。并且在多路播出设备同时访问同一数据源的情况中,数据库的压力是很大的。对于大量数据需要更新的播出系统,可能存在3～4秒内十几甚至几十次的访问和查询,并且可能因为重复数据的查询,浪费很多带宽资源与数据库系统资源。

基于数据挖掘的在线医疗诊断系统篇10

随着数据挖掘技术已经在商业领域方面已经应用较广,并逐步成为了商业分析领域的关键领域。从技术上而言[3],数据挖掘就是一个从大量已经存在的数据中,补齐不完整的数据,去掉噪音数据,在模糊和随机的数据中寻找那些人们以往需要依赖经验才能体会的潜在信息和知识的过程。

将数据挖掘技术应用于医疗卫生领域,也是近几年医疗卫生信息化发展的必然趋势。随着多年的医疗信息系统的建设,其已经积累了大量的医疗诊断数据和临床案例数据。那么在医疗卫生领域应用数据挖掘,就是一个在大量确诊数据中找到隐藏在背后的医疗手段的过程。本文介绍了多种数据挖掘的方法,并采用了一种通过分析数据不一致化率[4]的分类方法实现对确诊数据的高效分类,从而利用分类给医生提供更多的医疗手段的决策支持。

1 在线医疗诊断系统结构

1.1 系统描述

本系统所针对的最终用户是医生,医生可以在线借助该系统提供的决策参考意见制定医疗方案,从而促进病人的康复。对本系统的管理角色是系统管理员,系统管理员可以管理医生的权限,设置本系统采用何种方式从既有的医疗系统中提取医疗数据,还可以整理已经提取的医疗数据。

从医生的角度出发,其和病人打交道的主要信息是病例,其可以将当前诊断的病人情况录入系统,系统根据已经挖掘的诊断分类,推荐典型的诊断手段,病情还会列举一组的相关病例。医生如果觉得推荐的典型诊断手段不合适,还可以选择几个典型相似病例的诊断情况进一步预测,直到找到合适的诊断手段。

从系统管理的角度出发,主要是设置策略通过本系统从其他既有的医疗信息系统中抽取出已经确诊的医疗诊断数据。这个过程主要是通过既有的医疗信息系统所提供的外部接口调用。所设置的策略一般是,定时提取周期,以及接口的配置,从接口返回数据的字段如何映射到本系统的数据库中。同时,由于本系统会提取若干个外部系统的数据,所以本系统的数据时非常巨大的,配置数据分片策略和数据库的存储策略也是系统管理的一部分工作。最后,管理医生的权限,设置医生可以访问那些病例数据,不同科室的医生其对医疗数据的使用权限是不一样的。

1.2 系统框架

系统分为三个子系统,分别是用户操作子系统、数据挖掘子系统和外部数据提取子系统。用户操作子系统是给医生以及管理员操作用的,通过Web作为界面供给医生和管理员操作使用。主要为医生提供在线的病情诊断的功能和典型病例查询功能,主要为管理员提供医生的权限配置功能、数据存储策略设置功能、数据挖掘策略配置功能、外部系统提取策略设置功能和系统样式管理等功能。用户操作子系统的WEB服务器采用Apache的tomcat 7作为Web容器管理web应用,数据库采用Oracle的My Sql Server 5.5存储用户操作数据。

其中,数据挖掘子系统一方面提供给用户操作子系统使用的访问接口,一方面从病例实例数据库中挖掘诊断知识。其主要的挖掘手段是通过分析数据不一致化率的分类方法实现对确诊数据的高效分类,这个分类就是从以往病例方案中总结的分类知识。再通过这个分类来映射一个治疗方案,这就是挖掘的最终结果。其利用Weka 3.6作为数据挖掘的基础框架,基于该框架做扩展开发。

其中,外部数据提取子系统用于从既有医疗信息系统中提取医疗诊断数据,存储到病例实例数据库中。一般与既有医疗信息系统约定采用Webservice接口结合导出数据文件的方式提取数据。通过Webservice接口发起命令从既有系统提取数据,既有系统会导出生成一个约定好数据格式的数据文件,生成后会发消息通知本系统,本系统再去约定好的FTP获取数据文件。采用这种异步的方式可以在不影响既有系统工作的前提下,高效的提取数据。提取的数据最后存储到Mysql集群,利用Mysql的集群能力做数据的切片和分割,从而可以存储海量的数据,同时Mysql集群也提供了高效的查询接口,通过普通的SQL查询可以高效的查询存储在集群内的数据。

2 数据挖掘在医疗领域的框架技术研究

2.1 医疗数据挖掘概述

随着生活水平的不断提高以及生活环境的不断变化,人们的社会生活逐步频繁给加剧了生活的压力,一些疾病也慢慢影响了人们的健康。再加上近年来医疗信息化的不断投入,产生了大量的医疗数据,正是在这种背景下,医疗数据挖掘成为了趋势。

就医疗数据挖掘的现状而言,目前主要方法有:演变分析、聚类分析、关联分析、分类分析、孤立点分析和概念/类别描述等方法。其存在多态性、不完整性、周期性和冗余性,这就给数据挖掘带来了一定的复杂度。

针对上述特性,就要求医疗数据挖掘能够对大量的原始医疗数据在确保数据一致性和正确性的前提下进行过滤、降噪,做数据预处理。然后,针对不同的病例诊断选择合适的数据挖掘算法,在保证算法正确性的前提下优化算法的效率快速做出诊断。最后结合专家及医生的个人经验对系统不断完善,对挖掘结果不断优化,形成一个闭环过程。

2.2 数据分类算法现状

分类算法是数据挖掘领域重要的有监督训练问题,其本质是通过给定的训练集,这个训练集的每条记录都包含一个分类标签,即人为预先给定了问题的答案,然后让算法来总结分类,将特例问题转变为通用概念。一般分类算法会包含两个基本步骤,首先通过算法根据已知标签将问题从特例化变为更为抽象层次通用概念模型;最后将通用概念模型应用于未知的数据分类。

目前在数据挖掘领域常用的分类方法有,决策树分类、神经网络分类、贝叶斯分类、支持向量机分类以及其他分类算法。这些算法各有优缺点,在不同环境下采用更加合适的算法才是数据挖掘实践的明智之举。

3 在线病情分析算法

3.1 基于不一致率的特征算法

本文针对糖尿病诊断数据存在特征冗余、特征维度大和相关性的特点,采用了一种新的快速特征选择和数据分类方法有效的提高了可解释性和预测性。该算法一般分为三个步骤,第一是数据离散化与不一致率表示,第二是不一致率特征的选择,最后通过不一致率对数据分类。

数据离散化就是把连续属性的取值范围或取值区间划分为有限个离散小区间,再对每个离散区间进行标记,离散化后数据尽可能的保持和以往数据的一致性。一般采用Chi-Merge方法对数据离散化,其首先要选择训练集中的一个数值属性,然后初始化不同值作为区间节点,对相邻区间计算X2值,合并最小的X2值到邻近区间,不断迭代上述合并过程直到收敛到指定数量的离散小区间为止。其中X2值用如下公式表示。

其中m=2表示两个相比较的区间,n表示分类的数量Aij表示第i个区间第j个累的实例数。Eij表示Aij的期望频率。

数据不一致率是用来描述特征集区间划分数据集,也就是说这个特征是否能够表达这个分类的概率。由于一个训练集有多个特征,那么那些特征组合最能表达分类可以通过下述流程图表达,如图1所示。

如上图所示,通过不断迭代可以找到一组最优组合,通过这组最优组合的特征集表达数据分类。

通过上述最优组合的特征集选择,得到了一个训练集的子集,这个子集最能表达分类。这个子集中可以有p个不同的模式,l表示分类,用Xpl表示第p个模式属于第l个分类,用fpl表示Xpl的个数,那么就可以得到一个列联表,见表1:

最后,利用上表的所有模式得平均权重来产生最终的概率结果,其中分类的概率可以表示为:

上式中权重Wi表示这种模式得分类方式的价值,如下公式:

其中Pil表示这种分类在全部分类的概率,其可用如下公式表达:

其中概率P(i)表示实例在第i个分类中的概率。显然,具有最高概率的类被分配给该实例。

3.2 系统的医疗实践

根据糖尿病的实际情况,一般以三个月为界限,三个月以内的为轻微,以上的为严重。以一个实例数据为例,总共748个患者,其中严重的629例,轻微的119例。从特征选择结果看,糖尿病主要和年龄、钾含量和红细胞积压有关。

最后通过上述算法进行分类,在数据中抽取年龄、钾含量和红细胞积压,来判断病人是严重还是轻微,其正确率可以达到83.2%。根据这个分类,还可以映射到一组治疗方案中,从而帮助医生更为理性的分析病情,进而起到促进患者康复的作用。

4 结束语

本文通过深入分析某些已确诊患者的医疗数据,借助数据挖掘的方法提取医疗数据背后的数据规律,从数据的角度出发帮助医生对疾病采用更为针对性的疗法,从而促进患者的治疗。在实现了基于数据挖掘的在线医疗诊断系统的基础之上应用于糖尿病的诊断,通过这一实践应用证明了本系统提出的方法有一定的效果。

同时,本文相信通过继续实践还有更多需要改进的地方,本文中的系统也是一个不断完善不断更新的年轻系统,所述方法,还待更多的病例研究来持续改进。

参考文献

[1]REINER,BRUCE.New Strategies for Medical Data Mining,Part2:The Customizable Productivity Pacer[J].JOURNAL OF THE AMERICAN COLLEGE OF RADIOILOGY.2011,8(1):33-38.

[2]杨海清,数据挖掘技术在医院管理中的应用[J].中华医院管理杂志[J],2005,21(7):497-499.

[3]J.W.HAN,M.KAMBER.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.

在线数据库系统篇11

从某种意义上说，咨询业是杰姆斯·麦肯锡(James O.McKinsey，1889～1937)留给企业的遗产。身为芝加哥大学教授的麦肯锡把对会计学的高度热情转移到对管理咨询理论的研究上，第一次世界大战期间，他以军官的身份在美国各地奔走，寻求解决美国军队后勤给养问题的方法；一战后，他决定运用其所有的经验和学说，实践于一家控制严格的机构——麦肯锡公司由此诞生。竞争

在国内手机行业，赛迪的最大竞争对手是有着80年的发展历史总部位于德国纽伦堡的GFK。GFK日前拥有超过5000名全职员工，是全球五大市场研究公司之一。GFK集团在全球范围内的市场研究业务，涉及耐用消费品调查、消费者调查、媒体调查、医疗市场调查和专项研究等方面，并在其中确立了绝对的专业性权威地位。特别是在耐用消费品调查方面，GFK集团在全球位居第一，并成为唯一的在全球范围内统一进行耐用消费品零售调查和研究的企业。

GFK于1993年进入中国。经过十多年的发展，GFK在中国的调查网络由最初的5个城市发展到200多个城市及近300个郊县；监测的产品涉及黑色家电、白色家电、小家电、通讯产品和IT产品等近40个品类；月度数据报告覆盖全国200多个城市，并且在其中100个主要城市还能对通讯产品提供市场零售监测周报。GFK中国以其长期的数据积累和GFK独有的对城市总体市场进行推总的数学模型，成为中国市场IT、家电和通讯产品零售监测行业的领导者。

优势

赛迪数据在线拥有工业和信息化部、海关、国家统计局、各部委、行业协会、信息合作伙伴等权威、准确的信息渠道资源。赛迪数据在线信息来源于“中国电子行业信息网”、“中国移动通信产业网”、“中国电子行业投资信息网”、“中国电子信息百强企业网”、“中国视像行业网”、“国家信息化数据库”等六大权威政府网站支撑。

赛迪顾问公司总部设在北京，并在上海、广州、深圳、南京、武汉、成都等地设有分支机构，覆盖全国200多个大中型城市的业务网络，5800多个零售采集店面等的数据支持。赛迪顾问是中国首家在香港创业板上市的现代资讯企业(股票代码：HK08325)，致力成为中国本土的企业管理第一顾问、政府决策第一智库、信息化咨询第一品牌。

方向

互联网，这基本是赛迪未来战略的核心。赛迪数据在线既提供在线数据数据库、在线分析报告、在线行业资讯、企业透视等线上服务，又提供市场研究、信息化规划、管理咨询等线下定制化项目咨询服务，及信息加技术的网络产品等一条龙的立体化的信息服务解决方案。

在线数据库系统篇12

海洋环境数据在线服务系统建设是集海洋科学、地理信息系统与计算机科学的综合性技术。由于服务对象与服务目的不尽相同,各单位和科研院所建设了许多海洋环境数据和应用系统,这些系统之间不可避免地造成了数据冗余和资源浪费,同时也导致信息孤岛和重复建设等问题,不利于海洋数据的共享与服务[1,2,3,4]。

传统的海洋数据服务一般是专项专建、专人专用,针对人群比较单一、数据类型比较简单,而且在项目结束后通常建设的数据库和应用系统由于没有后期的经费支撑而停用。本研究提出的海洋环境数据在线服务系统(以下简称系统),涵盖了多专项、多学科的数据,在原有数据库、应用系统、专网基础上进行系统集成、数据库扩建,为海洋局属各单位提供共享服务。

系统是运用面向服务架构的设计思想搭建应用系统。采用并行数据库技术实现大数据量的存储、加载、更新、查询等操作,利用ETL调度工具实现源数据库到并行数据库的数据抽取、转换和转载,减少重新建库的工作量。采用虚拟化技术整合存储、服务器、网络资源,建设数据中心集群,提高资源利用率,采用域控管理机制实现数据安全管理,权限管理。采用VPN认证管理机制,保障系统安全正常运转。

2 系统设计

系统通过面向服务的总体架构,以数据的汇集、处理、应用为基础主线,采用高速并行技术,结合虚拟化技术等先进IT技术,设计系统的逻辑架构、功能架构、物理架构与技术架构。

2.1 逻辑架构

系统总体架框架由数据层、管理层和应用层3部分构成,数据层是指通过对历史收集、专项调查、在线传输等方式收集,采用数据集、数据库方式进行数据存储与管理;管理层是指对使用系统的用户进行统一认证、用户管理、数据授权等实现用户有效可控的管理;应用层是指为用户提供数据的在线查询检索、数据时空分布检索、产品加工处理等应用服务,满足用户多样化的需求。应用层与管理层通过内网和专网访问数据层,实现数据的管理、查询、处理等服务。系统总体逻辑框架如图1所示。

(1)数据层。数据层主要由原始数据、基础数据和成果数据3部分组成。

原始数据是指海洋仪器现场采集的原始资料、现场汇交的纸质或者电子资料等。原始数据采用文件方式存储,基于原始资料清单和数据库文件目录等方式进行管理。类型包括海洋观测原始资料、海洋监测原始资料、专项调查汇交资料等。

基础数据是指对原始数据进行整理、排重、质量控制等处理之后形成的标准化数据。内容主要包括专项调查数据、观测实时资料数据与国际业务化数据等,专项调查数据包括水文、气象等9个学科,观测实时资料数据包括海洋站、雷达、浮标等。基础数据采用数据库存储方式,根据基础数据的资料类型、资料格式、数据观测频率、数据传输频率、数据量等设计数据库结构。

成果数据是指经过信息提取、多源数据融合、数值模型分析、统计分析等手段处理后形成的数据。成果数据由要素数据、成果专题数据、资料目录数据组成,采用数据库存储方式。要素数据是以基础数据为基础,根据数据的专题应用保障和服务需求,按照时间、空间、专题要素等进行组织的数据。成果专题数据主要包括数值型产品和图形产品,涵盖海洋再分析产品、实况分析产品、潮汐预报产品和海洋专题产品等。资料目录数据主要包括原始数据集目录索引、标准数据集目录索引、产品数据目录索引等。

(2)管理层。管理层主要负责系统的用户管理、资源管理、业务流程管理和运行监控管理等内容。用户管理包括用户的创建、更改和删除、角色管理、功能授权与数据授权;资源管理包括目录索引管理、数据导航管理、信息发布管理与信息资源管理;业务流程管理包括数据申请、虚拟机管理、数据审批管理等;运行监控管理包括运行环境监控、数据资源监控与用户行为监控。

(3)应用层。应用层依托于中心内网和海洋专网,基于并行数据库技术和虚拟化技术,实现海洋局属单位间的数据在线服务。应用层主要包括:数据时空分布展示、数据查询检索服务、数据共享虚拟环境、产品制作与产品导出功能。

数据时空分布展示是利用数据的经纬度、时间范围、站次数等关键信息,通过统计计算数据量,依据色彩图例,进行时空分布展示。

数据查询检索服务包括数据库查询检索和数据集查询检索。该服务可提供基于矢量地图及影像地图的地图显示控件的数据查询服务,以及使用关键字对数据进行查询。

产品制作是指对资料进行整理、标准化处理,开展数据识别、解码等预处理操作,利用数据统计分析工具进行产品的加工制作。

产品导出是指对用户加工制作产生的产品成果提供数据的导出功能,实现数据从虚拟机到本机的导出服务。

2.2 物理架构

按照系统设计,对系统运行硬件环境进行搭建,硬件环境涵盖原始数据文件存储区、数据库存储区、数据处理区、数据服务区。按照网络布局可化为中心内网和海洋专网,内网为中心内部用户提供在线服务的入口,专网主要包括海洋观测网、海洋监测网、数字海洋网;数字海洋网为海洋局属单位提供在线服务的入口,用户经由内网/数字海洋网通过VPN身份认证后方可进入用户主页,通过登录进入个人虚拟工作环境 (即用户虚拟机),用户可在虚拟机中对数据进行查询、处理和产品制作(图2)。

系统经由海洋观测网和海洋监测网接收实时、延时观测和监测的海洋数据,并发送到系统的文件存储区和处理资料临时存储区,由存储管理系统进行数据的接收、存储和管理。利用用户授权管理将数据分发到数据处理用户的虚拟机中。数据处理用户通过中心内网登录到虚拟机后,开展数据整理、标准化处理工作后,将处理结果按照指定的路径存放。由数据传输系统同步传输到产品制作用户的虚拟机中,用户可开展产品加工制作并将成果按照指定的路径存放。最终由数据交换系统存储到统一的资料存储管理区。ETL处理系统经过数据抽取、清洗、转换等处理,将数据处理结果和产品加载入库,最终经由中心内网和海洋专网为海洋局属单位提供数据共享服务。

3 系统功能实现

系统通过用户唯一入口登录,保证数据安全;开发数据处理系统,完成数据格式化转换;利用ETL处理系统,完成并行数据库的数据处理与调度,包括数据抽取、数据转换与清洗及数据加载;开发数据库检索、数据集检索、文件输出审批和文件导出等应用程序;开发系统运行监控管理系统,对系统的运行环境、数据状况和用户行为进行监控和管理。系统主要功能模块如图3所示。

3.1 数据处理分系统

3.1.1 实时数据处理子系统

根据海洋环境数据观测的采集规范和编码规定,对接收、收集和整合的大量海洋调查、业务化观测/监测等资料,按照资料类型、观测仪器、观测手段、要素内容等特点,开展数据识别、解码、数字化、数据项检查、代码检查等预处理,按照时间、空间和观测资料类型进行排重、排序和初步质量控制,剔除异常数据,依据数据来源、时间、地点等信息对数据文件进行挑选、过滤、分类存放,同时完善和新建相应的海洋环境数据存储标准,对资料进行标准化格式转换。

3.1.2 历史数据处理子系统

系统根据海洋环境数据观测设备性能、仪器订正参数、资料种类、观测要素类型、观测方式、资料时空分布、要素数据经验范围等特点,配置质量控制参数,采用相应的质量控制方法,对各类海洋环境数据进行精细化的计算机自动质量控制和人工审核。质量控制方法包括范围检验、非法码检验、相关检验、季节性检验、一致性检验、着陆点检验、梯度检验、尖峰检验、气候学检验和极值检验等。

3.2 数据库加载分系统

数据库加载系统包括通用数据库加载系统与并行数据库加载系统。通用数据库加载系统是通过加载文件清单的方式进行数据管理,清单文件是对每类数据的特征描述,包括文件类型、文件名、调查机构、绝对路径、备注等信息,通过一条记录就可以确认数据类型并找到数据存储位置。清单文件的组织结构与数据库表结构一致,且加载系统可实现清单列名与数据库列名对应关系的动态调整,清单配置文件设置完成后,单击上传,将清单的记录入库,加载过程中可通过状态条查看加载进度。

并行数据库加载系统先按照数据库结构利用ETL处理系统通过抽取数据文件的相关信息形成库文件,将库文件存放在规定的目录下,并查看库文件的文件表结构,创建相应的数据库表,创建shell脚本并制定源文件和目标文件,最后写入数据库。

3.3 数据查询检索分系统

系统主要分为两大模块:关键字查询和图形化检索。系统界面左侧显示海洋资料体系结构,右侧用于经纬度区域选择地图和查询结果浏览。用户首先在左侧选择相应的航次,然后在右侧地图圈定需求的区域,再输入关键字,查询该区域的特定信息,或查询特定区域的所有信息,或查询所有区域的特定信息,并能够对查询结果进行统计、排序、固定格式表格的导出。

3.4 运行监控管理分系统

通过建立运行环境监控信息数据库,确定数据库中各类监控信息表、监控要素字段、监控状态字段、表关系和数据字典等,实现运行环境监控、数据监控与用户行为监控的实体建设。

3.4.1 运行环境监控与管理子系统

运行环境监控与管理子系统包括硬件环境监控和软件环境监控两部分。硬件环境监控是通过对系统局域网硬件设备运行的日志信息进行提取、分析,实现对服务器、存储阵列、交换机、路由器、防火墙等设备故障诊断、告警等功能。软件环境监控是通过研制各商业软件 (操作系统、数据库软件等)与各业务系统(数据处理软件等)运行日志读取接口,实时读取日志信息并加载运行环境监控信息数据库。

3.4.2 数据资源监控与管理子系统

数据资源监控与管理子系统通过对数据汇集状态实时监控,实现信息反馈、到期告警、汇集情况季报与年报输出等功能,实现对海洋数据处理和质量情况的实时监控和预警、数据处理任务。调度管理;通过提取用户登录日志、数据库与数据集访问日志、数据申请信息进行分析,实现数据的服务内容、服务对象、应用领域情况的实时监控。

3.4.3 用户行为监控与管理子系统

用户行为监控与管理子分系统实时对用户的登录、数据资源访问、外部设备使用、软件安装预警和设备接入等行为进行监控,具有终止用户操作、告警提示、季度分析报告输出等功能,在提供用户方便使用的前提下保障系统的稳定运行。

4 关键技术

根据系统总体功能定位,在已有的工作基础之上,以数据的汇集、处理、存储、管理、服务过程为主线,采用操作系统、数据库、数据管理与共享3层软件体系,集成各类自主研发功能,构建灵活、稳定的架构模式。架构主要基于虚拟化技术、并行处理技术、数据检索并行处理技术与J2EE技术等关键技术。

4.1 虚拟化技术

由于用户对处理器、内存等硬件和操作系统需求不同,用户工作使用的数据处理软件、资料质量控制软件和产品制作软件不尽相同,为满足用户需求,同时提高服务器、存储阵列等资源的利用率,采用服务器虚拟化技术实现满足不同用户需求的虚拟机,同时消除服务器与存储阵列对应用系统的物理局限性。

服务器虚拟化技术是将一个物理服务器虚拟成若干个服务器使用,使得单个物理服务器上可以运行多个虚拟服务器,并对虚拟服务器的硬件资源如处理器、内存、I/O设备等进行配置管理,提供统一的指令集和设备接口。系统利用服务器虚拟化技术可实现多客户操作系统,不同硬件配置与软件环境的虚拟机,根据用户需求分配相应的虚拟机资源,并可对服务器、存储阵列、虚拟机进行统一的配置和管理。

服务器虚拟化是通过虚拟化软件向上提供对硬件设备的抽象和对虚拟服务器的管理,利用CPU虚拟化、内存虚拟化、设备与I/O虚拟化技术对硬件资源进行虚拟化,采用虚拟机实时迁移技术实现动态资源整合。系统选用VMwareESX Server虚拟化软件,实现对硬件的抽象,资源的分配、调度和管理[5,6]。

4.2 并行处理技术

利用高速并行处理引擎,完成多层次海洋数据体系动态更新的ETL(抽取、转换、加载)并行处理,实现整个系统的数据处理与调度,包括数据抽取、数据传输、数据转换与清洗、数据加载以及调度监控。

4.2.1 数据抽取

数据抽取的方式包括:全表刷新、时间戳增量、日志增量和时间戳比较。系统采用时间戳增量方式完成数据的抽取,时间戳增量方式是通过记录时间将增量数据从源数据抽取出来,以附加的方式加载到高速数据存储中,完成源数据中的记录定期更新。时间戳增量方式是在源系统需要抽取的数据表中增加时间戳字段,用以表示数据的修改或新增时间,在数据抽取时通过它来识别和抽取增量数据。

4.2.2 数据转换

由于海洋数据通过调查、汇交、网载等多种手段获取,每种手段来源的数据存在定义不规范、格式不统一等情况,导致系统的源数据存在重复、错误、格式不一等情况。数据转换是将多来源、多调查手段、多要素和多格式的数据进行转换,形成格式统一、实用性强的数据存储层。

4.2.3 数据加载

将业务系统和源数据库层抽取、转换后的数据加载、更新到目标数据库中。根据业务数据的实际情况,对不同业务系统的数据采用不同的加载周期;根据数据的抽取策略以及业务规则确定,采用直接追加、全部覆盖、更新追加等多种方式进行处理。

4.2.4 高速并行调度

利用高速并行ETL调度,按照既定步骤完成数据抽取、转换、加载的全部时间和流程的调度任务。调度的内容包括:从各业务系统到数据层的调度,实现多来源数据的提取、转换和加载;从数据层到数据存储的调度,实现了原始数据、基础数据、产品数据的高速并行存储;从数据存储到应用层的调度,实现数据的并行查询检索[7,8,9]。

5 结束语

【在线数据库系统】推荐阅读：

数据在线监测系统08-12

能源数据在线采集06-13

在线播出系统06-26

在线就业系统07-29

在线评价系统08-17

在线答题系统09-10

在线预警系统09-11

远程在线监测系统05-19

虚拟在线包装系统06-01

环保在线监测系统07-07