数据库选择

2024-05-22

数据库选择（共12篇）

数据库选择篇1

1 简介

随着Word Wide Web的飞速发展, Web中的文本和超链接构成了丰富的网页信息, 同时, Web中出现了越来越多可以访问的在线数据库, 其中蕴含的海量信息可供我们利用。Deep Web数据库选择是建立Deep Web数据集成系统的一个重要组成部分[1]。数据库的发现是指在web中发现可访问的数据库, 是整合的deep web资源的首要工作。由于每个领域中Web数据库的数量都十分巨大, Web数据库选择的主要目的就是如何从一个领域大量的Web数据库中选择出合适的部分Web数据库, 使得在满足特定查询的前提下尽可能少的访问Web数据库并使得查询结果中冗余度足够小, 从而提高信息检索的效率和查询的准确度。

2 Deep Web数据库的选择

Web数据库的选择, 是指为一个给定的用户查询从所有集成的数据库中选择合适的进行查询。数据库的选择有多人在研究, 目前主要方法有:向量空间模型VSM (Vector space model) 法[2], 基于覆盖关系的数据库选择方法[3], 本文采用基于TOP-N查询数据库。

TOP-N查询数据库选择方法的第一步是判断数据库中的数据元组与特定查询之间的不相关度, 不相关度的计算主要是采用了不相关度距离模型计算。第二步根据不相关度距离确定要选择的数据库和数据元组, 主要是从分散的数据库中选择出前个最满意的数据元组及它们所对应的数据库。

2.1 不相关度距离

不相关度距离是指特定查询提交的数据和数据库中相应的数据记录的不相关程度用距离来表示, 不相关度距离越大, 用户提交的查询与数据库中的数据记录越不相关不相关度距离越小, 用户提交的查询与数据库中的数据记录越相关。不相度距离计算包括两种, 一种是数值型不相度距离计算, 另一种是文本型不相度距离计算。

当用户在集成查询接口中提交的属性值是文本型, 就必须采用文本型不相度距离计算, 例如当用户提交书名属性值时, 就用文本型不相关度距离计算。本文给出了文本型不相关度距离模型, 用文本相似度的向量空间模型进行计算。

在该模型中, 文本被表示成向量, (w1, w2 w3, wn) , 其中wi为第i个特征项的权重, 特征项可以是字、词或词组。根据实验结果, 普遍认为选取词作为特征项要优于字和词组。为了体现这个词在文本中的重要程度用词频表示, 词频分为绝对词频和相对词频。绝对词频用词在文本中出现的频率作为权重, 相对词频为归一化的词频, 其计算方法主要运用TF-IDF公式。目前存在多种TF-IDF公式, 一种比较普遍的TF-IDF公式如式1所示。

其中W (c, d) , 为词c在文本d中的权重, 而tf (c, d) 为词c在文本d中的词频, N为训练文本的总数, nc为训练文本集中出现c的文本数, 分母为归一化因子。

根据TF-IDF公式把提交的查询文本q换成文本向量 (wq1, wq2, Wq3, …wqn) 。同样把目标数据记录文本换成文本向量 (wt1, wt2, ….wtn) , 接着采用余弦函数来计算两个向量之间的相似度, 相似度计算公式如式2所示。

假设, qi是一个提交的特定查询Q的一个文本属性值, 它所对应的数据库中数据记录t的文本属性值tj。本文根据大量试验样本发现不相关度距离与上述的文本相似度的向量空间模型存在着一定的关系, 根据这种关系给出了一种基于向量空间模型的不相关度距离计算公式如式3所示。

可以看出, 不相关度距离计算模型是先把文本与查询式描述成空间中的向量, 再定义诸如内积等运算。根据公式可以看出该计算模型中有大量的乘积运算, 因此可能影响了计算速度。但是向量空间模型是传统的文本相似度模型, 该模型己经非常成熟, 所以大家可能容易接受和理解基于向量空间模型的不相关度距离计算模型。

2.2 基于TOP-n查询数据库选择方法

基于TOP-n查询数据库选择方法就是把含有最适合, 最满意的前N条记录元组的数据库选出来。要实现这样的选择方法, 就要先通过上述的不相关度距离公式计算出不相关度距离, 再从中选取距离最短的N个, 既是与用户查询最相关的个结果, 也是令用户最适合, 最满意的个记录元组。这种选择方法分为两步第一步对选择的数据库进行排序, 第二步是按数据库排序好的顺序, 依次比较选出不相关度距离最小的N个记录及相应的数据库。

2.2.1数据库排序

数据库的排序采用最优数据库排序方法, 该排序方法主要先是计算出给定的查询Q和每个待排序数据库的相似度qsmid, 再根据计算出的相似度对这些数据库进行降序排序。本文中的一个数据库对查询Q的相似度是指提交的查询Q与该数据库中的数据记录的最小不相关度距离的倒数。具体的计算公式如公式所示。

其中{d1, d2, …dn}, 是一个数据库中的数据记录元组与提交的查询Q的不相关度距离。本文近似认为对查询Q相似度越高的数据库, 含有的对查询Q的相关度高的记录元组就越多。这样对排序后的数据库进行记录元组的选择节省了时间, 提高了效率和性能。看一个实例, 例如有4个数据库为D1, D2, D3, D4, 它们中记录元组对给定查询Q的不相关度距离分别为{2, 0.8}, {1.2, 0.5}, {2, 2.5}, {3, 2.5}。那么对应的相似度分别为1.25, 4, 0.5, 0.4, 它们的顺序为D2, D1, D3, D4。

3 改进的top-n选择算法

传统TOP-n选择算法是:假设要查询的领域有M个待排序的数据库, 根据前面的数据库排序方法, 对这M个数据库进行排序后的序列为D1, D2, D3…Dm, 经过排序后, 接下来就是从排序好的数据库中选择不相关度最小的N个记录元组。假定N<=M, 那么很容易可以推断出不相关度距离最小的N个记录元组一定在排序好的前个数据库中, 接着从前N个数据库中选出前N个数据库进行记录元组选择即TOP-N记录元组选择。

基于上述问题本文给出了一个新的一记录元组选择算法。该算法的主要思想是设定两个空集合, 一个集合U为是放待选择的记录元组, 一个集合R为是存放已被选出的记录元组。首先从排序好的第一个数据库D1中选出不相关度距离最短的记录元组放入集合R中。取D中的不相关度距离第2小的记录元组和D2中不相关度距离最小的记录元组放入集合U中, 取走U其中不相关度距离最小的放入R中。如果R中的记录元组的个数小于N, 判断刚才从U中取走的这条记录元组是哪个数据库的。如果它是DJ中不相关度距离第K小的, 那么把DJ中的不相关度距离第K+1小的记录元组放入U中, 如果它是DJ的中不相关度距离最小的, 那么把DJ中不相关度距离的第2小的记录放入U中。接着U从中取走中不相关度距离最小的放入R中, 如果R中的记录元组的个数小于N, 继续上述同样的操作, 直到R中记录元组个数等于N为止, 这样集合中的记录元组就是要找的不相关度距离最小的个记录元组。

4 总结

Web数据库选择是数据集成系统中查询处理中的子模块, 所以要想做好查询, 必须选好数据库, 本文介绍了基于Top-N的数据库选择方法, 并提出了一种改进方法。

参考文献

[1]刘伟, 孟小峰, 孟卫一.Deep web数据集成研究综述.计算机学报, 2007, 30 (9) :1475-1489.

[2]段青玲, 杨仁刚, 华松青.基于动态学习的Deep Web数据源选择算法段.郑州大学学报 (理学版) , 2010年3月.

[3]余伟, 李石君, 洪辉, 等.基于覆盖关系的Deep Web数据源排名[J].计算机研究与发展, 2007, 44 (z3) :29-31.

数据库选择篇2

作为一个中小型的公司，在数据库选型方面的做法是我们本次选题非常重视的，陈总也很乐意的和我分享了他们公司在数据库选型方面的一些思路，陈总认为：“由于SP行业对于数据库的吞吐量不像互联网应用要求的那么高，但是我们需要的是数据库的性能比较强劲比较稳定，相对而言，目前Sqlserver也能够满足我们实际应用的需求，我们肯定会想到今后的业务发展，其中包括稳定性等方面的考虑，因此我们会选择Oracle，Oracle是基于Linux方面，因此稳定性要比windows平台会好一些，当然也会有成本上的考虑。Oracle在大型运算的时候某种成本要比SQlserver强一些，所以我们的中心数据库会放在Oracle中，这是我们目前正在做的一个工作。”

我们都知道，做数据库的迁移不是一件很容易的事情，如果做得不好势必会影响到自己的业务，说到数据库迁移时的问题，我们从北京天舟通讯有限公司的一些实际经验中了解到，他们在迁移中也遇到了一些问题。陈总认为：“迁移肯定会遇到问题，而且迁移一般会有两种情况，第一、增量迁移。第二、全量迁移。我们这次的迁移选择的是全量迁移，而且方案和淘宝是很类似的。我们也专门做了一个中间的服务层，让数据从SQLServer慢慢的迁移到Oracle，最后有个时间节点，比如说夜晚一停机的时候所有的数据都会指向新的Oracle。迁移过程中遇到的问题主要有两点：第一个是迁移的速度。我们目前的数据量相对于淘宝来说还是非常少的，也就是有几百G大小的数据量。第二、我们的服务是24小时的。因此服务的短时间迁移是很重要的。要保证数据的一致性，迁移完成之后要进行校验，而且目前有几个方案可供选择，而且还在校验过程中。”

中小型企业数据库选型的建议：中小型企业数据库选择的时候成本的考虑是很重要的，目前我们公司做增值方面的业务，由于和运营商的合作，因此公司在运营投入方面的力度还是很大的。其实我个人觉得我们公司使用MySql是没有问题的，但是我们公司考虑数据库的性能方面要比成本会更重要一些。

对于一些中小型企业来讲，选择Mysql、PCserver，搭几个群集基本上是够用的。而我们就会做好一些的，比如Oracle 的RAC，Oracle的群集，目前就是选择多花一些钱，保证今后用户的增长。

目前我们公司和运营商合作的话，如果发展的好的话，收入是一直保持固定的增长，我们的用户流动性很小，业绩也是一个增量的过程，公司在财力方面还是很宽松的，因此选择数据库也是很注重性能和稳定性。

数据库选择篇3

关键词：高职；数据库；项目导向；任务驱动；教学模式

数据库技术是计算机科学与技术的重要分支，是数据管理的最有效的手段，目前几乎所有应用系统都需要数据库的支持。“数据库及应用”课程是高职计算机类专业学习数据库技术的一门职业技术课程，它担负着为企业培养具有一定的理论知识和数据库设计、数据库应用、数据库管理及维护能力的高等应用型专业技术人才的重任。

随着计算机网络的发展，在网络环境下的各种教学模式的应用也得到发展。网络教学以其资源丰富、共享性、开放性和交互性等特点在课程教学中的应用已越来越广泛。在数据库及应用教学中如何充分利用网络环境，提高教学质量和效果是摆在我们每个教师面前的一个课题。

一、传统教学模式及存在的问题

数据库及应用课程通常采用“教师讲授——教师操作演示——学生练习的传统教学模式进行教学，此教学模式主要存在如下问题：

①学生不能灵活运用知识。教师在讲授举例时，是根据所讲的内容来举一些例子，例子涉及的内容范围较广且零乱，学生学到的只是一个一个的知识点，没有一个完整的概念。所以，学生不能融会贯通、灵活地在实际中运用所学知识。②没有充分发挥网络优势。在教学中虽然引入了计算机网络，但主要是用于演示型的辅助教学。③教学的基本特点是以教师为中心。在此模式下，课堂完全由教师主宰，学生只是被灌输知识的对象，学生的任务就是消化、理解老师讲授的内容，完全忽视了学生的主观能动性和创造性思维。

二、“项目导向、任务驱动”教学模式

“数据库及应用”是一门实践性较强的课程，通过多年的教学实践，我们在此课程的教学中采用了“项目导向、任务驱动”教学模式，这是一种以“教师为主导、学生为主体”的教学模式，收到了比较好的学习效果。

“项目导向、任务驱动”模式是以真实的项目作为整个教学的主线，将项目中的典型性工作任务提取出来，将工作任务合理有序化后，对每一项工作任务分析所涉及的相关知识、技能和职业素质，将理论知识分散到项目的任务中。教师的教学始终围绕着项目展开，以任务为驱动，逐级深化，构成一个由浅入深的知识学习与技能训练有机结合的体系。学生的知识学习紧扣任务要求，在完成任务的同时来提高学生的主动意识和自主学习的能力。

三、教学具体实施

1.项目的选择。实施“项目导向、任务驱动”教学，项目的选择是成功的关键。根据本课程的特点和学生的实际情况，本课程选择“学生成绩管理系统”、“图书管理系统”和一个自选数据库项目作为教学项目。一个用于教师示范讲解，即示范项目，另一个用于学生实训操作，即实训项目，第三个用于学生实习训练，即实战项目。在选取项目时，主要从这样二个方面考虑：一是所选择的项目既要与书本知识紧密结合，又要有一定的探索空间。二是所选的项目要以学生为本，选择一些学生比较熟悉的贴近实际生活的项目，这样容易被学生理解和接收，可以减小学生学习的难度和压力。

2.任务的设计。本课程将项目分成4个学习情境，即数据库设计、数据库实现、数据库应用、数据库管理和维护。每一个学习情境就是一个独立的工作任务，再将每一个工作任务分解成若干个教学任务，教学任务的设计应遵循如下原则：

（1）紧扣教学目标。教学目标是教学活动实施中应达到的学习标准，教师的教与学生的学都是围绕教学目标来实施的。所以，在设计任务时要紧扣教学目标，使得学生在完成任务的同时能达到教学目标。

（2）贴近实际生活。任务的设计应与实际生活联系起来，用生活情境来激发兴趣，使学生迅速而正确地理解教学内容。

（3）精心设计情境。“学起于思，思源于疑。”课堂上，学生并不是对所有的问题都感兴趣，只有精心设计问题情境，才能充分调动学生学习的积极性和主动性。

（4）留有探索空间。任务设计要注意留给学生一定的独立思考和探索的空间，充分发挥学生的主观能动性，培养他们的创造性思维。

（5）强调综合性。任务的编排不能仅限于某个知识点，要具有综合性，便于对学生综合能力的培养。对于主要知识点要在不同的任务中多次反复出现，让学生对知识的理解、认识、运用有一个逐步深入的过程。

3.教学内容的整合、序化。以行业企业发展需要和完成职业岗位实际工作任务为依据，整合、序化教学内容。在选取课程内容时，实行“理论够用，注重实践”的方针，既注意基础理论的讲解，以给后续课程的教学提供便利，同时也重点针对企业发展需要和完成职业岗位实际任务所需的知识、技能、素质来合理选取、组织教学内容。

4.教学的组织。本课程所有的教学都安排在一体化实训室进行，学生人手一台计算机，实施课堂与实习地点一体化、理论与实践教学一体化。在教学中以真实的数据库项目贯穿整个教学全过程，课程内容的安排围绕项目中任务的完成而展开。在课程具体实施过程中，首先实施的是示范项目，这是一个贯穿整个教学全过程的项目；实训项目安排在示范项目每个学习情境完成后同步实施；实战项目安排在前二个项目学习结束后与数据库应用系统前台实现语言相结合进行实施。具体进行教学组织时，每个任务按照：任务描述-任务分析-方案设计-方案实施-知识小结-拓展思考六步教学法进行实施。

示范项目以“学生成绩管理系统”数据库项目为主线，以完成项目开发的典型工作任务为中心，教师将所要讲解的知识融入到完成任务的过程中，由浅入深，循序渐进。任务完成过程就是工作过程，也是知识的学习和掌握过程。

实训项目以“图书管理系统”数据库项目为主线进行的，实训项目的知识点与示范项目基本对应，从而巩固学生所学知识，提高学生的实践技能，加强学生对不同数据库应用系统的认识与应用能力。

实战项目主要是与数据库应用系统开发前台语言课程进行整合学习的一个项目（如与面向对象程序设计课程整合），具体的项目内容是由学生自主选择，所有的项目规划及工作任务的划分均由学生自己完成。实战项目主要是为了开阔学生的思路、运用所学知识，完成一个综合项目的开发，培养学生分析问题、解决问题和团结协作的能力。

5.多种教学方法的运用。“教无定法，贵在得法。”本课程在教学中灵活运用多种教学方法，如项目导向、任务驱动教学法、三结合教学法、小组讨论教学法、引导文教学法和实践教学法等等，提高学生的学习兴趣，培养学生独立思考和自主学习能力。

三个数据库项目因教学目标、教学特点不同采用不同的教学方法。示范项目，主要采用“三结合”教学法。教师边讲解边示范，学生边观摩思考，边动手实践——教、学、做一体，学习的过程即是实践的过程，理论学习与实践操作有机融合；实训项目，主要采用引导文教学法。通过为学生提供详细的引导文，并采用教师辅导的方式辅助学生完成学习任务；实战项目主要采用项目教学法，将数据库开发项目交给学生，由学生在没有教师辅助、没有现成的参考资料的前提下独立完成项目的设计和实现。

6.网络平台的利用。教学中，除了可以利用学院图书馆的书籍与资料作为扩充性资料外，还可以充分利用网络平台为教学服务。

（1）利用多媒体辅助教学系统。在教学过程中，教师通过使用多媒体辅助教学系统能有效地控制教学的各个环节，如教师进行任务布置、演示；组织分组讨论；学生提交完成的任务等，大大提高了课堂的教学效果。

（2）利用制作的多媒体课件。教学中使用制作的多媒体课件辅助教学，利用图、文、声、像将一些抽象的内容形象化，使课堂形式丰富多彩，有利于学生理解和掌握知识。

（3）使用网络通信工具。通过电子邮件、QQ等网络通信工具，使学生与学生之间，教师与学生之间的交流更加广泛，不再受到时空的限制。

（4）建立网络学习资源库。建立一个本课程的网络学习资源库，它包括电子教案、多媒体课件、实训指导，课程视频动画、疑难问题查询、案例库、试题库和网络课程资料等。向学生提供丰富的学习资源，为学生开展自主学习和协作学习创造有利条件。

7.教学评价。课程考核作为课程教学的有机组成部分，是评价学生学习效果和教师教学质量的重要手段。在整个课程的教学过程中，实施“知识、技能、素质”三位一体的综合评价。采取教师评价和学生互评相结合、过程评价和结果评价相结合、技术知识评价和实践技能评价相结合。知识方面成绩占30%，成绩来自笔试，主要考查学生对数据库基础知识掌握的情况；技能方面成绩占50%，成绩来自学生平时的上機操作考核和完成实训、实战项目的质量，主要考查学生的实际操作能力和解决问题的能力；素质方面占20%，成绩来自实训和实战项目的完成情况，主要考查学生数据库设计应用能力、收集整理资料能力和沟通协作能力。

四、结束语

采用“项目导向，任务驱动”教学模式进行数据库教学，教学过程中以真实的数据库项目为导向，在教师精心设计的任务驱动下，激发了学生的学习欲望，充分调动了学生学习的积极性，培养了学生自主学习和协作交流的意识，提高了学生发现问题、分析问题和解决问题的能力。

参考文献：

[1]刘静.“项目驱动”教学法在SQL Server数据库技术课程教学中的应用[J].渤海大学学报（自然科学版），2009，30（4）.

[2]裴大容.高职《数据库原理与应用》课程的教学改革探索[J].福建电脑，2010，（7）.

[3]张红.网络环境下“任务驱动”教学的探讨[J].电化教育研究，2004，（6）.

医学数据库的选择和利用篇4

随着信息社会的发展, 计算机技术、多媒体技术与网络通讯技术的涌入, 我们所处的时代走进了“知识爆炸”时代, 世界知识总量十年翻一番, 在生化、电子、宇航等科学领域内, 二到三年就翻一番[1]

知识的急剧增长和知识废旧率加快, 使得知识生产周期缩短, 知识生产的前期, 即课题的检索、调研时间已大为缩短, 目前最先进的图书情报系统, 平均每10分钟就可以完成一个课题的检索。知识生产的后期, 即知识鉴别和出版的速度也在随着科技的发展在缩短, 国际上论文发表平均为周期为6~8个月, 我国科技期刊论文的发表周期平均为14.1个月。[2]

知识生产周期的缩短, 使得文献发表速度急剧增加。其中期刊以时效性强, 信息量大而在各种信息源中具有较大的优势。全世界共有医学期刊2万种。据统计65%~75%的医学信息来源于医学期刊。

期刊种类的不断增加以及读者对文献信息资源需求的不断增加, 形成了图书馆与读者之间的供需矛盾, 手工检索工具应运而生, 但仅仅靠手工检索已经满足不了科研工作者的需求, 电子资源的出现和发展, 知识的获取变得相当的便捷。尤其为医学学术研究的现代化提供了种种便利, 可随时了解国际国内最新的医学信息, 有效的利用医学数据库资源为学习、教学、科研等服务, 加快密切的区域和国际合作、开展广泛的信息交流。如何更好的选择和利用好医学数据库, 越发的显得重要。

1 数据库的选择和利用

1.1 国外数据库的选择和利用

国际重要外文数据库包括MEDLINE数据库、PUBMED网络数据库、OVID、EBSCO等.其中MEDLINE为题录数据库, OVID、EBSCO、Springerlink为全文数据库。

MEDLINE作为美国国立医学图书馆 (NLM) 生产的国际性综合生物医学信息书目数据库, 是当前国际上最权威的生物医学文献数据库。在外文的数据库中, MEDLINE数据库已经逐渐成为必检的数据库。建议牙科和护理专业的科研工作者选择使用该数据库, 因库中除了美国《医学索引》的全部内容, 还包括有《牙科文献索引》、《国际护理索引》的部分内容, 涉及临床医学、基础医学、环境医学、营养卫生、药理和药剂学、卫生管理、医学保健和情报科学等领域。创刊于1879年是世界最最具权威性的医学文献检索数据库, 其报道的文献量大、质量高;检索功能很齐全, 标引的质量也高, 响应速度快兼容性较强, 可以随机使用[3]。因涉及的语种达到43个语种, 并且覆盖了70多个国家和地区, 且是以英文刊物为主体, 故在国内外都具有极高的使用率。

没有购买MEDLINE数据库的医学院校, 通常会链接一个PubMed网络数据库, 它是由美国国立医学图书馆 (NLM) 所属的美国生物技术信息中心 (NCBI) 开发研制的网络文献检索系统。在网上以www方式向用户提供的一项免费检索数据库服务。由于PubMed数据库中, 每天都收录新文献, 所以它的报道速度比MEDLINE更快, 更新。且Pubmed题录文摘完全开放。[4]Pubmed数据来源有三个方面, MEDLINE数据库, PREMEDLINE数据库和由出版商提供的电子文献。因其内容涵盖范围的广泛, 检索界面的方便实用, 以及题录完全免费, 并可以下载部分全文。受到广大医学爱好者的好评。医学科研工作者可定期在该平台使用主题检索的方法, 了解当今世界上最新的医学信息。

1.2 国内数据库的选择和利用

国内重要的数据库主要包括维普数据库、万方系列数据库、中文生物医学文献光盘数据库、中国期刊网全文数据库, 超星medalink等。

对需要中华类核心期刊文章的读者, 可把万方数据库作为首选数据库, 因其对中华类期刊有独家版权。中华类的期刊在别的数据库中无法查询到。

中文生物医学文献数据库 (简称CBMdisc) , 是国内应用最为广泛的文摘数据库, 其检索界面模拟Medline, 使用非常便捷, 现在改版为网络版本, 题录的检索和下载功能较好, 收录了1978年以来1600多种中国生物医学期刊, 以及汇编、会议论文的文献题录, 是我国最早成功开发的医学文献数据库之一, 学科覆盖范围与medline相似, 信息容量大传递速度快, 对于医护工作者掌握本学科动态、进行查新前检索和医学信息专业人员进行科技查新检索具有重要的参考价值。

中国期刊网全文数据库 (CJFD) , 是目前世界上最大的连续动态更新的中国期刊全文数据库, 内容覆盖自然科学、工程技术、等各个领域, 因学科范围比较广泛, 也叫做“同方全库”。对研究交叉学科的读者, 建议选择并使用该库。并且由于该库的检索界面非常的人性化, 可根据自己的需求查找所需资源, 比如期刊检索、基金检索等, 对科研工作者提供了很多的有效工具。

超星medalink作为一个非常实用的平台, 重点向所有科研工作者推荐, 他的一站式检索, 解决了读者一个一个数据库去查找资料的困扰, 如果本地有资源, 可直接下载, 本地没有购买的资源, 可以通过自助式的远程传递的方式实用该资源, 非常的快捷方便。

参考文献

[1]埃德加·富尔.学会生存[M].

[2]张惠民.中国科技期刊:亟需打造国际品牌[N].光明日报.

[3]孙思琴, 韩丰谈.四个国内外医学数据库检索功能的比较研[J].现代情报, 2003 (11) :58, 62.

数据库选择篇5

Gartner最近的分析显示，关系数据库市场中，IBM占有34.1%的份额，高于Oracle的33.7%居第一。

2. DB2 UDB性能卓越，过去五年Benchmark的结果表明DB2 UDB性价比在业界保持领先地位，在总体价格相同的情况下，基于DB2的系统，可以提供更好的性能；

3. DB2 UDB致力于技术创新，提供给广大用户一个易于管理、易于开发、易于发展的信息基础平台，总体使用成本更低，保证客户投资回报；

DB2在获得132项技术专利，是数据库领域内获得技术专利最多的，30多年来，从理论研究到具体的系统实现，IBM研究人员对数据库管理系统的发展作出了极大的贡献，IBM在信息管理领域的专利超过260项，远远大于其它竞争对手的总和，

4. DB2 UDB在全国建立了7个合作伙伴技术支持中心，致力于为ISV创建一个健康成长的合作环境，吸引了越来越多的行业应用合作伙伴的加入；

数据库选择篇6

[关键词] 发展中国家；药品；实验数据；选择

[中图分类号] D993-9 [文献标识码] A [文章编号] 1002-2007（2015）01-0094-06

[收稿日期] 2014-09-25

[作者简介] 1景明浩，男，朝鲜族，吉林大学法学院国际法博士研究生，延边大学法学院讲师，研究方向为国际经济法、国际私法。（长春 130012） 2那力，女，满族，吉林大学法学院教授，博士，博士生导师，研究方向为国际经济法、国际税法。（长春 130012）

根据《与贸易有关的知识产权协议》（以下称TRIPS协议）的规定，成员方有义务对使用新型化学物质生产的药品或农用化学品提供数据保护。据此，药品实验数据保护与药品专利保护成为药品保护并行不悖的有力武器，两者以不同模式保护着专利药品的市场占有。药品研发公司对药品实验数据保护有强烈诉求，为保证药品的安全性、有效性以及质量，一项新药在投放市场前需进行大量的临床前试验、临床试验及毒理性试验等一系列测试，药品研发公司在这个过程中需要投入大量的时间和金钱。通过药品实验数据保护，原研公司获得实验数据保护的独占期，延迟了仿制药品（generic drug）进入市场的时间，能够最大程度地收回研发中的投入并获得可观利润。但是，我们不得不考虑的是，世界上大部分发展中国家及最不发达国家存在严重的公共健康危机，数以千万计的低收入患者饱受疟疾、结核病及艾滋病等传染性疾病的侵扰，仿制药品保障了上述低收入患者的药品可得。药品实验数据的保护方式、保护期限等问题决定了低收入患者的仿制药品获得，也直接决定了发展中国家公共健康问题的解决。在TRIPS协议对实验数据保护具体规定不甚明确的情况下，发展中国家成员方如何对待药品实验数据保护，将直接影响本国公共健康问题的解决以及全球公共健康的保护。

一、药品实验数据保护的国际法规定药品实验数据保护制度起源于美国1984年通过的《药品价格竞争和专利期恢复法》（也称Hatch-Waxman Act），该法案充分考虑到药物有效性与安全性数据的获得需要进行长期的临床试验以及投入大量的时间与金钱。为平衡创新与仿制、药品专利保护与可及性、医药产业发展与人民健康水平提高之间的关系和矛盾，该法案中首次明确提出了药品“数据保护”。[1]（5）有学者提出，药品实验数据保护的国际法规定最早可追溯至《保护工业产权巴黎公约》（简称《巴黎公约》），认为TRIPS协议第三十九条第三款与《巴黎公约》第十条之二存在一定的关联性。[2]（7）但最早明确规定药品实验数据保护内容的国际协定当属TRIPS协议第三十九条第三款，其要求成员国对提交至监管机构的药品及农用化学品的实验数据提供保护。

（一）《巴黎公约》第十条之二的规定

《巴黎公约》第十条之二第一次尝试在国际层面上保护商业秘密，其具体规定为：本联盟国家有义务对各国国民保证给予制止不正当竞争的有效保护，即凡在工商业事务中违反诚实的习惯做法的竞争行为所构成的不正当竞争行为。

同时该条还特别规定下列各项应予以禁止：（1）具有不择手段地对竞争者的营业所、商品或工商业活动造成混乱性质的一切行为；（2）在经营商业中，具有损害竞争者的营业所、商品或工商业活动商誉性质的虚伪说法；（3）在经营商业中使用会使公众对商品的性质、制造方法、特点、用途或数量易于产生误解的表示或说法。See Paris Convention for The Protection of Industrial Property.依据普通法的原则，该公约要求成员国从非正当商业利用的角度保护商业秘密。虽然公约中没有明确要求成员国对提交到一国监管机构的实验数据进行保护，但是一些国家依据普通法的解释原则认为，这一规定完全可以延伸到实验数据保护中来。一些国家在实验数据保护的实践中也确实援用了这一规定中的反不正当竞争保护模式。

（二）TRIPS协议第三十九条第三款之规定

“当成员方要求提交未披露过的实验数据或其他数据，以作为同意使用新型化学物质生产的药品或农用化学品在市场上销售的一项条件时，应保护该数据免受不公平的商业利用。此外，成员方应保护该数据免于泄露，除非是出于保护公共利益的需要，或采取了保证该数据免受不公平商业利用的措施。”依据上述规定，在一定条件下，TRIPS协议要求WTO成员方防止对提交至监管机构的实验数据进行非授权披露和不正当的商业利用。

依据规定，实验数据必须得到保护以防止被：1.disclosure（披露）。这是一个简单的义务，监管机构未经批准不能披露提交的测试数据。然而，监管机构出于保护公共健康的目的或能够确保不被用作不正当的商业利用时可以使用相关数据。2.unfair commercial use（不正当的商业利用）。TRIPS协议没有明确“不正当商业利用”的定义，也没有规定这一保护实现的确切方式。因此，对于这一问题的明确要求存在不同的观点和实践。有观点认为，确保这一保护的最为有效的方式是给予原研公司合理的数据独占期。在实验数据独占体制下，在一定的年限内，监管部门将会无法依靠原研公司提交的数据，通过为仿制者提供与原研产品相同或相似的生物等效性数据，为以后该产品的仿制药品提供便利。也有观点反对对药品实验数据提供这样的独占期，提出以其他形式防止不正当的商业使用。在乌拉圭回合谈判期间，实验数据独占保护作为TRIPS协议明确义务进行了讨论，但谈判方采纳了当前第三十九条第三款中一般性措辞的表述方式。

通过上述对TRIPS协议第三十九条第三款的分析，笔者认为，适用于实验数据保护需要满足的特定条件包括：1.非公开数据。第三十九条第三款只要求对非公开数据的保护，对已公开的信息不保护。如果数据已被披露，例如，在科学杂志、专利文件或以其他形式被公开，则没有继续保护的必要。2.一国要求提交实验数据保护。没有要求提交实验数据，而是以自己的方式保护医药产品的国家没有义务对相关产品提供实验数据保护。保护数据的义务仅针对那些规定了通过提供数据作为批准市场准入条件的那些国家。3.申报批准上市的“新化学实体”。TRIPS协议中的实验数据仅涉及申请批准上市的“新化学实体”。这一项在TRIPS协议中没有进一步明确规定，WTO也没有规定其范围。4.数据的产生需满足“相当努力”。TRIPS协议没有明确这一努力的本质，也就是说，不管是在技术上还是在经济上的努力，协议中都没有明确要求申请人需证明做出了这样的努力。

二、药品实验数据保护的成员方义务

TRIPS协议第三十九条第三款明确规定成员方有义务对药品实验数据提供保护，但对于保护方式即药品实验数据保护的最低标准，协议中并没有提及。出于对TRIPS协议第三十九条第三款的不同理解，对药品实验数据保护主要有两种不同的模式，即数据独占保护模式与反不正当竞争保护模式。数据独占保护模式主要是规定监管机构在一定时间内不可以依赖原研公司提交的数据批准潜在的仿制药品进入市场，直接延迟仿制药进入市场的时间。而反不正当竞争保护模式则是调整向第三方披露商业秘密的问题，其对药品实验数据的保护力度明显宽松，而这正是TRIPS协议第三十九条第三款和第二款的主要内容。在TRIPS协议谈判过程中，成员方对实验数据保护的最低标准一直存在争议，这也是实践中各成员方选择不同保护模式的主要原因。

值得注意的是，TRIPS协议第三十九条作为一个整体构成了协定中“未披露信息保护”这一部分，其中全面规定了保护商业秘密的内容。协议第三十九条第二款是关于成员国保护商业秘密义务的一般条款。第三十九条第三款是一项特别的规定，一旦成员国政府或相关机构要求将相关数据提交至上述机构以作为产品投放市场的条件，成员方政府应对这些商业秘密数据提供保护。

协议第三十九条第三款指明了成员方政府的三项基本义务：1.保护“新化学实体”的相关数据，这些数据是通过相关努力获得的，防止非正当的商业使用。2.保护该数据免于泄露，除非是为了保护公共利益的需要。3.保护该数据免于泄露，除非采取了保证该数据免受不公平商业使用的措施。

第一项义务是关于保护提交至监管机构的数据以防止非正当商业使用的简单规定，其中没有对保护期限进行明确规定。对非正当商业使用可以进行不同的解释，包括政府本身出于商业目的使用这些数据，或者不同形式的非诚实的商业行为。

第二项和第三项义务关注了成员方保护数据以防止向第三方泄露的义务，但也说明了一定的例外情况。虽然在第三十九条第三款的一般性措辞中没有对何时披露属于例外情况进行澄清，但关键的一点是协定提出了这样的假设，在规定的例外情况出现时，成员方可以将相关数据披露给第三方。此外，没有关于时间限制方面的任何明确规定。防止信息泄露的主要目的是避免非正当的商业使用。第三项义务中明确指出，在确保披露的数据不被用来进行非正当商业使用的情况下，这种数据披露是可以被接受的。

有学者提出，TRIPS协议第三十九条中的“数据保护”指的是对非披露信息或商业秘密的保护。第三十九条第三款没有创设一项新的知识产权，也不是一项用以防止监管机构依赖原研公司提交的数据批准等效产品的权益，除非这涉及到非正当的商业使用。这一条款是商业秘密和非正当商业使用相关法律规范的结合，而不是为实验数据而创设的一项新的知识产权。

然而，工业团体和一些发达国家对此有不同的观点，如美国和欧盟提出，第三十九条第三款要求成员方设立“数据独占”机制，这是一种有明确时间限制的知识产权保护形式。而美国和欧盟中的一些国家，对于药品和农用化学品的数据独占保护制度在TRIPS协议之前就已经被适用了。研发公司在药品被批准之后获得了5年的市场独占保护期，在此期间，药品监管机构不能依赖原研公司提交的数据批准其它公司的等效药品入市，除非获得原研公司的同意。在独占期间，监管机构不能依赖研发公司的数据批准仿制药品，即便仿制药品能够证明与新药具有同样的化学成份和效用。欧盟当前提供了更长的数据独占保护期，药品的实验数据保护长达10年。

TRIPS协议虽然明确提出各成员国有义务对实验数据进行保护，但其中规定的模糊性为各成员方采用何种方式进行保护提供了选择空间。由此，成员方完全有权利和能力选择适用数据独占的方式或是反不正当竞争的方式来保护药品实验数据，各成员方在实验数据保护模式选择方面应充分考虑本国的实际情况以及公共健康保护需求。此外，由于TRIPS协议对“新化学实体”、“相当努力”等概念没有进一步的解释，WTO成员方特别是发展中国家及最不发达国家应设立符合本国实际的实验数据保护制度，而不能盲目跟从发达国家的保护标准。

三、药品实验数据独占保护与公共健康公共健康问题在当今世界已经成为全球性的问题与挑战。许多发展中国家正面临着严重的公共健康问题，每年有上千万人死于艾滋病、肺结核、疟疾等疾病，而非典、禽流感等新型传染病还在不断出现，威胁着人们的健康与生命。然而，我们面临的情况是：这些解决公共健康疾病的药品主要由发达国家的跨国公司生产，并处在知识产权国际保护体系的庇护之下，包括专利保护与药品实验数据保护。这使药品的价格非常昂贵，大多数患者支付不起，这就产生了药品的普遍可得性问题。

药品实验数据独占保护在一定程度上可以促进公共健康保护，能够为药品研发公司在新药研发过程中进行的时间与资金方面的投入提供额外的奖励，这会激励研发公司投入更多的精力研制新药。实验数据独占保护使得研发公司丰富了原研药的使用，一些药品的新剂型、新方法也可以获得数据保护，这是专利保护无法做到的。数据独占保护也为原研药开发公司收回研发过程中的投入提供了额外的机会，对于专利已经到期、专利剩余期限所剩无几或者根本没有申请专利的这些药品，研发公司通过独占保护获得了额外的市场排他期，从某种意义来说，这一机制延长了专利的保护期。有学者提出，数据独占保护为发展中国家的国内创新带来好处，激励了已知非专利药品新用法的研发，并激励原研公司将更多的药品引入到发展中国家，而事实上，独占保护将阻碍仿制药品的竞争。[3]

由于受制于技术及资金等多方面因素的影响，发展中国家及最不发达国家新药研发的能力非常有限，或者根本不具备新药研发能力，以致数据独占保护为发展中国家带来的益处也非常有限。在这一背景下，数据独占保护无法使发展中国家制药公司通过提高研发投入获益，即使潜在的研发上的收益也由于这些公司在新药市场上的有限占有率而变得微乎其微。然而，数据独占将允许原研药品获得额外的市场排他权，这将相应地延迟仿制药品进入市场的时间，即推迟了仿制药品获得的时间，这阻碍了发展中国家降低药品费用的可能，并持续保持医疗卫生的高成本。笔者认为，实验数据独占保护机制的间接受害者是发展中国家众多的低收入患者。由于无力承担专利药品高昂的治疗费用，低收入患者更多地依赖药价低廉的仿制药品，而数据独占保护制度延迟了仿制药品投入市场的时间，这极大地侵害了众多患者的药物可得及发展中国家的公共健康保护。

数据独占保护制度同样影响着发展中国家的仿制药产业发展。出于历史或其它原因，很多新药在一些国家并没有获得专利保护，数据独占保护似乎对这些国家的影响最大，因为这些新药可以通过数据独占保护获得一定时间的市场排他权。在一些发展中国家有大量的药品没有获得专利权，即便这类药品在发达国家已经获得专利。如印度于2013年4月通过最高法院作出判决，认定诺华公司提出申请的抗癌药物格列卫不能在印度获得专利权，理由是该药物是已知药品的新形式，而格列卫已在世界上四十多个国家获得专利保护。这种情况在发展中国家并不稀奇，因为很多发展中国家为了履行国际义务而对本国专利法依据TRIPS协议进行了修订（如印度就在2005年，即TRIPS协议允许的过渡期结束时实施了新的专利法）。印度缺乏强有力的专利保护，即便在2005年后其对专利法进行了修订，但还是有大量产品由于各种原因不能获得专利，这就可以理解为什么国际制药企业会付出如此巨大的努力期望在印度获得数据独占保护。相比之下，印度本国制药企业由于研发能力弱，生产的药品大部分为仿制药品，所以它更希望适用相对较弱的反不正当竞争保护机制。

四、发展中国家药品实验数据保护的应然选择 TRIPS协议第三十九条第三款要求成员方对药品实验数据提供保护，无论发达国家抑或发展中国家，即便是最不发达国家也应在即将到来的过渡期满后对实验数据提供保护。然而，TRIPS协议对实验数据的保护模式、保护期限规定并不明确，对“新化学实体”、“非正当商业使用”、“非披露信息”等概念没有进一步的说明。因此，发展中国家在履行TRIPS协议义务对药品实验数据进行保护时，应充分考虑本国公共的健康状况，特别是存在严重公共健康危机的印度及非洲等一些最不发达国家，更应以保护本国民众的公共利益为出发点，充分利用第三十九条第三款的灵活规定，制定切合本国实际的实验数据保护制度。

（一）选择反不正当竞争保护模式

反不正当竞争保护模式，是指将不正当的商业使用解释为以违背诚实商业行为的方式，包括政府管理机构并非出于公共利益的需要或未采取保护措施而将此数据披露给第三方，以使其获得竞争优势，例如以违约、欺诈、泄密等方式获得实验数据并用于上市申请。[4]（133）这一模式符合TRIPS协议规定的最低保护要求。

关于在TRIPS协议项下对实验数据提供保护的不同理解反映于各国的立法实践中，即各国对实验数据适用了不同的保护模式。大多数发达国家和一些发展中国家适用了数据独占保护机制，药品研发公司不仅具有实验数据的独占期，同时还具有市场排他期，第三方在未经原研公司允许下不能在独占期内提出仿制药品入市的申请。这一模式通常会被授予独占权5年到10年不等的固定期，还附带有特定情况下的延长期。这一固定期通常始于原研药物被批准投入市场之日。一些世贸组织成员国，如欧盟、美国对新适应症和新配方的药物会提供额外的期限。

另外的一些国家，如印度和其他发展中国家，对实验数据保护采用了反不正当竞争的保护模式。为了履行TRIPS协议义务，其规定限制行政审批机构或授予第三方将这些数据用于非正当的商业使用。然而，他们没有禁止行政审批机构依赖原研发公司提交的测试数据对其后申请的仿制药品进行生物等效性的比较，仿制药申请者无需提供证明仿制药安全性及有效性数据，只要能够证明其与原研药物具有生物等效性即可。此外，这些国家没有实验数据独占保护期的规定，仿制药生产企业可随时提出仿制药品申请，以获得批准并投入市场。

对于当前药品研发能力较弱、技术及资金实力有限、公共健康问题较为严重的广大发展中国家来说，反不正当竞争的保护模式无疑是更为适合的。这一模式最大程度地利用了TRIPS协议的灵活性，强调原研药数据不能成为仿制药品竞争的障碍，促进仿制药品尽快投入市场，有利于发展中国家廉价药品可得性问题的解决。

（二）规定强制许可涵盖药品实验数据

强制许可，是指当一国出现紧急情况或公共健康危机时，一国政府可不经专利权人同意，直接批准其他第三方实施其专利的一种许可方式，但被许可方应向专利权人交纳一定的使用费用。TRIPS协议规定成员方有权利根据本国实际情况实施专利的强制许可，但是规定过于笼统，对于强制许可的标准及具体措施没有进一步明确。《TRIPS协议与公共健康多哈宣言》（以下简称《宣言》）规定，TRIPS协议“可以并且应当以支持WTO成员国行使保护公共健康，尤其是促进人人获得药物权利的方式，进行解释和执行。”《宣言》进一步指出：“WTO成员国有权为此目的（保护公共健康）而用尽TRIPS协议所提供的弹性规则。”

TRIPS协议及《宣言》并未明确提及强制许可与实验数据之间的关系，那么，一国政府在遇到特定情况对专利药品批准强制许可时，是否能够要求披露提交至监管机构的实验数据？TRIPS协议并未明确成员方对药品实验数据的保护方式，各国通常出于政治优先性考虑来制定本国的保护模式。但即便是主张数据独占保护的一些发达国家也认为，强制许可应构成实验数据保护的例外。如果适用数据独占保护，实验数据保护将妨碍专利强制许可的实施，包括《多哈宣言》第六段规定的一国被要求审批进行出口的情况。加拿大和欧盟法律规定，放弃基于《多哈宣言》第六段规定中的生产产品数据保护；智利对于批准强制许可的任何产品都不提供数据独占保护；然而美国在与其它国家签署的自由贸易协定中却做出了不同规定，其要求即使在构成国家紧急状态的情况下，缔约方对某专利实施强制许可时，也无权要求专利持有人提供与该专利有关的披露信息或专有技术。参见SFTA第16.7.6条，AFTA第19.9.7条。

强制许可是成员方利用TRIPS协议灵活条款保护本国公共健康的有力武器。发展中国家在规定强制许可制度时，不仅应要求专利权人转让专有技术，同时应要求专利权人附有披露提交至监管机构的药品实验数据。如果强制许可中排除临床实验过程中生成的实验数据，对于被许可人来说专利价值会大打折扣。

（三）谨防TRIPS—plus条款的附加义务

近年来，国际知识产权保护领域出现了新的现象，美国及欧盟等发达国家通过跨国投资及技术转让为诱惑，迫使发展中国家签署自由贸易协定（以下简称FTAs），在协定中要求签署方提供更高的知识产权保护标准。由于FTAs条款超过了TRIPS协议的最低保护要求，被称为TRIPS—plus条款。TRIPS—plus条款对药品实验数据保护同样产生影响，由于TRIPS协议未明确要求成员方对实验数据的保护方式，以致美国等发达国家通过FTAs通常要求与之缔约的发展中国家采用数据独占保护模式，提高TRIPS协议的最低保护要求。至2013年1月1日为止，美国与20个国家签署生效的FTAs，其中除澳大利亚、加拿大、以色列外，全部为发展中国家。[5]（129）美国签署的大部分FTAs均要求采用数据独占的保护模式，即便与TRIPS协议保护模式最为相近的北美自由贸易协定，也明确规定提供5年的保护期。从保护内容来看，几乎所有美国签订的FTAs都不允许将递交至监管机构的证明药品安全性、有效性信息作为批准第三方申请的依据，也不得依赖原始申请人已获上市许可的证据来作出审查决定。

对于广大发展中国家来说，药品实验数据保护采用何种保护模式及保护内容直接决定了本国仿制药产业发展及本国民众低廉仿制药品的获得。因此，发展中国家在签署FTAs应持审慎态度，充分考虑本国公共健康状况，以本国民众健康利益保护为出发点，制定切合本国实际的药品实验数据保护立法。

药品实验数据保护有助于保障药物安全性、有效性及质量要求，能够满足患者获得安全保障药物的诉求。由于TRIPS协议对药品实验数据保护的灵活性规定，发展中国家应制定符合本国国情的实验数据保护模式，当出现紧急情况批准强制许可时，其内容应涵盖实验数据信息。特别是在美国、欧盟等发达国家通过TRIPS—plus条款提高签署国知识产权保护标准的新形势下，发展中国家应持审慎态度，多方面权衡，切实保障本国民众的公共健康利益。

参考文献：

[1]陈兵：《药品实验数据保护制度比较研究》，北京：中国医药科技出版社，2013年。

[2]褚童：《TRIPS未披露实验数据保护的反不正当竞争保护——以TRIPS与<巴黎公约>相关条款为中心》，《兰州大学学报》，2013年第6期。

[3]Charles clift.Data Protection and Data Exclusirity in Parmaceuticals and Agrochemicals.http：//www.iphandbook.org/handbook/ch04/p09

[4]冯洁涵：《TRIPS协议下对药品实验数据的保护及限制——以国际法和比较法为视角》，《武大国际法评论》（第十一卷）。

[5]梁文志：《美国自由贸易协定中药品TRIPS——plus保护法》，《比较法研究》，2014年第1期。

数据库选择篇7

一、数据库加密层次分析

根据数据库的结构可知, 实现数据库的加密可以从三个层次考虑:OS (Operating System, 操作系统) 操作系统层、DBMS (Database Management System, 数据库管理系统) 内核层和DBMS外层。

1. 在OS层加密。

从操作系统的角度来看, OS层位于DBMS层之下, 所以无法辨认数据库文件中的数据关系, 也就无法合理地产生、管理和使用密钥。因此, 在OS层对数据库文件进行加密, 对于大型数据库来说, 目前还难以实现。

2. 在DBMS内核层加密。

在DBMS内核层实现加密, 是指数据在物理存取之前完成加 (解) 密工作。这种方式的优点是加密功能强, 并且加密功能几乎不会影响其他功能;缺点是在服务器端进行加 (解) 密运算, 加重了数据库服务器的负载, 并且因为加 (解) 密是在内核中完成, 就势必需要数据库供应商对其进行技术支持, 这一点不容易实现。DBMS内核层加密关系如图1所示。

3. 在DBMS外层加密。

DBMS外层实现加密在安全层实现加密就是将数据库加密系统做成一个安全层工具。采用这种加密方法的优点是可扩充性强, 数据库的加解密系统可以做成一个独立平台, 不需要数据库供应商进行技术支持, 并且可以将加密密文直接在网上传输;缺点是数据库的功能和查询效率会受一些限制。DBMS外层加密关系如图2所示。

二、数据库加密层次方案选择

数据库数据的存储加密、解密处理可以在数据库系统的不同层次实现, 分别形成以下方案。

1. 添加加密定义接口和处理模块, 以及对数据加解密软件或硬件的调用接口。

由于该方案的实现需要修改DBMS源代码, 而我国目前使用的数据库管理系统大多数是国外开发的, 无法获得源代码, 该方案受条件限制难以实现。另外, 由于内核级加密势必增加服务器的负载 (尤其是使用硬件加密) , 在多用户环境中将影响系统整体效率。因此, 可以先由应用程序调用执行加密运算的软件或硬件实现数据明密转换, 然后将加密文传递给数据管理系统存储。该方案的优点是实现简单, 不需要在系统软件层 (如DBMS层和OS层) 进行任何修改工作。但该缺点是应用不透明, 每个需要数据加 (解) 密的应用都要处理数据加 (解) 密运算调用、数据类型转换等工作, 增加了应用开发的复杂度和难度。另外, 由于数据类型转换模块难以插入应用开发工具中, 将会造成开发工具中的一些功能失效, 这对于图形界面的应用开发来说也是极大的损失。

2. 利用应用接口层, 在数据库应用和内核之间增加加 (解) 密功能模块。

该方案避免了修改内核时的应用开发, 具有较高的透明度, 同时可以实现客户端加密、解密, 对数据库系统整体影响较小。客户 (服务器) 模式最大的优越性就是合理分担计算, 因此一些应由服务器端DBMS内核完成的处理 (如视图处理) , 不应该放置在客户端完成。

3. 对磁盘块进行加密, 实现数据存储加密。

例如软件移动存储加密王, 它的特点是能够对存储在里面的数据进行加密, 从而保证数据不被非法盗用。但是, 这种加密必须由软件辅助完成, 在安装完移动硬盘的驱动之后, 再安装一个加密管理软件就可以实现。加密是通过在特定的硬盘分区里生成加密防卫区实现的, 只有提供了正确的密码, 才可以读取存储在其中的数据。因此, 该方案适于保证移动硬盘的携带安全, 保证备份数据的安全, 但是对于大数据量、频繁访问的应用来说是不合适的。

数据库选择篇8

关于此问题, 现阶段已有一些成果。例如文献[2]和文献[3]提出利用JSP和servlet技术来实现对数据库的访问, 但该方法会使得服务器端返回HTML文本, 增加了数据传输量, 并且终端解析HT-ML文档比较麻烦。文献[4]和文献[5]利用JSON技术实现了对数据库的访问, 大大减少了数据传输量, 但是单一的数据库访问方式无法适应多种应用场合导致交互的效率不高。文献[6]提出了一种终端与主站数据库同步机制[6,7], 不仅设计了良好的交互方法, 而且提高了通信的安全性, 但是该方法只能用在特定的一些领域, 应用范围并不广泛。

基于以上种种问题, 本文通过大量实验, 发现终端与数据库交互效率高低的关键有三个因素:通信协议、数据库访问方式和交互机制, 因此笔者同时从这三个方面出发, 设计并实现了一套交互机制, 最后通过大量实际测试, 得出了比较满意的结果并验证了该机制的实用价值和借鉴价值。

1 访问不同数据库花费的时间统计

由于数据库访问过程比较复杂, 并且会因访问的数据库类型、访问方式的不同而变化, 因此有必要对每种数据库进行分析。我们分别对Access、Oracle、My SQL、SQL server和DB2数据库进行了大量测试。具体方式是:对常用的几种数据库操作 (增、删、查、改) 分别进行测试, 操作1 000条数据, 每条数据大约20 byte, 并统计花费的时间, 其中花费的时间是按照不同数据库访问技术所花费的时间取平均值来计算。由于执行SQL语句花费的时间不仅和数据库类型以及数据库访问技术有关系, 也和编写的SQL语句的方式以及服务器配置有关, 例如, 采用连接池的方式和存储过程比一般方式执行SQL语句速度要快的多。因此本次测试均在相同服务器配置条件且不采用连接池和存储过程等的情况下的统计时间的。表1为访问不同数据库的统计表。这里需要强调的是:该部分计算的时间只包含服务器操作数据库的时间, 不包含终端发送数据到服务器的时间。

从表1可以看出, 访问Access数据库所用的时间较少, 这是由于Access数据库本身的特殊性, 即采用文件路径连接数据库, 因此Access数据库管理器无需再设计额外的操作机制。DB数据库操作花费时间最长, 经过分析这是由于DB数据库的操作机制本身比较复杂造成的。同时从不同操作所花费的时间可以看出, 查询语句花费时间最长, 因为查询数据库需要涉及到遍历的算法, 不仅仅是执行SQL语句, 而且要将从数据库返回的结果集中获取数据, 这就会增加操作数据库时间。通过以上分析我们发现每种数据库操作所花费的时间不同, 因此有必要设计一种机制, 该机制可以首先判断出即将访问的数据库的类型, 并根据该部分实验得出的结论作为判据来动态调整终端与数据库交互方式。

2 采用不同数据库访问方法花费的时间统计

再研究不同的数据库访问方式操作数据库花费的时间, 测试方法为:依然是对四种数据库操作进行测试, 操作1000条数据, 并记录时间。由于数据库连接过程也需要一定的时间, 但是研究该时间对本次的机制设计和实现并没有任何帮助, 所以统计时间时我们不将数据库连接所用时间计算在内。由于访问的数据库类型有所不同, 所以统计的时间将会按照访问各类数据库所用时间的平均值来表示。表2为不同数据库访问方式下对四种数据库操作所花费的时间统计表。从表中可以看出, OLEDB方式所用的时间最短, 其次是ADO。其中ODBC所用时间最长, 这是由于ADO、DAO和OLEDB等方式都是在ODBC基础上做了很大的改进, 因此这三种方法都优于ODBC, 实验结果与理论一致, 并且OLEDB方式花费的时间最短, 因此当条件允许时, 应该优先考虑采用OLEDB方式访问数据库。通过以上分析可以得出结论:不同的数据库访问方式对数据库的操作效率是不同的, 因此有必要在机制中增加一个数据库访问方式选择算法, 使得该机制能够以更高效率实现终端与远程数据库交互的目的。

3 数据库交互方案设计

终端与远程数据库如果直接交互会存在安全性和稳定性等问题, 因此需要一个中介来帮助终端间接实现对数据库的操作。基于此我们设计了一种交互方式, 如图1所示。终端与数据库进行交互有两种方法, 第一:终端利用socket通信实现与远程服务器的交互[7], 服务器利用通信接口接收信息, 进行判断后启动选择机制选择合适的数据库访问方式操作数据库, 最后将从数据库返回的结果利用socket通信返回给终端。第二:终端利用HTTP协议将信息发送到Web服务器, Web服务器收到信息后先解析信息, 然后利用JDBC操作数据库, 最后将执行结果交给通信接口模块, 然后通信接口模块利用socket通信将结果返回给终端。在第一种方法中, socket通信协议有两种:UDP和TCP, 具体采用哪种协议由当时的网速以及传输数据的大小这两个因素来确定。总体说来该交互机制由三个模块组成, 分别是通信协议选择模块、接收模块和数据库访问方式选择模块。第一个模块用于选择与服务器交互的协议, 第二个模块用于识别终端所采用的协议并选择合适的接收方式接收数据, 第三个模块用于根据具体情况选择最佳的数据库访问方式实现与数据库的交互。这里需要说明一点, 终端无论用哪种方法交互, 最后返回给终端采用的方法都是Socket通信。

4 交互机制的实现

4.1 交互机制的结构设计

这部分将阐述上述三个模块的具体实现过程。图2为交互机制结构图。通信协议选择模块用于实现终端与远程服务器的交互, 其中协议有三种:TCP、UDP和HTTP。如果采用UDP协议, 则会启动数据包排序算法、稳定性增强算法;如果采用TCP协议, 则会启动文件传输算法;如果采用HTTP协议, 则会启动数据封装算法。接收模块用于判断第一个模块采用的协议, 并采用该协议作为接收模块接收数据的协议。数据库访问方式选择模块用于根据具体情况选择最恰当的方式访问数据库。这里需要说明一点:HTTP其实也是基于TCP而来的, TCP位于传输层而HTTP位于应用层, 因此从层次的不同可以知道HTTP协议本质上比TCP协议要复杂的多, 而HTTP协议本身则多用于B/S通信模式, 其特点是可靠性高、交互性能强大, 但是由于它非常复杂, 因此与TCP相比, 采用它必然会增加数据传输量。本论文再设计交互机制时也是将这方面考虑进去了。

4.2 通信协议选择模块

该模块由四个算法组成。UDP协议采用排序算法和稳定性增强算法, 因为该协议的可靠性不高, 通常用于传输视频等允许数据包错乱的场合, 该协议不会建立连接, 而是直接发送数据, 相比TCP的“三次握手”要简单的多。具体算法的实现是:对于排序算法, 由于数据包在传输过程中通常不会按照发送的顺序达到目的地, 可能会出现先发送的数据包后到达的现象, 如果通信过程不允许数据包顺序错乱, 就需要为每个数据包设计一个编号, 每发送一个数据包编号自动加1, 这样接收端就能够按照编号将被打乱顺序的数据包重新排列, 还原数据包。对于稳定性增强算法, 由于数据包有可能会传输失败, 因此需要在接收端增加一个发送确认信息的算法。每当接收端收到一个数据包后, 立即返回该数据包的编号给发送端, 如果发送端在规定时间内没有收到编号或者收到的编号与发送时不一致, 则判断数据包已经丢失, 重新发送这个数据包。TCP协议采用文件传输算法。当发送的数据包中包含文件时, 模块会选择TCP协议, 因为该协议效率虽然不高, 但是可靠性很好, 适合需要严格通信的场合。HTTP协议采用数据封装算法, 因为终端与Web服务器交互必须严格按照HTTP格式进行封装, Web服务器会自动解析发送的数据。其中我们设置K为文件大小的一个阈值, M为网速的一个阈值。其中K值和M值的取值是决定该机制效率的关键, 关于此, 测试结果会有详细分析。

4.3 接收模块

该模块会自动判断出通信协议选择模块采用的协议, 并采用与它相同的协议接收数据。图3为接收模块执行的流程图, 首先终端向服务器发送测试数据, 服务器利用测试数据检查网络状态 (如网速、终端节点位置等) 并将结果返回给终端, 终端收到数据后立即启动协议选择机制。由于每种协议都设计了一个ID来唯一识别, 因此终端通过发送ID即可告知服务器本次通信应该采用的协议, 服务器根据ID来启动不同的接收信息的算法并向终端返回一个确认信息, 终端收到确认信息后即可发送信息实体。

4.4 数据库访问方式选择模块

该模块用于选择合适的数据库访问方式对数据库进行操作, 通过前面的实验分析可以看出, 每种数据库都有相应的效率最高的访问方式, 通过我们的大量测试, 得到以下结论:访问Access数据库优先考虑OLEDB, 访问Oracle数据库优先考虑JDBC, 访问SQL Server数据库和My SQL数据库优先考虑ADO, 至于其他数据库可以采用ODBC。这里我们需要强调的是, ODBC是微软最早推出的一款数据库访问方式, 其目的是将各个数据库进行统一访问, 但是随着各个数据库厂家都推出了自己特有的SQL对数据库进行不同的扩充, 因此要想实现真正的统一是不可能的, 所以在访问数据库时, 尽量不采用ODBC。

5 测试结果

5.1 交互机制中的K和M最佳取值

对于交互机制中的两个重要参数K和M, 它们的取值直接决定了整个机制的效率和稳定性, 因此进行了大量的实际测试, 对这两个参数的最佳取值进行了研究。首先理论上, K值应该随网速而变化, 当网络状况良好时, 就应该尽可能的采用UDP协议, 因此K值理论上应该越小越好。关于M, 也应该是一个变量, 并且应该随着数据总量大小而改变, 当数据总量太小, 就不宜采用HTTP, M值应该越大越好, 因为HTTP比TCP会传输更多的额外信息。这里将数据总量/所花费的时间所得的值命名为N, 并将N作为K和M是否是最佳的判断标准, 在不同网速和不同数据总量的情况下, 统计了K和M的最佳取值, 并生成了曲线图, 如图4所示。对于K的曲线图, 具体测试方法为:在相同的网速条件下, 让K值从0变化到6并计算出N值, 以N值最大时所对应的K值作为该网速条件下K的最佳取值, 网速的大小范围为:0~120 K/s。对于M的曲线图, 测试方法为:在传输相同大小数据条件下, 让M值从0变化到250并计算出N值, 仍然以N值最大时所对应的M值作为该数据传输量下M的最佳取值, 数据量的大小范围为:0~6 Mb。

5.2 改进后的数据库访问机制分析

根据前文的三种通信协议和五种数据库访问技术可以看出实现终端和数据库交互有多种可能。对最具有代表性的7种交互方法做了大量的实验测试, 对每种交互方法的四种数据库操作所花费的时间作了统计, 见表3, 其中测试条件与前面的测试条件一致。通过分析表可以看出, 改进后的机制在增、查和更新三种操作上, 明显减少了交互时间, 但是在删除操作上, 并没有太大改进, 这是由于查询数据库操作其过程比较复杂, 改进空间较大, 因此在查询数据库操作上, 减少的时间比其他操作要多, 而删除操作实际过程相对简单, 其能够改进的空间已经很小, 所以花费时间与原来差别不大。

6 结束语

首先通过对不同数据库访问技术和不同数据库的特点进行了实验对比, 发现如果能够动态的调整数据库访问方法和通信协议, 就能够大大提高终端与远程数据库的交互效率。通过对各个协议的特点以及各种数据库访问技术进行研究, 设计并实现了一种基于终端与远程数据库的高效交互机制, 最后通过实际测试给出了K值和M值的最佳取值的曲线图。通过对比证明了改进后的交互机制能够缩短交互时间从而提高了交互效率。主要创新点为:

(1) 提出了一种改进终端与数据库的交互效率的思路, 即动态选择通信协议和数据库访问方式, 这对于智能终端远程交互领域的应用具备一定的借鉴价值。

(2) 给出了终端与数据库交互过程关于K、M与网速等环境因素的关系曲线图, 这对于研究终端交互效率提供了理论上的支持。

(3) 设计并实现了终端与数据库的高效交互机制, 这对于智能终端在未来的应用领域 (如移动电子商务等) 具备一定的实用价值。不足之处在于, 没有提出多元化的改进判据, 仅仅以交互时间作为判断机制效率高低的标准还不够完善, 因此下一步的工作是设计一套完善的评估机制性能的判据, 并同时从时间、交互数据量等多个方面提高机制的效率。

摘要：设计并实现一种基于终端与远程数据库的访问机制。以Android终端为例, 通过研究分析各种数据库访问技术的优劣和安卓系统的多种通信协议接口, 摒弃了传统的单一通信方式和单一数据库访问方式的数据库访问方法, 提出一种协议和数据库访问方式智能选择的方法。该方法设计的机制, 能够根据数据库类型、网络环境等客观因素动态调整协议和数据库访问方法, 提高了终端访问数据库的效率和稳定性。在大量实际测试中, 对该机制中的两个核心参数K、M的最佳取值做了详细研究, 并给出了相关曲线图。

关键词：访问机制,数据库,SQL,TCP,终端

参考文献

[1] 张新柱, 白立静, 郭福三.基于Android手机终端信息查询系统的设计.齐齐哈尔大学学报, 2012;28 (4) :47—51Zhang Xinzhu, Bai Lijing, Guo Fusan.Design of mobile phone terminal information inquiry system based on Android.Journal of Qiqihar University, 2012;28 (4) :47—51

[2] 王绍祥, 邵玉斌, 龙华, 等.Android手机与数据库的一种数据交互方法.郑州轻工业学院学报, 2011;26 (6) :28—30Wang Shaoxiang, Shao Yubin, Long Hua, et al.A data interactive method of Android cell phone and database.Journal of Zhengzhou University of Light Industry, 2011;26 (6) :28—30

[3] 刘平.Android手机访问服务器的一种数据交互方法.电子设计工程, 2010;18 (9) :96—98Liu Ping.Effective data interactive method from Android cell phone accessing Web app server.Electronic Design Engineering, 2010;18 (9) :96—98

[4] 权重民, 彭昕昀.利用JSON实现Android高效安全访问远程数据库的一种方式.韶关学院学报, 2011;32 (12) :16—20Quan Zhongmin, Peng Xinyun.An efficient and safe way of accessing remote database by JSON in Android system.Journal of Shaoguan University, 2011;32 (12) :16—20

[5] 龚成莹, 邢敬宏, 胡银保.基于JSON的Android移动终端与PHP及MySQL数据通信.工业仪表与自动化装置, 2013;13 (1) :63 —65Gong Chengying, Xing Jinghong, Hu Yinbao.Data communication of Android mobile terminal and PHP and MYSQL based on JSON.Industrial Instrumentation&Automation, 2013;13 (1) :63—65

[6] 欧清海, 史兵, 吕燕顺.用电信息采集系统终端与主站数据库同步设计.电力系统通信, 2010;31 (210) :5—8Ou Qinghai, Shi bing, LüYanshun.Software design for database synchronization between AMR hand-held terminal and the server.Telecommunications for Electric Power System, 2010;31 (210) :5—8

选择昆腾数据无忧篇9

在这个风起云涌的时代, 客户的需求在迅速的变化, 从寻求更可靠数据管理解决方案的IT经理, 到寻求成本降低之道的企业CEO, 昆腾始终能够满足其需求, 和渠道合作伙伴一起提供创新的解决方案和专业技术。在本次渠道暨用户大会上, 我们能看到从2011以来, 昆腾启动旨在将公司在数据保护领域的领导地位扩展到虚拟和云环境中的战略计划的成功执行。今天的昆腾, 能够为您提供面向传统、虚拟和云环境的智能存储解决方案和无可比拟的卓越价值。

昆腾存储解决方案为用户带来无忧数据保护。在本次大会上, 昆腾亚太高级市场总监Jim Simon先生表示:“在2013财年, 昆腾全新Be Certain品牌形象迅速升温, 更具市场影响力。昆腾Be Certain能够帮助企业决策者做出明智决断!”作为数据管理专家, 昆腾解决方案能够全面保障数据安全。选择昆腾, 数据无忧!

随着虚拟化和云技术的不断发展, 目前的数据正以爆炸式增长为企业IT部门带来挑战。数据如何被有效保护, 数据如何为您所用, 数据如何安全无忧, 困扰着我们的IT经理。昆腾针对大数据管理的分层存储及下一代目标存储解决方案, 通过从用户的数字资产中提取所有价值而帮助用户最大程度的保留成果和提高收入。长期以来, 昆腾在数据保护领域的积累能够帮助用户通过高度优化、灵活的方式利用云数据保护。昆腾屡获殊荣的vm PRO?技术和虚拟重复数据删除设备DXi系列产品的高效结合, 帮助用户将虚拟机备份和恢复融入现有的数据保护流程, 简化管理并有效降低成本。如果客户希望降低内部基础设施和管理成本, 避免为了灾难回复而设立多个数据中心, 优化的“云”数据保护方案应该是最具吸引力的选择。无论是针对私有云、共有云还是混合云, 昆腾创新的虚拟备份和恢复技术, 都将以部署简单、优化和灵活面对未来的优势帮助客户轻松实现云端数据管理。

昆腾公司一直重视与渠道伙伴的合作, 凭借其深入的技术专长和强大的咨询能力, 共同帮助客户向虚拟化, 云计算和大数据时代平稳过渡。2012年, 新的“昆腾联盟”经销商计划是渠道合作伙伴经销昆腾屡获殊荣的备份、恢复和归档产品的有效途径。“昆腾联盟”计划致力于昆腾公司与渠道合作伙伴的双赢。

本次昆腾渠道大会上, 昆腾大中华区总经理张金华先生表示:不断创新一直是昆腾成长的原动力。昆腾同样也引领着市场的革新。我们将重新定位于两大主要市场:其一是数据保护, 以前是基于磁带的备份, 后来是磁盘的备份, 现在则是为虚拟化做数据备份。另一主要市场是大数据。昆腾的策略是采取全面的方法来实现数据保护和大数据管理, 帮助客户管理和保护其日益增长的数据, 全面支持客户向新基础设施 (如虚拟化和云等) 过渡, 最大限度提高客户的投资回报。本次昆腾渠道大会发布了2012昆腾渠道政策及一系列合作伙伴促销奖励计划, 并为白金和金牌的渠道合作伙伴授牌。昆腾将给予合作伙伴最有力的市场支持, 最具吸引力的资金奖励和最全面的技术培训支持, 与合作伙伴共赢云端!

数据库选择篇10

关键词：火电厂,SIS建设,实时数据库

随着网络技术和计算机技术的快速发展, 我国的电力改革也逐渐深入, 国内火电厂也对自身信息化建设逐渐重视起来。希望通过以此来满足电力市场的发展要求, 推动企业的改革发展。在安全生产的基础上, 是否能最大限度的降低发电成本、发挥机组性能、提高企业本身的市场竞争力和生产管理水平, 将成为影响电厂发展的重要因素。在电厂企业信息化建设中, 为了实现全场范围内的管理控制一体化和管理信息化, 这就需要考虑各个生产控制系统的集成和管理信息系统, 同时综合考虑原有的软硬件资源。因此为了优化电厂的经济运行, 需要在统一的实时数据库平台上开发高效的高级应用软件来结合指导。

1 关于SIS的简单介绍

SIS即为电厂厂级监控信息系统, 其主要是指通过对全厂生产实时数据的采集和处理, 来为厂级监控和电厂的高级决策实现现代化提供一种服务系统。SIS主要是通过建立起一座联系桥梁, 使得电厂中各种分散的计算机控制系统与管理信息系统相连接, 来实现整个电厂的资源共享, 从而为电厂的信息化建设奠定基础。按其功能不同可分为数据采集前端、实时/历史数据服务器和建立在数据服务器基础上的各种高级应用软件。

就目前国内形势而言, 我国的SIS建设才刚刚处于起步状态, 并没有太多可供选择的成熟经验, 因此各电厂可根据原有的管理信息系统网络, 同时结合电厂自身管理和生产的需要来进行规划。对于一般电厂而言, 由于其个个控制系统是分散布置的, 这时为进行数据采集就需要采用独立接口机将各个独立的控制系统连接起来, 通过数据接口分布采集数据, 使得数据库服务器能够进行集中管理实时和历史数据, 同时数据接口机还可以缓冲存储实时数据, 以保证在数据库服务器出现故障时实时数据不易丢失。工作站上只单独运行单个高级应用, 因此一旦工作站发生故障, 其对其他工作站不产生任何影响, 只会影响本台工作站的高级应用。每台工作站将独立与数据库服务器进行数据通信, 通过运算从数据库中读取的运行数据, 然后又将运算结果返回保存到数据库中, 提高了整个系统的稳定性。

2 选择实时数据库平台

实时/历史数据库是电厂厂级监控信息系统的核心, 同时也是整个电厂的统一数据平台。由于电厂在生产过程中会产生大量的数据, 同时还要求其较高的精度, 因此就需要利用实时数据库中实时数据处理的功能, 来对这些数据进行存储处理。首先由于数据量大, 为了减轻数据的维护量、避免系统数据的不一致性和过度冗长、简化各个应用软件的开发实施, 就需要与电厂具有统一的数据库平台, 因此实时数据库平台的恰当选择对于火电厂SIS建设具有重要的意义。

选择数据库平台主要是结合以下几个方面因素进行综合考虑: (1) 数据库最大采集标签点数和存储效率。 (2) 实时数据库的选择是否具有二次开发能力及其开放性。 (3) 系统访问结构。 (4) 为了防止潜在的数据丢失, 实时数据库应具有数据的容错功能和缓冲功能。 (5) 数据备份和安全机制。 (6) 实时/历史数据库应该具有成熟的接口技术。 (7) 可扩展性和可移植性。 (8) 实时数据库平台已有的应用软件。目前大多电厂已经投入使用一些管理信息系统软件或性能检测软件, 但由于其各个应用单独拥有各自的数据库, 缺乏统一的规划, 使得数据维护存在很大的困难, 所以在全电厂建立统一的实时/历史数据库平台就显得尤为重要, 同时实时数据库平台的恰当选择是首要任务, 应参考国外机组的数据库使用经验, 在前期做好调研工作, 同时结合数据库平台的性价比以及自身电厂机组控制系统的特点进行慎重选择实时数据库平台。

SIS主要有符合分配调度、实时监控和生产管理指导、竞价上网、成本分析、设备状态维修和寿命计算等功能, 电厂可以根据自身情况并利用原有的各种应用软件对其功能进行深入开发, 同时SIS功能会在开发应用的实践和电厂的管理和实时生产监控中不断进行完善和充实, 随着开发技术的逐渐成熟和应用经验的逐渐积累, SIS功能也会越来越成熟和丰富, 因此SIS建设是一个渐进过程。

3 结语

就目前国内形势而言, 我国的SIS建设才刚刚处于起步状态, 目前仅仅是初步探讨了SIS的功能开发、实时数据库平台的选择及其架构。随着不断对厂级监控信息系统加深认识和了解, 我国对SIS的建设也将会在实践中得到进一步的完善。目前为止, 许多电厂为了增强其自身的综合竞争力, 及为了提高电厂的经济效益和运行可靠性, 都在着手进行SIS功能的完善和实现数据库平台的搭建工作, 许多电厂已经充分意识到SIS建设对于实现电厂管控一体化的重要性。

参考文献

[1]火电厂实时数据库监控信息系统的应用[J].华东电力, 2002, 30 (12) .

[2]灵武电厂实时监控信息系统[D].2009.

[3]实时数据库及其在电厂监控信息系统 (SIS) 中的应用[R].电站自动化信息化学术技术交流会议, 2002.

数据库选择篇11

关键词：森林资源；遥感；分类；特征变量

1 引言

目前，各国研究机构广泛发展了基于遥感与抽样技术相结合的森林资源面积监测体系。抽样方法可大范围、快速监测森林资源动态变化，但无法在实际监管中存在有效利用，也就是存在监管不到位的现象。因此，结合实际，深入研究森林资源遥感分类区划方法中的一些关键技术，对促进森林资源调查遥感监测技术的发展具有重要意义。

2 森林资源分类中遥感数据的波谱特征

2.1 光谱特征多光谱遥感影像能够对不同的森林进行区分，也是森林资源遥感分类应用最广泛和最基本的识别特征。目前基于多光谱特征的森林资源定量分析则是通过计算各个类别的均值、方差、标准偏差和离散度等统计量，作为比较不同类别相似度的量化依据，并在这些统计量的基础上建立判别函数实现森林资源遥感分类。但由于遥感数据空间分辨率、光谱特征值、光谱波段设置等限制，以及遥感影像像元都是地物光谱综合信息的特点，致使单纯依靠多光谱特征的森林资源遥感分类存在诸多分类混淆，“同物异谱、异物同谱”现象广泛存在。

2.2 高光谱数据特征高光谱数据的光谱分辨率很高，能精确识别不同的树种。但高光谱数据各波段之间存在着高度的相关性，对分类精度有很大的影响。因此，高光谱数据的降维处理是目前高光谱数据处理的必经过程。目前，降维方法可分为两大类：①基于变换的方法，如主成分变换、正交子空间投影、正则分析、离散小波变换等。基于变换的降维方法优点是可以经若干变换直接将高维数据降低到几维甚至一维，信息量高度集中，降维速度快；其缺点是改变数据原始特性；②基于非变换的，主要是波段选择。基于非变换的降维方法保持数据原有特性，但波段选择算法目前均不成熟，难度大。

3 森林资源分类中遥感数据的纹理特征

纹理特征作为遥感影像数据重要的空间特征之一，是对影像像元之间空间分布的一种描述，其空间分辨率决定了纹理结构信息的丰富度。高分辨率遥感影像可大幅度减少了混合像元的比例，能非常直观的展示地面目标地物的空间位置、结构、形状、色彩等信息，有利于辨识目标地物。但高分辨率影像数据量巨大，所含信息量十分丰富，在抑制异物同谱现象的同时增加了同物异谱现象，此外还存在着阴影问题等，这些均有可能引起分類精度的降低。为充分利用高分辨率影像，基于纹理、面向对象或光谱与空间信息结合等分类方法可有效提高分类精度得到迅速发展和应用。然而在图像分类中，特征并不是越丰富越好，对分类结果不利的特征可对分类结果起到干扰作用，导致识别或分类精度的降低。因此，选择合适的纹理特征，制定一个特征选择准则，配合一个好的搜索算法就显得十分必要。

4 森林资源分类中遥感数据的时间特征

单一时相的遥感数据只能反映拍摄时间森林资源的波谱特征，但不同时期植物的生长发育规律可在遥感影像表现出不同的波谱信息。因此，可利用植物的时间效应特征来提高森林资源遥感分类识别能力。

5 研究展望

5.1 森林资源遥感分类特征变量选择存在的问题

5.1.1 森林资源遥感分类特征变量的选择的理论研究还不完善在现有特征变量选择过程中高度依赖遥感数据的光谱特征，没有充分研究森林资源本身的特征在遥感数据上的机理体现，也就是没有从遥感机理上去分析、构建和选择特征变量。

5.1.2 森林资源遥感分类特征变量的综合应用问题目前森林资源遥感分类特征变量较多的使用单一类型的特征变量，在利用单一类型的分类特征变量只能体现森林资源的一个方面，不论应用何种算法，对提高遥感分类精度的力度有限。因此，多类型分类特征变量综合应用是提高分类精度的有效途径。5.2 森林资源遥感分类特征变量选择发展方向

5.2.1 新的特征变量的不断挖掘影响不同植物差异，可从植物本身的主要物理性状，这些因素主要受植物本身基因控制，这些特征变量参数可通过过SAR数据来解决。一些植物生化组分含量特征方面，可利用高光谱数据反演植物内部生化组成含量，探索基于生化组分含量与光谱的相互作用显著的敏感波段，并利用这些波段的影像对森林资源进行分类，使遥感分类更具机理性。

5.2.2 特征变量的综合应用由于不同区域范围内具有特定的植物种群结构，不同时相植物存在着不同的生长规律，可根据植物生长状态，及其生长周期内生理、外形、结构等变化或季节变化特点，研究出某类植物最佳辨别时相，以及组合分类的特征变量组合。基于不同传感器数据提取不同森林资源遥感分类信息，联合使用多种分类特征的互补信息可有效提高遥感分类精度。开展森林资源遥感分类特征变量和敏感性与不确定性分析，在分类特征变量深入挖掘的基础上，结合主要分类器，建立不同分类特征的精度敏感性分析，进一步建立评估模型，为模型通用性检验及区域推广提供技术基础。

因此，不同区域的森林资源分类可按区域特性，建立区域特征数据库，综合应用适合该区域遥感分类特征变量，提高分类精度，使其更好的服务于森林资源调查分类及遥感监测需求。

参考文献：

数据中心综合布线典型产品选择篇12

布线标准认可多种介质类型以支持广泛的应用，但是建议新安装的数据中心宜采用支持高传输带宽的布线介质以最大化其适应能力并保持基础布线的使用寿命。

推荐使用的布线传输介质有：

(1)100Ω平衡双绞线，建议6类/E级(GB 50311-2007)、6A类/EA级(ANSI/TIA/EIA-568-B.2-10,ISO/IEC 11801:2008)或F/FA级(GB 50311-2007,ISO/IEC 11801:2008)

(2)多模光缆：62.5/125μm或50/125μm(ANSI/TIA/EIA-568-B.3)，建议选用50/125μm,850nm工作波长的激光优化多模光缆(ANSI/TIA/EIA-568-B.3-1)

(3)单模光缆(ANSI/TIA/EIA-568-B.3)

除以上介质外，认可的同轴介质为75Ω(型号是734和735)同轴电缆(符合Telcordia GR-139-CORE)及同轴连接头(ANSI T1.404)。这些电缆和连接头被建议用于支持E-1及E-3传输速率接口电路。

在数据中心机房设计时，应根据机房的等级、线缆的敷设场地和敷设方式等因素选用相应的线缆，使其：

◆灵活支持所对应的服务;

◆具有长久的使用寿命;

◆尽量减少占用空间;

◆具有更好的布线信道传输容量;

◆满足设备制造商的推荐。

2 机柜/机架

机架为开放式结构，一般用于安装配线设备，有2柱式和4柱式。机柜为封闭式结构，一般用于安装网络设备、服务器和存储设备等，也可以安装配线设备，有600×600、6 0 0×8 0 0、6 0 0×9 0 0、6 0 0×1 0 0 0、600×1200、800×800、800×1000、800×1200等规格。宽度为600mm的机柜没有垂直线槽，一般用于安装服务器设备;宽度为600mm的机柜两侧有垂直线槽，适合跳线较多的环境，一般作为配线柜和网络柜。机架和机柜最大高度为2.4m，推荐的机架和机柜最好不高于2.1m，以便于放置设备或在顶部安装连接硬件。推荐使用标准19″宽的机柜/机架。机柜/机架的构成如图1所示。

机柜深度要求足够安放计划好的设备，包括在设备前面和后面预留足够的布线空间、装有方便走线的线缆管理器、电源插座、接地装置和电源线。为确保充足的气流，机柜深度或宽度至少比设备最深部位多150 mm(6 in)。

机柜中要求有可前后调整的轨道。轨道要求提供满足42U高度或更大的安装空间。

3 配线架

为提高与满足企业的成本效益要求，数据中心要求能够提供更高密度的设备以及应用空间。因此，在数据中心中使用的配线架应能满足高密度安装配线模块，方便端口的维护或更换，并且能清楚方便地对端口进行识别的要求。

模块化的配线架可以灵活配置机柜/机架单元空间内的端接数量，既减少端口浪费又便于日后的维护变更。配线架的构成如图2所示。

常用的配线架，通常在1U或2U的空间可以提供24个或48个标准的RJ45接口，而使用高密度配线架可以在同样的机架空间内获得高达48个或72个标准的RJ45接口，从而大大提高了机柜的使用密度，节省了空间。高密度配线架的构成如图3所示。

角型配线架允许线缆直接从水平方向进入垂直的线缆管理器，而不需要水平线缆管理器，从而增加了机柜的密度，可以容纳更多的信息点数量。角型高密度配线架的构成如图4所示。

凹型配线架主要应用在服务器机柜背部进行配线的情况下，配线架向下凹陷，即使关闭服务器机柜的背板，也不会压迫到任何的跳线，且方便维护操作人员快捷的接入整个配线界面。凹型高密度配线架的构成如图5所示。

机柜内的垂直配线架，充分利用机柜空间，不占用机柜内的安装高度(所以也叫0U配线架)。在机柜侧面可以安装多个铜缆或者光缆配线架，它的好处是可以节省机柜空间，减少跳线的弯曲和更方便地插拔跳线。

高密度的光纤配线架，配合高密度的小型化光纤接口，可以在1U空间内容纳至少48芯光纤，并具备人性化的抽屉式或翻盖式托盘管理和全方位的裸纤固定及保护功能。更可配合光纤预连接系统做到即插即用，节省现场施工时间。光纤高密度配线架的构成如图6所示。

4 线缆管理器

在数据中心中通过水平线缆管理器和垂直线缆管理器实现对机柜/机架内空间的整合，提升线缆管理效率，使系统中杂乱无章的设备线缆与跳线管理得到很大的改善。水平线缆管理器主要用于容纳内部设备之间的连接，有1U和2U、单面和双面、有盖和无盖等不同结构组合，线缆可以从左右、上下出入，有些还具备前后出入的能力。垂直线缆管理器分机柜内和机柜外两种，内部的垂直线缆管理器主要用于管理机柜内部设备之间的连接，一般配备滑槽式盖板;机柜外的垂直线缆管理器主要用于管理相邻机柜设备之间的连接，一般配备可左右开启的铰链门。线缆管理器的构成如图7所示。

5 设备线缆与跳线

在数据中心中通过设备线缆与跳线实现端口之间的连接。设备线缆与跳线可采用铜缆或光纤。它们的性能指标应满足相应标准的要求。

光、电设备线缆与跳线应和水平或主干光(电)缆的等级保持一致，还应与网络设备、配线设备端口连接硬件的等级保持一致，并且能够互通。

在端口密集的配线和网络机柜/机架上，可以使用高密度的铜缆和光纤跳线。这些跳线通过对传统插拔方式或接口密度的重新设计，在兼容标准化插口的前提下提高了高密度环境的插拔准确性和安全性。线缆/跳线的构成如图8所示。

6 预连接系统

预端接系统是一套高密度，由工厂端接、测试的，符合标准的模块式连接解决方案。预连接系统包括配线架、模块插盒和经过预端接的铜缆和光缆组件。预端接系统的特点是经过工厂端接和测试的铜缆和光缆可以提供可靠的质量和性能;基于模块化设计的系统允许安装者快速便捷地连接系统部件，实现铜缆和光缆的即插即用，降低系统安装的成本;当移动大数量的线缆时，预端接系统可以减少移动所带来的风险;预连接系统在接口、外径尺寸等方面具有的高密度优点节省了大量的空间，在网络连接上具有很大的灵活性，使系统的管理和操作都非常方便。预连接系统的构成如图9-1和图9-2所示。

7 线缆/跳线标签系统

与连接硬件相同，线缆/跳线标签系统也分为三大类对应三种类型的打印机。

单根线缆/跳线标签最常用的是覆膜标签，这种标签带有粘性并且在打印部分之外带有一层透明保护薄膜，可以保护标签打印字体免受磨损。除此之外，单根线缆/跳线也可以使用非覆膜标签、旗式标签、热缩套管式标签。单根线缆/跳线标签的常用的材料类型包括：乙烯基、聚酯和聚氟乙烯。

对于成捆的线缆，建议使用标识牌来进行标识。这种标牌可以通过尼龙扎带或毛毡带与线缆捆固定，可以水平或垂直放置。标签固定方式如图10所示。

【数据库选择】推荐阅读：

数据选择器09-12

深圳大学数据选择器06-19

大数据时代数据库技术09-10

数据库07-16

基于关系数据库的地籍空间数据存储结构07-18

数据挖掘数据存储07-01

大数据推荐数据模型08-27