虚拟数据视图

2024-10-21

虚拟数据视图(精选5篇)

虚拟数据视图 篇1

高校的教务系统由于各个系统是分散的,形成了一个个信息“孤岛”,部门之间的数据使用通常的数据共享的方式,这种手工处理数据的方式不但给工作人员带来很大的压力,而且容易导致错误。通常的数据集成的方法是通过共享数据库中的方式实现,这样需要工作人员对系统数据库有较清楚的认识和对数据库访问技术有熟悉的使用,这些都对工作人员提出更高的要求。因此,本文从虚拟视图的集成技术出发,研究了教务系统中数据集成方法,该方法能够对教务系统中的数据孤岛问题提供了一个较好的解决方法。

1 基于虚拟视图数据集成方式

图1是目前教务系统中常用的数据集成方式,数据集成层的主要目的是提供数据访问模式。按照参考文献[1]提出了图1的教务管理系统数据集成方式。在这里元数据是指数据库里面的表、列名、列属性、主键、外键等所有描述数据库结构的属性,数据集集成层提供对元数据进行存取和更新的方式,在进行数据集成的时候需要提供元数据的基本信息,为建立全局视图提供依据,所以这种对元数据进行获取和共享的方式是创建操作型数据存储(Operational Data Store,ODS),ODS起到了将底层数据汇总成单独的逻辑数据视图的作用,然后按照全局虚拟视图的方法进行操作。这样数据访操作就不会是点对点的方式进行,而其在设计其它组件的时候很容易进行运行时发现和绑定,并且可以随着组织数据的方式,得到不同的全局视图,实现按需求进行集成。

从上图可以发现数据集成层ODS是整个方案的核心,这里数据集成层按照图2的结构进行设计[2]。它与所有业务服务与虚拟视图数据集成方法控制下的任何数据源的集成,把数据统一到一个单一的逻辑视图提供了信息和处理流程,维护在数据源局部视图上的虚拟集成视图。用户提交一个全局虚拟视图上查询,系统就根据全局视图与数据源局部视图的关系,将查询定义成对数据源视图上的子查询,子查询由针对不同数据源包装器来进行处理,最后系统组合来自多个包装器的中间结果,并将返回后的结果进行组合并返回给用户。

2 教务管理系统构架分析

图3是安徽某职业学院的教务管理系统的软件构架图,系统管理数据库,在线考试数据库,学生信息管理数据库,选课系统数据库,图书馆系统数据库和旧的教务系统数据库通过数据集成层,业务服务层,应用服务层供教师,学生,校园用户使用。但是这些不同的底层系统由于采用不同的数据库系统,所以需要在系统集成成进行数据集成。这里的数据集成方式是分散到各个系统的服务端,通过对这些不同的数据库获取数据后,然后存入到本地实时数据库,业务系统在从本地实时数据库中提取出这些数据,并显示在业务前端。这个数据集成方式理解简单,但是随着数据库系统不断增加,会导致系统访问速度减慢。

3 异构数据集成与交换实现

目前该职业学院需要在不同部门进行统一的数据访问,因此需要能够实现对不同的子系统进行数据集成,为了解决不同数据库中的数据访问和数据转换问题,按照以前的数据集成方法显然不能满足以后系统不断扩展的要求,因此这里采用统一的基于虚拟视图的集成方式,将所有关于数据库访问方作的都封装在这一层,然后通过提供一个标准接口来供上层访问[4]。这样整个系统就屏蔽了数据库的细节,而只关心上层的访问技术方面,上层应用程序通过调用这些服务来访问底层数据库。在下面将对如何实现这个技术进行详细的分析。

3.1 集成层服务设计

在教务系统中涉及到的集成服务主要有:虚拟视图服务,虚拟视图服务,集成层查询分解服务,集成层结果集合并服务。虚拟视图服务是将底层数据进行逻辑视图的汇总,提供实体的单一实体和多数据源的视图;数据适配服务提供对数据库元数据访问操作,集成层查询分解服务是把复合SQL语句分解为针对不同子数据库子SQL语句。集成层结果集合并服务是把查询结果进行合并服务。图5为集成服务的用列,在这里有2个角色,系统管理员和教务信息操作员,按照权限进行不同的管理,进而对不同服务进行调用。

3.2 集成层服务实现

要实现教务系统的集成,就需要使用适合其访问的技术,这里采用教务管理系统采用IIS6.0作为Web Services运行的SOAP服务器,集成层服务实现的步骤如下[5]:

1)按照图6的方式创建核心集成服务类。

2)进行编写成动态链接文件。

3)把生成的动态链接文件部署在服务端。

4 结论

随着“大校园”概念的提出,灵活、高效的数据集成技术是对教务系统的开发提供了更高的要求,本文所设计的基于虚拟视图数据集成具有耦合性低,可拓展性强,性能相对较高,基于标准等优点,对提高同类系统的数据集成性具有一定的参考价值。

参考文献

[1]赵健,陈松乔.异种数据集成工具的数据对象及映射关系研究[J].微机发展,2005,3(24):25-27.

[2]杨雪梅,董逸生,王永利,等.异构数据源集成中的模式映射技术[J].计算机科学,2006,33(7):87-91.

[3]王亮明,李东.基于XML的异构多源数据查询[J].计算机应用与软件,2007,24(12):107-109.

[4]甄玉钢,刘璐莹,康建初.基于XML的异构数据库集成系统构架与开发[J].计算机工程,2006,32(2):85-87.

[5]赵洁,张鹏,齐德星.多数据库中间件中分布异构数据缓冲区系统的实现[J].计算机应用研究,2008,25(1):215-219.

虚拟数据视图 篇2

一、实验目的

1.掌握集合查询涉及的SQL语句 2.掌握视图创建的SQL语句

二、实验内容

1.查询信息系的男生或者是计算机系的女生名单,输出姓名,性别,系名。(并操作UNION)

2.查询计算机系年龄不大于20岁的学生。(交操作INTERSECT)

3.查询计算机系年龄大于19岁的学生。(差操作EXCEPT)

4.创建一个视图view1,要求输出学号,姓名,课程号,分数。

5.基于view1和Course查询每个人各门课程的平均分,输出学号,姓名,平均分,按平均分降序排列。

6.基于view1和Course查询每个人选课的总学分数,输出学号,姓名,总学分数。

三.心得体会

基于全景视图的虚拟现实系统研究 篇3

近年来, 随着虚拟现实技术的发展, 其应用内容也日趋复杂化。特别是网络图形技术的发展, 对具有真实感强的实时虚拟场景绘制方法提出了更高的要求。因而急需在现有计算机平台下研究一种有效的图形绘制算法以进一步加速对复杂场景模型的绘制, 然而算法的绘制速度、对象的生成质量及场景复杂度之间的矛盾, 己成为计算机图形学领域一个重要的课题。

虚拟场景的绘制是虚拟漫游系统的关键, 依据不同的场景建模方法, 目前主要分为基于图形绘制 (GBR) 和基于图像绘制 (IBR) 两种方法。IBR方法与GBR相比具有以下特点: (1) 以图片代替3D建模, 虚拟场景生成速度快, 开发周期短。 (2) 场景逼真, 给人以身临其境的视觉满足感, 可达到照片级的真实感。 (3) 数据量小, 适合网络传输, 且视图生成算法计算量小, 能够在一般PC机上实时绘制完成。

2、全景图技术

全景 (Panorama) 技术是目前迅速发展的一门视觉新技术, 它可以拓展图片的分辨率和实现信息压缩, 目前已广泛应用于宇宙空间探测、医学图像处理、海底勘探等社会领域。全景图可通过多种途径获取, 目前多采用图像拼接的方法得到。虚拟现实 (Virtual Reality, 简称VR) 系统又可称为灵境技术, 它可提供一种模拟仿真的互动环境。对于任何一个虚拟现实系统, 主要有以下三大特性。 (1) 沉浸性。 (2) 交互性。 (3) 多感知性。

2.1 基于图像的图形绘制技术 (IBR技术)

它采用真实的场景图片作为输入, 并通过图像处理技术对全景图像进行反投影、插值等运算来绘制虚拟场景。其与传统的基于图形绘制的方法思路完全不同, 不再需要繁琐的几何建模, 直接由己知场景图像合成新视图。

基于IBR的方法较传统的基于图形绘制的方法, 有着以下优势: (1) 场景真实, 沉浸感强。 (2) 建模简单快速。 (3) 数据量小, 实时性好。

2.2 立方体全景图技术

立方体全景图可实现360度无视觉死角漫游。视平面与立方体全景图的几何关系如图1所示。

通常可以由两种方法来生成立方体全景图:第一种是用拼接软件的方法对采集的图像进行无缝拼接, 并采用立方体投影模型来生成具有6个面的立方体全景。第二种方法是用数码相机严格标定相机的位置, 使用90度的广角镜头在上下, 前后, 左右6个方向依次各拍摄一张照片, 并将获取的照片无缝拼接成立方体全景图。

2.3 全景图的生成

基于图像的绘制 (IBR) 是通过宽视角图像、360°全角度具有三维立体图像对现实中的景象进行建模展示, 根据多个静态的图像进行合理的组合来展现实际场地的一种连续查看。随着计算机技术水平的快速发展, 为图像的计算机处理提供了更为先进的数字处理方法, 我们利用多个现场图像的拼接, 通过数字技术实现对其各个拼接点和接触点进行编辑;也可以对每个节点进行不用角度的和远近距离的查看等操作。这种根据多个图像拼接来实现整个场景的展示过程如2图所示:

3、虚拟实景空间系统分析设计

虚拟实景即将现实中的场景通过现有虚拟技术进行表现, 由于技术实现复杂度高等条件限制, 提出了基于实时序列普通图像采集数据, 运用IBR全景技术, 将图像数据生成可靠性高, 真实度高的虚拟环境的全景图。

虚拟实景空间的数据采集来自于真实的场景照片、围绕人机交互操作这个核心, 比传统的虚拟技术在真实性、人机交互等方面有很大的优势, 其主要特点体现在以下几点:

(1) 原始数据真实性。基于建模的虚拟空间是实景是通过3D几何模型实现, 而虚拟实景空间构造使用的是实景图像。 (2) 空间。虚拟空间是虚拟场景和视点之间的关系, 虚拟实景空间系统是以图片采集点W (X, Y, Z) 为唯一视点, 在该视点观察者可以进行360°×180°查看空间场景的基本元素, 在场景的所表达出的所有时空信息则是真实有效的。 (3) 虚拟。虚拟是指在图片采集技术的基础上, 通过计算机技术, 将原始数据转换成直观、易于操作和管理的真实、有效、完整的虚拟数据, 可以真切模拟现实场景的信息。 (4) 交互。虚拟实景技术是基于易于交互和操作的基础发展起来的, 交互性是关键所在, 由于现有全景技术的技术所限, 交互的可控自由度十分有限, 但理论上空间操纵的自由度仍有很大的空间可以提升。

4、全景图自动拼接系统实现

全景图的实现是经过对图片一系列的处理, 如拍摄、拼接、融合等一些关键步骤, 从而形成一副从视觉上观察是一副完整并且连续的一系列图像的有机、有序的组合。

将拍摄得到的图片分组拼接时, 每组图像都没有一个固定合理的排列顺序, 这些图片中包含了构成全景图的部分子集图像和不属于全景图像子集的噪声图像。而漫游系统中全景图是自动生成的。

系统实现。下图为对某景点全景图的虚拟漫游的实现, 图3, 图4为对景点的拼接后的全景图。

上图中, 左上角是系统的导航系统, 用户可以根据自己的需要选择其他景点。根据选择景点的不同, 系统所呈现的景点信息也会随之发生不同变化。用户通过鼠标可以直接定位感兴趣的范围, 然后通过键盘上的上、下、左、右键选择去向, 也可以选择全屏观看, 对全景图像进行旋转等功能, 大大提高了系统的灵活度。

5、结语

本论文运用图像拼接、图像融合理论, 编程实现全景图的拼接及融合过程, 结合虚拟漫游技术实现了虚拟场景漫游及导航、半视点360×360度无视觉死角浏览、全方位地漫游整个景点区域场景的功能;也方便地实现全景图的漫游、实景展示的功能, 使用户体验更加真实有效。

实验结果表明, 该系统在全景图的漫游及导航功能在效率和精确度方面都有良好的可用性。系统的实现, 为旅游业的发展提供了有力支持。

参考文献

[1]王娟, 师军, 吴宪祥.图像拼接技术综述.计算机应用研究.2008, 26 (07) :1940-1943.

[2]Jungpil Shin, Yu Tang.Deghosting for Image Stitching withAutomatic Content-Awareness.Pattern Recognition.2010, 23 (26) :26-27.

[3]赵亮.柱面全景图全自动拼接系统研究与实现: (硕士学位论文) .北京:北京化工大学, 2009.

[4]刘雪香.基于图像的虚拟漫游系统关键技术研究: (硕士学位论文) .淄博:山东理工大学, 2009.

虚拟数据视图 篇4

关键词:实视图,背包,遗传算法,ECA算法

数据仓库中存储着大量来自于不同分布的、异质的数据, 这些数据在数据仓库中以视图形式存在, 然而这些视图并不全都实际存在的。我们把物理上实际存在的视图称作实视图, 在需要时从其他视图或源数据库中导出的视图称作虚视图[1]。所谓视图的物化就是指将虚视图转化为以表的形式存放的实视图的过程。当基础数据源由于插入、删除和修改而引起数据更新时, 实视图也必须随着更新保持与基础数据源的一致性, 以确保访问查询结果正确。实视图的维护是数据仓库设计中必须要考虑的重要问题。

1. 视图物化的遗传算法描述

视图物化过程相当于在有限空间内使得视图物化收益最大, 因此等价于背包问题, 属于N P问题。

采用遗传算法解决于背包问题时, 涉及到约束条件满足下的遗传编码方法, 以及选择、交叉、变异操作算子的设计等方面。这里采用简单的二进制编码描述, 若视图被物化为1, 否则为0。通过轮盘赌选择法选择视图, 按概率进行单点随机杂交, 对种群中适应度最差的个体进行变异, 使其变异后的适应度至少大于或等于其原适应度。当某代得到的结果满足要求或者当前代数等于结束代数时算法结束, 否则重复选择、交叉、变异[2]。视图物化的遗传算法描述如下:

1) 随机产生S-1个0~2n-1之间的整数 (其中n为视图个数, S为群体规模) , 将其变为二进制表示, 第i位为1表示第i个视图被选择, 若为0, 则表示第i个视图未被选择 (其中i从1到n) 。

2) 适应度函数。计算群体中各个个体的适应度, 记每个视图物化收益为vi, 视图物化后实视图所占的总空间为wi

if (wi≤总的存储空间)

此个体的适应度=vi

else

此个体的适应度=vi+P* (wi-总的存储空间) 其中P为惩罚系数。

3) 将以上个体作为第0代, 记录此代最高适应值的个体为当前最高适应度个体。

4) 当此代适应值不满足最高要求并且当前代数小于初始化设定最大代时, 进行 (1) ~ (4) 循环, 否则结束。

(1) 复制:按照每个个体的适应值得到它的适应值范围, 如第一个个体的适应值为100, 则它的适应值范围为1~100;第二个个体的适应值为200, 则它的适应值范围为101~300, 以此类推, 得到每个个体的适应度, 这里假设最后一个个体的适应值范围为999~1999, 利用轮盘赌选择法, 即随机产生1个1~1999之间的整数, 看此数落在哪个个体的适应度范围内, 则将那个个体复制到下一代。设最终实视图个数为P, 则复制P次, 产生下一代被复制的个体群。

(2) 杂交:每次以概率Pc随机选择两个个体进行杂交。

(3) 变异:以概率Pm每次选择一个当前个体群中适应值最差的个体进行变异。首先在当前个体群中找出适应值最差的个体, 然后随机产生一个1~n之间的整数s, 在此个体的第s位上进行变异, 原位0则改为1, 原为1, 则改为0, 最后将新产生的个体的适应值与原个体的适应值相比较, 若有提高则此次个体变异成功, 原个体被变异, 否则重新随机选择变异位, 如试3次若始终不能高于原个体的适应值, 则变异失败, 保留原个体。

(4) 用此代最高适应值的个体的适应值与上一次所记录的最高适应度个体的适应度比较, 若比上一次好, 则将此次个体记录为当前最高适应度个体。

2. 实视图的维护ECA算法简介

ECA算法当基本数据源发生的更新, 通过增量更新维护视图, 若发送给数据源的查询还未返回就又收到了新的更新消息时, 数据仓库记录下这些更新事件, 并在以后发送一个补偿查询来消除其不一致性。

1) 标记定义[3、4]

假定实体化视图定义为查询表达式其中ri等于ri或者等于ri上的更新元组ti。在ECA算法中经常需要从视图定义或以前的查询表达式中导出一个新的查询表达式, 为此定义一个新的运算操作Q<U>, 对于任意的查询表达式Q=∑Ti, 假定U是关系rk上的一个更新操作, tuple<U>是对应的更新元组, 则Q<U>=∑Ti<U>,

UQS记载所有已经发送给数据源进行计算但还未返回结果的查询表达式的集合;

Ui表示关系ri上的一个更新操作。

2) 算法描述如下:

在数据源端:一旦执行完某个事务操作Ui, 数据源立即向数据仓库报告;当收到数据仓库的查询请求Qi时, 根据当前数据源的状态计算Qi, 并返回查询结果Ai。

在数据仓库端:

⑴将collect和UQS初始化为φ;

⑵当收到数据源报告的更新消息Ui时, 令向数据源发送一个计算查询表达式Qi的值的消息UQS←UQS+{Qi}

⑶当接收到数据源返回的查询结果Ai时

如果UQS=φ, 则MV←MV+collect

3. ECA算法的不足

ECA算法是基于查询更新先进先出 (FIF O) 的假定[5], 但在实际情况中, 由于网络传输或其它原因这种FIFO的假定是不存在的, 采用传统的ECA算法将无法保证视图的一致性。为便于理解ECA算法, 下面通过一个具体反例说明。

例:设一源数据库两表r1, r2结构如下:

定义相应数据仓库视图为, 其初始元组集MV为[1, 5, 6]。若源数据库依次发生如下三个更新操作: (1) U1:insert (r1, [2, 5]) ; (2) U2:insert (r2, [5, 7]) ; (3) U3:delete (r1, [1, 5]) 。记U1发生后视图V查询返回A1时间为t1, U2发生后视图V查询返回A2时间为t2, U3发生在t1、t2之间。现将视图维护ECA算法分步描述如下:

1) 对表r1进行insert (r1, [2, 5]) 操作, 并将表修改信息U1发往数据仓库, 数据仓库收到信息U1, 发送查询UQS={Q1};

2) 表r2进行insert (r2, [5, 7]) 操作, 并将表修改信息U2发往数据仓库, 数据仓库收到信息U2, 发送查询;

3) 源数据库收到查询Q1, 并将计算值发往数据仓库, 数据仓库收到计算值A1, UQS={Q2}, 修改临时集collect:collect←collect+Ai={[2, 5, 6], [2, 5, 7]};

4) 对表r1进行delete (r1, [1, 5]) 操作, 并将表修改信息U3发往数据仓库, 数据仓库收到信息U3, 发送查询, UQS={Q2, Q3};

5) 源数据库收到查询Q2, 并将计算值A2=φ发往数据仓库, 数据仓库收到计算值A2, 修改临时集collect:collect←collect+A2={[2, 5, 6], [2, 5, 7]}且UQS={Q3};

6) 源数据库收到查询Q3, 并将计算值A3={-[2, 5, 6]}发往数据仓库, 数据仓库收到计算值A3, 修改临时集collect:collect←collect+A3={[2, 5, 7]}且UQS=φ;由于UQS=φ, 于是有MV←MV+collect={1, 5, 6}, [2, 5, 7]}, 且有collect=φ。

很明显, 正确的MV={2, 5, 6}, [2, 5, 7]}故以上结果不正确, 原因就在于第7步的删除操作后计算Q2、Q3所基于的表r1与计算Q1所基于的表r1已发生变化, ECA算法中假定的FIFO条件在实际情况中不满足。基于此, 将给出一种改进的ECA+算法, 使其满足实际情况中对视图的维护。

4. ECA+算法

ECA+算法的基本思想是对同一关系ri的多次更新操作或在视图查询前通过事务进行处理一并提交, 或在每次更新前判断上次更新后仓库的查询是否已正确返回。

算法描述如下:

5 结论

在数据仓库建设过程中, 数据量的增加会使得数据仓库查询维护效率下降, 使用ECA+算法可以提高数据仓库的维护效率。

参考文献

[1]张柏礼, 朱文.关于实视图维护问题的研究[J].现代电子技术.2007;1

[2]刘杰, 蒋朝惠, 党继胜.基于遗传算法的受限物化视图[J].网络安全技术与应用.2007;6

[3]熊己兴, 王元珍.数据仓库中实化视图的一致性维护算法—ECA算法的实现[J].计算机应用.2001;4

[4]王斌, 徐泉林.一种物化视图维护算法[J].山东电子.2003;3

虚拟数据视图 篇5

ETL, 是Extraction、Transformation和Loading ( 数据抽取、转换和加载) 的简称。它主要完成数据从业务系统到数据仓库的传输。ETL的主要功能包括:

(1) 数据的抽取:从不同的网络、不同的操作平台、 不同的数据库及数据格式、不同的应用中抽取数据以及相关元数据;

(2) 数据的转换:数据转化 ( 数据合并、汇总、过滤、 转换等) 、数据的重新格式化和计算、数据清洗;

(3) 数据的加载:跨网络、操作平台, 将数据同步或异步加载到目标数据仓库中。

本文以地税省级数据集中项目为背景, 论述了Oracle的物化视图技术在ETL数据抽取方面的实际研究与应用。

2数据抽取的设计与实现

假设现在有3个地方业务系统的数据库, 即DBMS_ 业务系统1、DBMS_ 业务系统2、DBMS_ 业务系统3, 为了将这三个地方业务系统的数据整合在总的数据库中, 用物化视图实现数据抽取, 具体步骤如图1所示:

(1) 在这3个业务系统中对需要进行数据抽取的业务表分别建立物化视图日志。

(2) 在中转区建立3个快速刷新的物化视图。

(3) 在中转区的3个物化视图上分别创建对应的物化视图日志。

(4) 在数据仓库中建立1个快速刷新的物化视图。

在这里基本上已完成ETL的数据抽取工作, 将这3个业务系统中的业务数据汇总在数据仓库的一张总的业务数据表中。

数据集中的一个基础性工作是:在不影响各个地方税务数据中心生产系统性能的前提下, 抽取各个地方局和数据中心的数据进行清洗、转换、汇总、合并。这其中要用到两个软件产品:数据同步软件与ELT软件 ( 含物化视图) 。利用物化视图技术实现ETL的数据抽取, 主要分为三大步骤:

(1) 在各个地方局真实生产系统的用户下建立需抽取的十七张表的物化视图日志;

(2) 对各个地方局的真实生产系统分别建立对应用户, 共3个用户, 并授予用户查看汇总后用户下抽取这十七张表的权利;

(3) 在目标库上建立各个税务中心对应的用户, 并在这些用户下分别建立各个市税务中心真实生产系统下用户的数据库链路, 通过这些数据库链路建立跨库抽取的物化视图, 实现一对一抽取, 即一个表对应一个物化视图。

3测试结果及问题解决

数据抽取及汇总是其他各项工作的基础, 技术难度较大, 有多种技术方案可以选择。重点考虑了4种可选方案, 其中1种方案 (Oracle流复制) 是Oracle数据库系统自带的免费方案, 另外3种方案需购买第三方的系统软件, 需花费几百万元经费。

为验证免费的Oracle流复制是否适合本项目的实际需要, 税务中心决定在其中一个市局进行实际环境的测试, 以项目开发方为主导实施测试。具体安排了两轮数据抽取测试, 测试时间分别为2010年11月至12月和2011年3月至4月。 第一轮测试是Oracle流复制4种可选方案的基本测试, 整体情况良好, 得出基于异地捕获的流复制对远程网络带宽压力较大, 不适合目前远程网络带宽 ( 共享2M) , 本地流复制技术对远程网络压力小, 适合本项目。但本地捕获存在配置复杂的缺点。第二轮测试是在第一轮测试的基础上, 重点对本地捕获的表级流复制进行数据抽取, 经过2个多月的试运行和1个月的正式运行, 数据同步情况良好 (30秒以内) 。

随后, 利用Oracle的数据抽取、清洗、加载工具 (ETL) 及物化视图等技术, 把抽取到税务中心的各个市局的部分数据 (税务登记、应征税收与已征税收) 进行了汇总、合并, 形成税务数据中心的部分汇总数据。测试的整体情况良好, 数据汇总速度可到达准实时 (1 ~ 4分钟内) 。

4结语

4.1 Oracle流复制数据抽取方案适合本项目

Oracle流复制方案是从四个数据抽取可选方案 (DSG公司的DSG Real Sync、Quest公司的Quest Shareplex、Oracle公司的Oracle golden gate和Oracle流) 中, 选择出来的一种免费 ( 其他三种方案都需要几百万经费) 、兼容性好的方案。 该方案目前在国外有较多成功案例, 但在国内尚未见到成功案例。

4.2采用表级、本地捕获流复制适合目前的2M远程网络带宽

Oracle流复制在4种可选方案 (用户级异地捕获流复制、 用户级本地捕获流复制、表级异地流捕获复制和表级本地捕获流复制) 中, 选择了表级的本地流复制方案, 该方案占用网络带宽较小, 且未来修改、扩充灵活, 系统稳定性好。

4.3本地表级流复制集成性好、可靠性高

本地表级流复制方案与各个市局税务中心的数据中心环境复杂 ( 数据中心集群环境 (RAC) 和灾备方案 (Data Guard) ) 集成性好、可靠性高。

4.4本地表级流复制方案对市局税务中心前台应用系统没有产生影响

该项目数据中心采用PC服务器而不选用小型机, 既满足了本项目要求, 又可节约经费。

摘要:笔者以税务中心数据集中项目为背景, 结合实际项目需求, 利用物化视图技术实现多个分布在不同区域的地方局税收数据信息进行ETL数据抽取, 并通过创建多级物化视图实现数据汇总。

关键词:数据抽取,物化视图,ETL

参考文献

[1]谷长勇, 王滨, 陈杰, 等.ORACLE 11g权威指南[M].北京:电子工业出版社, 2008.

[2]程文静, 程文芳.基于ORACLE复制和分区技术的分布式网通销售系统的研究与设计[J].湖北师范学院学报 (自然科学版) , 2006:36-39.

上一篇:绿色云计算下一篇:解读中年危机