数据库安全知识(共8篇)
数据库安全知识 篇1
文件处理系统存在问题:数据的冗余和不一致,数据访问困难,数据孤立,完整性问题,原子性问题,并发访问异常,安全性问题
数据库三级抽象物理层:最低层次的抽象,描述数据实际上是怎样存储的。逻辑层:比物理层层次稍高的抽象,描述数据库中存储什么数据及这些数据间存在什么关系。视图层:最高层次的抽象,只描述整个数据库的某个部分
数据操纵语言DML:使用户可以访问或操作那些按其某种适当的数据模型组织起来的数据。过程化DML:要求用户指定需要什么数据以及如何获得这些数据。非过程化DML:只要求用户指定需要什么数据,而不指明如何获得这些数据 事务状态图 活动状态:初始状态;事务执行时处于这个状态。部分提交状态:最后一条语句执行后。失败状态:发现正常的执行不能继续之后。中止状态:事务回滚并且数据库已恢复到事务开始执行前的状态之后。提交状态:成功完成后 事务进入中止状态,系统有两种选择:重启事务:事务中止是硬件错误或不是由事务的内部逻辑产生的软件错误时。杀死事务:事务的内部逻辑错误,或者由于输入错误,或所需数据在数据库中没有找到
可恢复调度:对于每对事务
数据库安全知识 篇2
最近, 有不少细心的读者纷纷询问刊登在《实用妇产科杂志》封面右上角的CODEN SFZHA7是什么意思。SFZHA7是本刊的CODEN码。按国际惯例登在期刊封面的右上角, 国际标准刊号的下方。
CODEN (Code Number) 是美国ASTM (American Society for Testing and Materials) 制定的科技期刊代码系统, 被国际公认。美国《化学文摘》 (CA) 、《工程索引》 (EI Compendex) 、《乌利希国际期刊指南》 (Ulrich’sIPD) 等国际检索系统, 以及各国图书馆收藏部门均采用CODEN码进行文献/期刊识别。
地方文献数据库的知识产权研究 篇3
[关键词] 图书馆 地方文献 数据库 知识产权 合理使用
1 前 言
据我国第26次互联网报告可知:截至2010年6月,中国网民规模达到4.2亿,互联网普及率攀升到31.8%,我国网民的互联网应用表现出商务化程度迅速提高、娱乐化倾向继续保持、利用网络作为沟通工具不断加强的特点。网络信息时代不仅改变了人们获取信息的方式、方法,而且也给文献信息中心——高校图书馆带来了机遇与挑战。信息网络时代不仅使信息資源共建共享成为可能,而且也为实现信息資源共享提供了技术支持,用户通过网络方便快捷地获取自己所需的相关信息,从某种程度上来说,网络极大地促进了科学的进步和文化的发展。随着世界经济、科技的进步和世界贸易自由化进程的加快,知识产权在世界贸易中的地位越来越重要,对知识产权的保护已成为多边贸易体系的一个重要部分。作为文献信息中心的图书馆,为了在网络时代中求得生存与发展,要有计划有步骤地自建特色数据库,建设具有其独特优势的信息資源保障体系。但在自建数据库的过程中,必然会牵涉到知识产权保护问题,本文对自建数据库——地方文献数据库的知识产权进行研究,旨在提高图书馆在自建地方文献数据库过程中的知识产权保护意识,充分利用知识产权中的合理使用等有利因素,进一步做好地方文献数据库建设。
2 地方文献数据库的概念、特点与作用
1995年7月,欧洲议会和部长理事会通过的“欧盟数据库法律保护指令”中正式在国际条约中使用了“数据库”(database)这一概念,并在《欧洲议会与欧盟理事会关于数据库法律保护的指令(96/9/EC)》中首次以法律文件形式明确了数据库的定义:数据库是指经系统或有序地安排,并可通过电子或其他手段单独加以访问的独立作品、数据或其他材料的集合。由此可知,地方文献数据库是指通过系统,将具有某一地方地域特征的各种载体的文献信息进行收集、加工、整理,并按一定的顺序排列,提供多种检索途径的地方文献信息的数据集合。通过对地方文献进行深加工,使其变得有序化、科学化、标准化,易于查找与利用。地方文献数据库具有信息载体多样、品种齐全、内容丰富、更新速度快、检索途径与方式多样、检索速度快捷等特点,对于地方政治繁荣与稳定、经济的腾飞与发展、文化的交流与发展具有重要意义。
3 地方文献数据库建设过程中涉及到的知识产权问题
随着我国加入世界贸易组织,我国对知识产权的保护日益重视。近年来知识产权的侵权诉讼案也有所增加。图书馆在自建地方文献数据库时,会涉及到许多知识产权问题,如应如何使用他人作品?使用他人作品时,图书馆的合理使用有哪些?地方文献数据库建成后应如何利用《着作权法》进行保护?等等。
3.1 地方文献数据库信息源选取上的知识产权问题
地方文献数据库信息源主要由如下两大部分构成:一是免费公共信息資源,二是保护期内的信息資源。图书馆在自建地方文献数据库的过程中,在信息源的选择上对以上两部分的信息源要分别对待。
3.1.1 免费公共信息源选取上的知识产权问题 免费公共信息源由如下几部分组成:超过知识产权保护期的作品;法律、法规、国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件及官方正式译文;时事新闻;历法、通用数表、通用表格和公式。
?超过知识产权保护期的作品的选取问题。《着作权法》第21条对着作权的保护规定:公民的作品,其发表权、着作财产权的保护期为作者终生及其死亡后50年,截止于作者死亡后第50年的12月31日;如果是合作作品,截止于最后死亡的作者死亡后第50年的12月31日。
法人或者其他组织的作品、着作权(署名权除外)由法人或者其他组织享有的职务作品,其发表权、着作财产权的保护期为50年,截止于作品首次发表后第50年的12月31日,但作品自创作完成后50年内未发表的,不受着作权法保护。
电影作品和以类似摄制电影的方法创作的作品、摄影作品,其发表权、着作财产权的保护期为50年,截止于作品首次发表后第50年的12月31日,但作品自创作完成后50年内未发表的,不受着作权法保护。
上述各种超过着作权法保护期的作品,图书馆在建立地方文献数据库时,对图书馆本馆所拥有的地方文献的善本、古籍及历史性資料等印刷型文献,可自行实行数字化处理,而无需征得着作权人同意,也不需支付酬金,但不得损害着作权人的人身权。
?不受《着作权》保护的作品的选取问题。《着作权法》第5条第1款规定:由国家立法机关、司法机关和行政机关创作的法律、法规、国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件,及其官方正式译文(官方文件和官方译文)等不受着作权保护,属于免费公共信息資源。图书馆在自建地方文献数据库时,凡是涉及到某一地域的法律、法规及当地政府的决议、决定等信息資源可自由获取,无需征得着作权人同意,也不需支付酬金,但是要遵照有关法律的相关规定,同时也应该体现在合理使用的具体条款中。
《着作权法》第5条第2、3款规定:时事新闻、历法、通用数表、通用表格和公式等不受《着作权法》保护。故图书馆在自建地方文献数据库时,对于通过报纸、期刊、广播电台、电视台等媒体报道涉及某一地域的单纯事实消息,可以自由获取,而无需征得着作权人同意,也不需支付酬金。着作权人声明不许转载、转贴等除外。
具有通用性、工具性的历法、数表、通用表格和公式等不受《着作权法》保护,图书馆在自建地方文献数据库时,可自由获取。但是一个家族的家谱、族谱等是受《着作权法》保护的,如果图书馆在自建地方文献数据库时,要将所收集到的还在保护期内的家谱、族谱进行数字化,则需征得着作权人的同意,并支付酬金。
3.1.2 保护期内的信息源选取应注意的知识产权问题
?保护期内纸质信息源的选取问题。图书馆应充分利用《着作权法》中对着作权的限制,对在保护期内的地方文献信息进行合理使用。《着作权法》第22条第6、8款规定:为学校课堂教学或者科学研究,翻译或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行;图书馆、档案馆、纪念馆、博物馆、美术馆等为陈列或者保存版本的需要,复制本馆收藏的作品等,可以不经着作权人许可,不向其支付报酬,但应当指明作者姓名、作品名称,并且不得侵犯着作权人的其他权利。图书馆在自建地方文献数据库时,可将本馆已购买的地方文献中的纸质資源数字化,以供教学、科研的需要,但不得以营利形式出版发行,同时应将这部分文献信息資源的使用范围限制在图书馆的IP地址范围内。
?网络作品的合理使用问题。网络作品是指通过网络出版的各种作品形式。网络作品必须具备4个条件方能受《着作权法》的保护:①必须是作者自己创作,即具有独创性的作品;②必须是属于文学、艺术或科学领域的作品;③必须以一定的形式表现或固定下来的作品;④作品的内容不得违反宪法和法律,不得损害社会公共利益[1]40-41。网络环境下的合理使用是指在特定的条件下,法律允许他人自由使用享有着作权的网络作品而不必征得着作权人的同意,也不必向着作权人支付报酬的制度[1]122。合理使用制度很好地解决了文化信息的全社会共享与权利人的控制使用之间的矛盾,网络作品的合理使用不能损害权利人的经济利益,因此,图书馆在自建地方文献数据库时,对网络作品的合理使用必须限制在对着作权人的经济利益没有影响或影响甚微的情况下。
网络上有大量的开放式信息資源,如论坛、新闻组、聊天室里发的信息,对于这类作品中的地方文献信息源,如果作者没有特别声明不得转载的,图书馆在自建地方文献数据库时,可合理使用,并且不用支付报酬。但是,在地方文献数据库中要采用技术措施,只允许读者在馆内IP范围内阅读而不允许复制。
欧盟数据库保护指令,对数据库的合法用户可以不经数据库制作者同意,为教学科研目的,复制数据库内容的实质性部分,但要标明材料的来源,使用的内容也不能超出实现非商业性目的所需的程度;也可以为任何目的,复制或传播数据库内容的非实质性部分[2]。我国目前还没有颁布数据库保护条例,但参照欧盟的数据库保护条例,图书馆对自己已购买的网络数据库中的某些具有某一地域特征的地方特色文献信息資源可以少量复制到自建地方文献数据库中,但只能无偿提供给馆内IP范围内的读者使用。
另外,图书馆在自建地方文献数据库时,利用搜索引擎检索到有关某一地域的地方文献网站,可以复制其网页,但不得损害网站权利人的合法权利,不得破坏权利人为作品设置的技术措施,也不得提供复制功能。网页权利人声明不允许复制除外。
3.2 地方文献数据库本身享有的知识产权问题
据世界知识产权组织统计,大多数国家大都将数据库解释为汇编作品的一种,将数据库按汇编作品对待。根据着作权法保护原则,只有内容或编排构成智力创作的数据库才能受到保护,这点已得到了国际上的认可。但是随着计算机、网络通讯等技术的发展,数据库的复制越来越快速、简单,因而网络数据库更容易遭受侵害。在欧美的推动下,世界知识产权组织于1996年8月30日公布了《关于数据库知识产权条约的实体条款的基本建议》。虽然该数据库条约草案并没有实质生效。但是,根据“额头出汗原则”,只要在数据库开发中,在数据库的材料收集、选择、组织和编排方面确实付出了辛勤劳动,投入了经费和时间,使用了一定的技术和手段,则数据库无论是否具有独创性,都可以获得着作权法的保护[1]80-82。因此图书馆自建地方文献数据库时,无论是从数据库内容材料的收集、选取、组织和编排方面,还是在经费与时间方面都投入了不少财力与精力,故图书馆的自建地方文献数据库本身应受到知识产权法的保护。
地方文献数据库的价值性、投資的巨大性、复制和侵权的简便性,决定了必须对地方文献数据库采取有力的法律保护。图书馆在自建地方文献数据库时,可利用数字水印技术为地方文献数据库提供安全、合法的交流平台,系统利用数字水印技术通过设置用户的使用权限来控制用户的資源利用范围,提高地方文献传输、下载的安全性。通过在网页中加入合适的数字水印,再依据嵌入水印鉴定文档是否被盗版或篡改,防止数据库中涉及的文献信息内容被篡改或非法盗用,从而从技术层面上实现对地方文献数据库的保护[3]。
3.3 地方文献数据库服务中涉及到的知识产权问题
地方文献数据库分书目数据库及全文数据库,书目数据库的服务不会涉及到知识产权问题,但是,图书馆在提供全文数据库服务时,则要注意数据库服务中涉及到的知识产权问题。在全文数据库中,对于从网络上下载的免费网络信息資源,在提供全文服务时,要注意判别网络信息資源本身的准确性,从而保证在地方文献数据库中提供的相关全文信息的准确性与权威性。因为《着作权法》第10条第4款规定:保护作品完整权,即保护作品不受歪曲、篡改的权利。如果在地方文献数据库中,提供的信息資源缺乏准确性与完整性,则容易侵犯着作权人的人身权,从而使图书馆无辜卷入知识产权的侵权风波,使图书馆在名誉上及财产上蒙受损失。另外,对将本馆已购的纸质文献进行数字化而成的电子全文及从网络数据库上下载的全文信息,则要控制好其获取范围,即要保证只能在图书馆IP范围内才能阅读,同时不提供复制服务。只有这样,才能保证地方文献数据库中所收集的原始材料着作权人的合法权益不受侵害。
4 结 语
《普通高等学校图书馆规程(修订)》第11条规定:“高等学校图书馆应根据学校教学、科学研究的需要,根据馆藏特色及地区或系统文献保障体系建设的分工,开展特色数字資源建设和网络虚拟資源建设”。图书馆为了自身的发展,为了更好地为学校的教学、科研服务,同时,在資源建设中,做到人无我有,人有我特,人特我优,在資源建设中一般都会投入大量的人力、物力,用一代或几代图书馆人的艰苦努力,花较长的时间,自建地方文献数据库等特色数据库。但是在法律意识不断加强的今天,作为文献信息中心的图书馆应充分依据《着作权法》、《反不正当竞争法》等有关规定,在合理合法的情况下做好地方文献数据库等特色数据库的建设工作,正确规避知识产权风险。
参考文献:
[1] 党跃臣,曹树人.网络出版知识产权导论.北京:北京理工大学出版社,2006.
[2] 李扬.网络知识产权法.长沙:湖南大学出版社,2001:80.
[3] 李锦兰,沈秉乾.数字水印技术在茂名地方文献数据库中的应用.兰台世界,2011(2):29-30.
数据库安全知识 篇4
(1)数据库(DB):是一个以一定的组织形式长期存储在计算机内的,有组织的可共享的相关数据概念(2)数据库管理系统(DBMS);是位于用户与操作系统之间的一层数据管理软件,是数据库系统的核心(3)数据库系统(DBS);计算机系统中引入数据库后的系统构成(4)实体;凡是现实世界中存在的可以相互区别开,并可以被我们所识别的事物.概念等对象均可认为是实体(5)属性;是实体所具有的某些特征,通过属性对实体进行刻画.实体由属性组成(6)码;唯一标识实体的属性集称为码(7)域;属性的取值范围称为该属性的域
(8)实体型;具有相同属性的实体必然具有共同的特征和性质。用实体名和属性名集合来抽象和刻画同类实体,称为实体型。(9)实体集;同一类型实体的集合。(10)1 :1联系:如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,反之亦然,那么E1和E2的联系称为“1:1联系”。1:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中一个实体有联系,那么E1和E2的联系是“1:N联系”。M:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1和E2的联系称为“M:N联系”。(11)现实世界(现实世界是指我们要管理的客户存在的各种事物.事物之间的发生.变化过程)、观念世界(信息世界)、数据世界 2.数据管理技术的发展阶段
人工管理阶段(数据不保存,系统没有专用的软件对数据进行管理,数据不共享,数据不具有独立性)、文件系统阶段(数据以文件形式可长期保存下来,文件系统可对数据的存取进行管理,文件组织多样化,程序与数据之间有一定独立性)、数据库系统阶段(数据结构化,数据共享性高,冗余少于且易扩充,数据独立性高,有统一的数据控制功能)3.数据库系统的特点
(1)数据结构化
(2)共享性高,冗余度低,易扩充
(3)独立性高
(4)由DBMS统一管理和控制 4.DBMS的数据控制功能
(1)数据的安全性保护
(2)数据的完整性检查
(3)并发控制
(4)数据库恢复 5.数据模型的组成要素
数据结构 数据结构是所研究的对象类型的集合,是刻画一个数据模型性质最重要的方 面,是对系统静态特性的描述。
数据操作 数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集 合,包括操作及有关的操作规则。是对系统动态特性的描述。
数据的约束条件 数据的约束条件是一组完整性规则的集合。完整性规则是给定的数据 模型中数据及其联系所具有的制约和依存规则,以保证数据的正确、有效、相容。6.最常用的数据模型
层次、网状、关系、面向对象模型 7.关系模型
关系: 一张表 元组: 表中的一行 属性: 表中的一列
主码: 表中的某个属性组,它可以唯一确定一个元组 域: 属性的取值范围 分量: 元组中的一个属性值 关系模式: 对关系的描述。
表示为:关系名(属性1,属性2,…属性n)8.关系数据模型优缺点
(1)建立在严格的数学概念基础之上
(2)概念单一
(3)存取路径对用户透明 9.数据库系统的三级模式结构
内模式、外模式、模式
二级映射
10.数据库系统的组成:数据库、软件系统、硬件系统、数据库管理员四部分组成。11.数据描述 概念设计、逻辑设计和物理设计等各阶段中数据描述的术语,概念设计中实体间二元联系的描述(1:1,1:N,M:N)。
12.数据模型 数据模型的定义:是专门用来抽象,表示和处理现实世界中的数据和信息的工具。两类数据模型(概念模型和逻辑模型),逻辑模型的形式定义(逻辑模型是按计算机观点对数据建模,主要包括层次模型、网络模型、关系模型、面向对象模型、对象关系模型;物理模型是对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方法。),ER模型,层次模型、网状模型、关系模型和面向对象模型的数据结构以及联系的实现方式。13.DB的体系结构 三级结构,两级映象,两级数据独立性,体系结构各个层次中记录的联系。
14.DBMS(数据库管理系统)
DBMS的工作模式、主要功能和模块组成。DBMS的工作模式有六点:
接受应用程序的数据请求和处理请求; 将用户的数据请求转换成低层指令; 实现对DB的操作;
从对DB的操作中接受查询结果; 对查询结构进行处理; 将处理结果返回给用户。
DBMS的主要功能有DB的定义、操纵、保护、维护和数据字典等五个功能。15.DBS(数据库系统)
DBS的组成(DBS由DB、硬件、软件和DBA等四个部分组成),DBA(DBA是控制数据整体结构的一组人员,负责DBS的正常运行,承担创建、监控和维护DB结构的责任。),DBS的全局结构(数据库用户有四类:DBA,专业用户,应用程序员,终端用户。DBMS的查询处理器有四个模块:DML编译器,嵌入型DML预编译器,DDL编译器,查询运行核心程序。DBMS的存储管理器有四个模块:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器。磁盘存储器中有五种数据结构:数据文件,数据字典,索引文件,统计数据组织和日志。),DBS结构的分类。
第二章
关系数据库
1.基本概念
关系,候选码,主码,主属性,非主属性,键 2.完整性约束
实体完整性、参照完整性、用户定义完整性 3.笛卡儿积 4.关系的性质
列是同质的
不同的列可出自同一个域,每一列为一个属性,不同的属性要有不同的属性名
列的顺序无所谓
任意两个元组不能完全相同 行的顺序无所谓
分量必须取原子值,即每一个分量必须是不可分的数据项
5.关系的完整性
实体完整性、参照完整性、用户定义的完整性 6.关系代数
(1)并、交、差、广义笛卡儿积
(2)选择
(3)投影
(4)连接:等值连接、自然连接
超键(Super Key):在关系中能惟一标识元组的属性集称为关系模式的超键。
候选键(Candidate Key):不含有多余属性的超键称为候选键。也就是在候选键中,若要再删除属性,就不是键了。
主键:(Primary Key):用户选作元组标识的一个侯选键称为主键。一般,如不加说明,则键是指主键。
外键:(Foreign Key):如果关系R中属性K是其他模式的主键,那么K在模式R中称为外键
例如:学生(学号,姓名,性别,驾驶证号)假定学生不重名 超键:(学号,姓名),(学号,性别),(学 号,姓名,性别),(姓名,性别)等等 候选键:学号,姓名
主键:你在数据库定义的时候,如果选择学号作为 键,那么学号就是候选键
外键:驾驶证号 本章的重要概念(1)基本概念
关系模型,关键键(主键和外键),关系的定义和性质,三类完整性规则,ER模型到关系模型的转换规则。(2)关系代数
五个基本操作,四个组合操作,七个扩充操作。
第三章
SQL语言 1.SQL的特点
综合统一
高度非过程化
面向集合的操作方式
以同一种语法结构提供两种使用方式
语言简洁,易学易用
2.表
(1)创建表 create table
create table student
(Sno char(5)not null,Sname char(20)unique,Ssex char(1),Sage int,Sdept char(15));(2)create table customer(customer_name char(20)not null,customer_street char(30),customer_city char(30),primary key(customer_name));
(3)create table account(account_number char(10)not null,branch_name char(15),balance
int,primary key(account_number),foreign key(branch_name)reference branch(branch_name),check(balance>=0));
(2)修改表 alter table
(3)删除表 drop table 3.索引
(1)创建索引 create index
(2)删除
drop index 4.查询 select
(1)格式
(2)单表查询:选择列、满足条件、排序、分组、集函数
(3)连接查询
(4)嵌套查询
IN、比较、(ANY 或 ALL)、EXISTS
(5)集合查询
5.更新数据
INSERT、UPDATE、DELETE 6.视图
(1)建立视图 Create view
(2)视图的作用 7.数据控制
(1)授权 Grant
(2)收回权限 Revoke 本章的重要概念
(1)SQL数据库的体系结构,SQL的组成。
(2)SQL的数据定义:SQL模式、基本表和索引的创建和撤销。
(3)SQL的数据查询;SELECT语句的句法,SELECT语句的三种形式及各种限定,基本表的联接操作,SQL中的递归查询。
(4)SQL的数据更新:插入、删除和修改语句。(5)视图的创建和撤销,对视图更新操作的限制。
(6)嵌入式SQL:预处理方式,使用规定,使用技术,卷游标,动态SQL语句。
第四章
关系数据库的规范化设计
1.函数依赖、部分函数依赖、完全函数依赖、传递依赖 2.1NF、2NF、3NF、BCNF 模式的分解
关系模式的分解需要遵循两个主要原则:
1.满足无损连接分解的要求。
2.既要满足无损连接分解的要求,又要满足保持函数依赖 无损分解的测试方法
算法4.3
无损分解的测试的算法:如何判断是否是无损分解 构造一张k行n列的表格,每列对应一个属性Aj(1≤j≤n),每行对应一个模式Ri(1≤i≤k)。如果Aj在Ri中,那么在表格的第i行第j列处填上符号aj,否则填上bij。
把表格看成模式R的一个关系,反复检查F中每个FD在表格中是否成立,若不成立,则修改表格中的值。修改方法如下:对于F中一个FD X→Y,如果表格中有两行在X值上相等,在Y值上不相等,那么把这两行在Y值上也改成相等的值。如果Y值中有一个是aj,那么另一个也改成aj;如果没有aj,那么用其中一个bij替换另一个值(尽量把下标ij改成较小的数)。一直到表格不能修改为止。(这个过程称为chase过程)
若修改的最后一张表格中有一行是全a,即a1a2„an,那么称ρ相对于F是无损分解,否则称损失分解。
无损分解的测试方法 第一范式(1NF)1NF的定义
如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF 即不能以集合、序列等作为属性值。第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库 但是满足第一范式的关系模式并不一定是一个好的关系模式 第二范式(2NF)
(回顾)定义4.14 对于FD W→A,如果存在X⊂W有X→A成立,那么称W→A是局部依赖(A局部依赖于W);否则称W→A是完全依赖。完全依赖也称为“左部不可约依赖”。(回顾)定义4.15 如果A是关系模式R的候选键中属性,那么称A是R的主属性;否则称A是R的非主属性。
定义4.16 如果关系模式R是1NF,且每个非主属性完全函数依赖于候选键,那么称R是第二范式(2NF)的模式。如果数据库模式中每个关系模式都是2NF,则称数据库模式为2NF的数据库模式。第三范式(3NF)(回顾)定义4.17 如果X→Y,Y→A,且Y→X和
A∈Y,那么称X→A是传递依赖(A传递依赖于X)。
定义4.18 如果关系模式R是1NF,且每个非主属性都不传递依赖于R的候选键,那么称R是第三范式(3NF)的模式。如果数据库模式中每个关系模式都是3NF,则称其为3NF的数据库模式。
将2NF的关系模式规范化为3NF的关系模式,其方法是消除2NF的关系模式中非键属性对键的传递依赖。
本章重要概念
(1)关系模式的冗余和异常问题。
(2)FD的定义、逻辑蕴涵、闭包、推理规则、与关键码的联系;平凡的FD;属性集的闭包;推理规则的正确性和完备性;FD集的等价。
(3)无损分解的定义、性质、测试;保持依赖集的分解。
(4)关系模式的范式:1NF,2NF,3NF,BCNF。分解成2NF、3NF模式集的算法。
第 五 章
数据库设计
1.数据库设计的六个阶段
需求分析、概念结构设计、逻辑结构设计物理结构设计、数据库实施、数据库运行和维护 2.需求分析:
数据字典:数据项、数据结构、数据流、数据存储和处理过程 3.概念结构设计
(1)是整个数据库设计的关键,它通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型
(2)E-R图:基本表示方法 4.逻辑结构设计
是将概念结构转换为某个DBMS所支持的数据模型,并对其进行优化 5.物理设计
(1)为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)6.实施阶段
设计人员运用DBMS提供的数据语言及其宿主语言,建立数据库,编制与调试程序,组织数据入库,并进行试运行 7.运行和维护阶段
数据库应用系统经过试运行后即可投入正式运行。 重构,重组织
本章重要概念
(1)DBS生存期及其7个阶段的任务和工作,DBD过程的输入和输出。(2)概念设计的重要性、主要步骤。逻辑设计阶段的主要步骤。
(3)ER模型的基本元素,属性的分类,联系的元数、连通词、基数。采用ER方法的概念设计步骤。
(4)ER模型到关系模型的转换规则。采用ER方法的逻辑设计步骤。(5)ER模型的扩充:弱实体,超类和子类。
第 七 章 系统实现技术 1.事务
(1)概念
(2)特性:原子性、一致性、隔离性、持续性 2.故障种类事务
内部的故障、系统故障、介质故障 3.恢复的实现技术
(1)数据转储:转储状态、转储方式
(2)日志:基本格式和内容、日志的作用、登记日志文件 并发控制
1.问题:
丢失修改、不可重复读、读“脏”数据 2.封锁
共享锁、排它锁 3.一级封锁协议
(1)事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放
(2)解决的问题:防止丢失修改 4.二级封锁协议
(1)一级封锁协议加上事务T在读取数据R前必须先对其加S锁,读完后即可释放S锁
(2)解决的问题:防止丢失修改、防止读“脏”数据 5.三级封锁协议
(1)一级封锁协议加上事务T在读取数据R前必须先对其加S锁,直到事务结束才释放。
(2)解决的问题:防止丢失修改、防止读“脏”数据、防止不可重复读 6.活锁和死锁
(1)死锁的预防:一次封锁法,顺序封锁法(2)死锁的诊断:超时法,等待图法(3)死锁的解除:选择一个处理死锁代价最小的事务,将其撤消,释放此事务持有的所有锁,使其它事务得以继续进行下去。本章重要概念
事务的定义,COMMIT和ROLLBACK的语义,事务的ACID性质
恢复的定义、基本原则和实现方法,故障的类型,检查点技术,REDO和UNDO操作,运行记录优先原则。
并发操作带来的三个问题,X锁、S锁、活锁、饿死和死锁
完整性的定义,完整性子系统的功能,完整性规则的组成。SQL中的三大类完整性约束,SQL3中的触发器技术。
数据库设计与E-R模型知识点. 篇5
数据库系统概念设计阶段的基本工具是实体联系模型(E-R 模型。E-R模型的基本元素为:实体、联系和属性。
实体是一个数据对象,指应用中可以区别的客观存在的事物。在E-R模型中,实体用方框表示,方框内注明实体的命名。
联系表示一个或多个实体之间的关联关系。在E-R模型中,联系用菱形表示,并用线段将其与相关的实体边接。
实体的某一特性称为属性。在一个实体中,能够唯一标识实休的属性或属性集称为实体标识符。在E-R模型中,属性用椭圆形框表示,加下画线的属性为标识符。
通常,实体的命名采用某个名词(如学生、课程等,联系的命名采用某个动词(如选修、讲授等。
一个联系涉及的实体集个数,称为该联系的元数或度数。通常,同一个实体集内部实体之间的联系称为一元联系(也称为递归联系;两个不同实体集或实体之间的联系称为二元联系;三个不同实体集或实体之间的联系称为三元联系。以此类推。
两个实体型之间的联系可以分为以下3类: 一对一联系(1:1。如果对于实体集A中的每一个实体,实体集B中最多有一个(也可以没有实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系。记为1:1。一对多联系(1:N。如果对于实体集A中的每一个实体,实体集B中有N个实体(N>=0与之联系,反之,对于实体集B中的每一个实体,实体A中最多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为:1:N。
多对多联系(M:N。如果对于实体集A中的每一个实体,实体集B中有N个实体与之联系,反之,对于实体集B中的每一个实体,实体集A中也有M个实体与之联系,则称实体集A与实体集B具有多对多联系,记为M:N。
在E-R模型中,实体通过一组属性来表示,而属性是实体集中每个成员具有的性质描述。根据属性取值的不同将其划分为简单属性、复合属性、单值属性、多值属性、NULL属性和派生属性等: 简单属性:指它们不能再划分为更小的部分,如课程名。
复合属性:指它们可以再划分为更小的部分(即划分为别的属性,如出生日期包括出生年、月、日的成分属性。
单值属性:指所定义的属性对一个特定实体都只有单独的一个值,如学号属性只对应一个学号号码。
多值属性:指对某个特定而言,一个属性可能对应于一组值,假设实体学生还有社会关系这个属性,则一个学生可能有0 个、1个或多个亲属。
NULL属性:当实体在某个属性上没有值或属性值未知时使用NULL值,如某个学生无亲属,则其社会关系属性值是NULL。派生属性:这类属性的值可以从别的相关属性或实体派生出来,如学生的年龄可以通过其出生日期计算出来。
合并局部E-R模型以得到一个全局E-R模型时,可能存在的冲突类型有:属性冲突;结结构冲突;命名冲突等;属性冲突是同一属性可能会存在于不同的局部E-R图,由于设计人员不同或是出发点不同,对属性的类型、取值范围和数据单位等可能会不一致。需要在设计阶段进行统一,各部门协商解决。
命名冲突是相同意义的属性,在不同的局部E-R图上有着不同的意义,需要通过讨论或协商等行政手段解决。
结构冲突是同一实在不同的局部E-R图中有不同的属性,或同一对象在某一局部E-R图中被抽象为实体,而在另一局部E-R图中又被抽象为属性。同一实的属性取各局部E-R图中属性的并集。将属性变换为实体,或将实体变换为属性。
局部E-R图的合并过程中除了解决以上冲突问题之外,还可采取如下优化措施: 实体类型的合并。两个具有1:1联系或1:N联系的实体,可以予以合并,使实体个数减少,有利于减少将来数据库操作过程中的连接开销。
冗余属性的消除。一般在各局部E-R图中的属性是不存在冗余的,但合并后就可能出现冗余。这是因为合并后的E-R图中的实体继承了合并前该实体在分E-R图中的全部属性,属性间就可能存在冗余,即某一属性可以由其他属性确定。冗余联系的消除。在局部E-R图的合并过程中,可能会出现实体联系的环状结构,即某一实体A与另一实体B之间有直接联系,同时A又通过其他实体与实体B发生间接联系。通常直接联系可以通过间接联系所表达,可消除直接联系。当实体间的联系在不同的局部E-R图中有不同的类型时,则应根据应用的语义对实体联系的类型进行综合或调整。
一个实体对于另一个实体(称为强实体具有很强的依赖联系,而且该实体主键的一部分或全部从其强实体中获得,则称该实体为弱实体。
在E-R模型中,弱实体用双线矩形表示,与弱实体的关系,用双线菱形表示。强实体与弱实体的联系只能是1:1或1:N,由于弱实体完全参与联系,因此弱实体与联系之间的线段也应画成双线边。
超类实体是比子类实体更为抽象和概化的概念,而子类实体是比超类实体更为具体、特殊化的概念。
子类实体与超类实体之间具有继承性特点,即子类实体继承超类实体的所有属性,但子类实体本身还可以包含比超类实
体更多的属性。这种继承性是通过子类实体和超类实体有相同的实体标识符来实现的。
在关系模型中,字段称为属性,字段值称为属性值,记录类型称为关系模式。主键也称为主码,是关系中的一个或一组属性,其值能唯一标识一个元组。如果关系模式R中的属性K是其他关系模式的主键,则K在模式R中称为外键。
将E-R模型转换成相应的关系模式时,将每个实体转换成一个关系模式,实体的属性即为关系模式的属性,实体标识符即为关系模式的键。
若实体间的联系是一对一(1:1,则可在两个实体转换成两个关系模式中,任意一个关系模式的属性中加入另一个关系模式的键(作为外键和联系自身的属性。
若实体间的联系是一对多(1:N,则将N端实体类型转换成的关系模式中加入1端实体类型的主键(作为外键和联系类型的属性。
若实间的联系是多对多(M:N,则将联系类型也转换成关系模式,其属性2端实体类型的主键(作为键加上联系类型自身的属性,而该关系模式的主键为2端实体主键的组合。若实体间的联系是1:1:1,则可在3个实体转换成的3个关系模式中,任意一个关系模式的属性中加入另外2个关系
模式的主键(作为外键)和联系自身的属性。若实体间的联系是 1:1:N,则可将 N 端实体类型转换成的 关系模式中加入两个 1 端实体类型的主键(作为外键)和联 系类型的属性。若实体间的联系是 1:M:N,则可将联系类型也转换成关系 模式,其属性为 M 端和 N 端实体类型的主键(作为外键)加 上联系自身的属性,而该关系模式的主键为 M 端和 N 端实体 主键的组合。若实体间的联系是 N:N:P,则可将联系类型也转换成关系 模式,其属性为 3 端实体类型的主键
数据库安全知识 篇6
1.1 数据库基础知识
1.1.1 计算机数据管理的发展 一.数据与数据处理 数据:
是指存储在某种 媒体上能够识别的物理符号。数据处理:
是指将数据转换成信息的过程。
从数据处理的角度而言,信息是一种被加工成特定形式的数据,这种数据形式对于数据接受者来说是有意义的。二.计算机数据管理
计算机数据管理 是指对数据的 分类、组织、编码、存储、检索和维护。计算机数据管理 发展的几个阶段: 1 .人工管理 世纪 50 年代中期以前,计算机主要用于科学计算。
外部存储器 只有纸带、卡片、磁带,无像磁盘这样的可以随机访问、直接存取的外部存储设备。软件的状况 是没有操作系统,没有专门管理数据的软件,数据由计算或处理它的程序自行携带。数据管理任务,包括存储结构、存储方法、输入/输出方式等完全由程序设计者负责。特点:
数据与程序不具有独立性,一组数据对应一组程序。数据不能长期保存。
一个程序中的数据无法被其他程序使用。程序之间存在大量重复数据,数据冗余大。2 .文件系统 世纪 50 年代后期到 60 年代中期。计算机不仅用于科学计算 , 而且还用于大量的数据处理。直接存储设备,高级语言,操作系统。
程序和数据有一定的独立性,数据文件可以长期保存。
数据和程序相互依赖。数据文件是为满足特定的业务,或某部门的专门需要而设计,服务于某一特定的应用程序。
同一数据项可能重复出现在多个文件中,数据冗余度大。数据容易造成不一致。3 .数据库系统 世纪 60 年代后期。计算机用于管理的规模更加庞大,应用越来越广泛。同时多种应用、多种语言共享数据集合的要求越来越强烈。
标志: 1968年IBM的 IMS 是一个层次模型数据库。1969年美国数据系统语言协会公布的 DBTG 报告,对研制开发网状数据库系统起到了推动作用。自1970年 IBM 公司的研究成果奠定了关系数据库理论基础。数据库技术的主要目的:
有效地 管理和存储 大量的数据资源,包括:提高数据的 共享性,使多个用户能够同时访问数据库中的数据; 减少数据冗余,以提高数据的 一致性和完整性 ;提高数据与程序的 独立性,从而 减少 应用程序的 开发和维护代价。4 .分布式数据库 20 世纪 70 年代以后,网络技术的发展为数据库提供了分布式的运行环境,从主机—终端结构发展到 C/S(客户 / 服务器)系统结构。
数据库技术与网络技术的结合分为 紧密结合 与 松散结合 两大类。
分布式数据库系统又分为 物理上分布、逻辑上集中 的分布式数据结构和 物理上分布、逻辑上分布 的分布式数据库结构两种。
物理上分布、逻辑上集中的分布式数据结构是逻辑上统一、地域上分布的数据集合,是计算机网络环境中各个节点局部数据库的逻辑集合,同时受分布式数据库管理系统的统一控制和管理。物理上分布、逻辑上分布 的分布式数据库结构是把多个集中式数据库系统通过网络连接起来,各个节点上计算机可以利用网络通信功能访问其他节点上的数据库资源。5 .面向对象数据库系统
面向对象数据库吸收了面向对象程序设计方法的核心概念和基本思想,采用面向对象的观点来 描述现实世界实体(对象)的逻辑组织、对象之间的限制和联系等。克服了传统数据库的局限性,能够自然地存储复杂的数据对象以及这些对象之间的关系,从而大幅度地提高了 数据库管理效率、降低了用户使用的复杂性。1.1 数据库基础知识 1.1.2 数据库系统 一.有关数据库的概念 1 .数据(Data)
描述事物的符号记录。2 .数据库(Data Base)
存储在计算机存储设备中的、结构化的相关数据的集合。它不仅包括描述事物的数据本身,而且包括相关事物之间的关系。
数据库中的数据不只是面向某项特定的应用,而是面向多种应用,可以被多个用户、多个应用程序共享。3 .数据库应用系统
利用数据库系统资源开发的面向某一类实际应用的软件系统。如:学生管理系统、人事管理系统等。.数据库管理系统(DataBase Management System,DBMS)
位于用户与操作系统之间的数据管理软件,为数据库的建立、使用和维护而配置的软件。使用户能方便地定义数据和操纵数据库,并能报证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复。.数据库系统(DataBase System, DBS)
指引进数据库技术后的计算机系统,能实现有组织地、动态地存储大量相关数据、提供数据处理和信息资源共享的便利手段。有 5 部分:硬件系统、数据库集合、数据库管理系统和相关软件、数据库管理员(DataBase Administrator , DBA)和用户。二.数据库系统的特点 1 .实现数据共享,减少冗余 2 .采用特定的数据模型 3 .具有较高的数据独立性 4 .有统一的数据控制功能 三.数据库管理系统
支持用户对数据库的基本操作,是数据库系统的核心软件。主要目标是使数据成为 方便用户使用 的资源,易于为各种用户所 共享,并增进数据的 安全性、完整性和可用性。● 功能主要包括: 1.数据定义
定义数据库的结构。
2.数据操纵
更新(插入、修改、删除)和检索。
3.数据库运行管理
对数据库进行 并发控制、安全性检查、完整性约束条件的检查和执行 及 数据库的内部维护(索引、数据字典的自动维护)等。
4.数据组织、存储和管理
采用统一的组织方式,并提高效率。
5.数据库的建立和维护
初始数据的输入与数据转存。
数据库的转储与恢复、数据库的重组与重构、性能的监视与分析。
6.数据通信接口
提供与其他软件系统进行通信的功能。
● 4 部分组成:
■ 数据定义语言及翻译处理程序
■ 数据操纵语言及其编译(或解释)程序
■ 数据库运行控制程序
■ 实用程序
1.1 数据库基础知识
1.1.3 数据模型
数据模型就是从现实世界到机器世界的一个中间层次。是数据管理系统用来表示实体及实体间联系的方法。
一.实体描述.实体
客观存在并相互区别的事物成为实体。如:学生、教师、课程。.实体的属性
描述实体的特性。如学生实体用学号、姓名、性别等属性描述。.实体集和实体型
属性值的集合表示一个实体,而属性的集合表示一种实体的类型,称为实体型。同类型的实体的集合,称为实体集。
二.实体间联系及种类
实体之间的对应关系称为联系。如:一个学生可以选修多门课程,同一门课程可以由多名教师讲授。
有三种类型:.一对一联系
如:人事部门的教师表和财务部门的工资表之间就存在一对一联系。.一对多联系
如:部门表与教师表之间就存在一对多的联系。.多对多联系
如:学生表和课程表之间存在多对多的联系。
三.数据模型简介
数据模型是数据库管理系统用来表示实体间联系的方法。
任何一个数据库管理系统都是基于某种数据模型的。数据管理系统所支持的数据模型有三种:层次模型、网状模型、关系模型。.层次模型
用树型结构表示各类实体以及实体之间的联系。典型代表: IBM 的 IMS。
(1)有且仅有一个节点无双亲,这个节点称为“根节点”。
(2)其他节点有且仅有一个双亲。
特点:对一对多的层次关系描述非常自然、直观、容易理解,但不能直接表示出多对多的联系。.网状模型
(1)允许一个以上的节点无双亲。
(2)一个节点可以有多于一个的双亲。
典型代表: DBTG 系统,也称 CODASYL 系统。
特点是:能直接表示非树型结构。.关系数据模型
IBM E.F.Codd 于 1970 首次提出。
用二维表结构来表示实体以及实体间联系的模型。
特点是:理论基础完备、模型简单、说明性的查询语言和使用方便。
1.2 关系数据库
1.2.1 关系数据模型
一.关系术语
.关系
一个关系就是一个二维表,每个关系有一个关系名。在 Access 中,一个关系存储为一个表,具有一个表名。
对关系的描述称为 关系模式,一个关系模式对应一个关系的结构。其格式为:
关系名(属性名 1,属性名 2,…,属性名 n)
在 Access 中:
表名(字段名 1,字段名 2,…,字段名 n).元组
二维表(关系)中的每一行。对应在表中为记录。.属性
二维表(关系)中的每一列。对应在表中为字段。.域
属性的取值范围。如:性别只能取“男”和“女”。.关键字
唯一地标识一元组的属性或属性集合。如:教师表中的编号。在 Access 中,主关键字和候选关键字就起唯一标识一个元组的作用。.外部关键字
如果一个表的字段不是本表的主关键字,而是另外一个表的主关键字和候选关键字,这个字段(属性)就称为外关键字。
二.关系的特点.关系必须规范化
是指关系模型中的每一个关系模式都必须满足一定的要求。最基本的要求是每个属性必须是不可分割的数据单元,即表中不能再包含表。.在同一个关系中不能出现相同的属性名。.关系中不允许有完全相同的元组,即冗余。4 .在一个关系中元组的次序无关紧要。5 .在一个关系中列的次序无关紧要。
1.2 关系数据库
1.2.2 关系运算
一.传统的集合运算.并
两个结构相同的关系的并是由属于这两个关系的元组组成的集合。.差
两个结构相同的关系 R 和 S 的差是由属于 R 但不属于 S 的元组组成的集合。.交
两个结构相同的关系 R 和 S 的交是由既属于 R 又属于 S 的元组组成的集合。二.专门的关系运算.选择
从关系中找出满足给定条件的元组的操作。.投影
从关系模式中指定若干属性组成新的关系。.联接
将两个关系模式拼接成为一个更宽的关系模式,生成的新的关系中包含满足联接条件的元组。.自然联接
在联接运算中,按照字段值对应相等为条件进行的联接操作。去掉重复字段。
1.3 数据库设计基础
1.3.1 数据库的设计步骤
一.设计原则 .关系数据库的设计应遵从概念单一化“一事一地”的原则.避免在表之间出现重复字段 .表中的字段必须是原始数据和基本数据元素.用外部关键字保证有关联的表之间联系
二.设计步骤.需求分析
(1)信息需求
(2)处理需求
(3)安全性和完整性需求.确定需求的表
遵从概念单一化“一事一地”的原则,即一个表描述一个实体或实体间的一种联系,并将这些信息分成各种基本实体。.确定所需字段
(1)每个字段直接和表的实体相关
(2)以最小的逻辑单位存储信息
(3)表中的字段必须是原始数据
(4)确定主关键字字段.确定联系
对于一对多的联系,可以将其中“一方”表的主关键字放到“多方”表中作为外关键字。“一方”用索引关键字,“多方”使用普通索引关键字。
对于一对一的联系,两个表中使用同样的主关键字字段。
对于多对多的联系,为了避免数据重复,一般建立第三个表,把多对多的联系分解两个一对多的联系。这个第三个表可以看成纽带。纽带表不一定需要自己的主键,如果需要,可以将它所联系的两个表的主关键字做为组合关键字指定为主关键字。.设计求精
检查可能存在的缺陷和需要改进的地方,这些缺陷可能会使数据难以使用和维护。
(1)是否忘记了字段?
(2)是否存在大量空白字段?
(3)是否包含了同样字段的表?
(4)表中是否带有大量不属于某实体的字段?
(5)是否在某个表中重复输入同样的数据?
(6)是否为每个表选择了合适的主关键字?
(7)是否有字段很多而记录很少的表,并且许多记录中的字段值为空?
1.4 SQL 基本命令
SQL(Structure Query Language,结构化查询语言)是在数据库系统中应用广泛的数据库查询语言,它包括了数据定义、查询、操纵和控制 4 种功能。
SQL 中的两个基本概念:
基本表:本身独立存在的表。
视图:从一个或多个基本表导出的表。它本身不独立存储在数据库中,即数据库中存放视图的定义,而不存放视图对应的数据。
1.4.1 SQL 基本语句
最常见的 SQL 语句是 SELECT。
基本格式:
SELECT [ALL/DISTINCT] *|< 字段列表 >
FROM < 表名 > [WHERE < 条件表达式 >]
[ORDER BY < 列名 > {[ASC|DESC]}]
例:在 Access 中,在教师表中查询姓名为“王”的教师,并按照姓名升序排列。命令为:
SELECT * FROM 教师 WHERE 姓名 LIKE “ 王 %” ORDER BY 姓名 ASC 1.5 Access 简介
Access 是一种关系型的桌面数据库管理系统,是 Microsoft Office 套件产品之一。
1992 年 11 月推出 Access 1.0,Microsoft 先后推出 2.0,7.0/95,8.0/97,9.0/2000,10.0/2002,直到 Access 2003。
特点: .具有方便实用的强大功能。.可以利用各种图例快速获取数据。.可以利用报表设计工具,方便生成报表。.能处理多种数据类型。.采用 OLE 技术,能方便创建和编辑多媒体数据库。.支持 ODBC 标准的 SQL 数据库的数据。.设计过程自动化,大大提高了数据库的工作效率。.具有较好的集成开发环境。.提供了断点设置、单步执行等调试功能。.与 Internet/Intranet 的集成。.可以将数据库应用程序的建立移进用户环境,并最终使用户和应用程序开发者之间的关系淡化。
数据库的系统结构:
Access 数据库由数据库对象和组两部分组成,如图 1-2 所示。其中对象分为 7 种:表、查询、窗体、报表、数据访问页、宏、模块。
表是数据库的核心与基础,存放中数据库中的全部数据。报表、查询和窗体都是从数据库中获取数据信息,以实现用户的某一特定的需要。
表是用来存储数据的对象,是数据库的核心与基础。表中的列为字段,行为记录。
查询是用来操作数据库中的记录对象,利用它可以按照一定的条件或准则从一个或多个表中筛选出需要操作的字段,并可以把它们集中起来,形成所谓的动态数据集,并显示在一个虚拟的数据表窗口中。
窗体:数据库与用户进行交互操作的界面。其数据源可以是表或查询。
报表:数据的输出方式,可以将数据库中需要的数据提取出来进行分析、整理和计算,并将数据以格式化的方式打印输出。
数据访问页:是一种特殊的 Web 页,用户可以在此 Web 页与 Access 数据库中的数据进行联接,查看、修改 Access 数据库中的数据。
宏:一系列操作的集合。
模块:将 Visual Basic for Application 声明和过程作为一个单元进行保存的集合。
1.6 启动和关闭 Access 1.6.1 启动 Access
“开始 / 程序 /Microsoft Access”
1.6 启动和关闭 Access 1.6.2 关闭 Access 4 种方法:
(1)单击 Access 右上角的“关闭”按钮
(2)选择“文件”菜单中的“退出”命令
(3)使用 Alt+F4 快捷键
(4)使用 Alt+F+X 快捷键
一、填空题
1.计算机数据管理的发展分 _______________________________________ 等几个阶段。.数据库技术的主要目的是有效地管理和存储大量的数据资源,包括:_____________,使多个用户能够同时访问数据库中的数据; ______________,以提高数据的一致性和完整性;___________________,从而减少应用程序的开发和维护代价。.数据库技术与网络技术的结合分为 _____________ 与 _____________ 两大类。.分布式数据库系统又分为 ____________________ 的分布式数据库结构和 ______________________ 的分布式数据库结构两种。.数据库系统的 5 个组成部分: _________________________________________________。. 实体之间的对应关系称为联系,有如下三种类型: _______________________________。.任何一个数据库管理系统都基于某种数据模型的。数据库管理系统所支持的数据模型有三种: ___________________________。.两个结构相同的关系 R 和 S 的 _______ 是由属于 R 但不属于 S 的元组组成的集合。. SQL(Structure Query Language,结构化查询语言)是在数据库系统中应用广泛的数据库查询语言,它包括了 _____________________________4 种功能。.Access 数据库由数据库对象和组两部分组成。其中对象分为 7 种: ___________________。
二、选择题 .下列说法错误的是()。
A 人工管理阶段程序之间存在大量重复数据,数据冗余大。
B 文件系统阶段程序和数据有一定的独立性,数据文件可以长期保存。
C 数据库阶段提高了数据的共享性,减少了数据冗余。
D 上述说法都是错误的。. 从关系中找出满足给定条件的元组的操作称为()。
A .选择
B .投影
C .联接
D .自然联接
3.关闭 Access 可以方法不正确的是()。
A .选择“文件”菜单中的“退出”命令。
B .使用 Alt+F4 快捷键。
C .使用 Alt+F+X 快捷键。
D .使用 Ctrl+X 快捷键。.数据库技术是从 20 世纪()年代中期开始发展的。
A.60
B.70
C.80
D.90 .使用 Access 按用户的应用需求设计的结构合理、使用方便、高效的数据库和配套的应用程序系统,属于一种()。
A.数据库
B.数据库管理系统
C.数据库应用系统
D.数据模型.二维表由行和列组成,每一行表示关系的一个()。
A.属性
B.字段
C.集合 D.记录.数据库是()。
A.以—定的组织结构保存在辅助存储器中的数据的集合。
B.一些数据的集合。
C.辅助存储器上的一个文件。
D.磁盘上的一个数据文件。.关系数据库是以()为基本结构而形成的数据集合。
A.数据表
B.关系模型
C.数据模型
D.关系代数 9 .关系数据库中的数据表()。
A.完全独立,相互没有关系。
B.相互联系,不能单独存在。
C.既相对独立,又相互联系。
D.以数据表名来表现其相互间的联系。10 .以下叙述中,正确的是()。
A.Access 只能使用菜单或对话框创建数据库应用系统。
B.Access 不具备程序设计能力。
C.Access 只具备了模块化程序设计能力。
D.Access 具有面向对象的程序设计能力,并能创建复杂的数据库应用系统。
答案 填空题
1.人工管理、文件系统、数据库系统、分布式数据库、面向对象数据库系统
2.提高数据的共享性、减少数据冗余、提高数据与程序的独立性
3.紧密结合、松散结合
4.物理上分布、逻辑上集中;物理上分布、逻辑上分布
5.硬件系统、数据库集合、数据库管理系统和相关软件、数据库管理员(DataBase Administrator , DBA)和用户。
6.一对一联系、一对多联系、多对多联系。
7.层次模型、网状模型、关系模型。
8.差
9.数据定义、查询、操纵和控制
10.表、查询、窗体、报表、数据访问页、宏、模块。
选择题
国际数据库检索知识 篇7
最近, 有不少细心的读者纷纷询问刊登在《实用妇产科杂志》封面右上角的CODEN SFZHA7是什么意思。SFZHA7是本刊的CODEN码。按国际惯例登在期刊封面的右上角, 国际标准刊号的下方。
CODEN (Code Number) 是美国ASTM (American Society for Testing and Materials) 制定的科技期刊代码系统, 被国际公认。美国《化学文摘》 (CA) 、《工程索引》 (EI Compendex) 、《乌利希国际期刊指南》 (Ulrich'sIPD) 等国际检索系统, 以及各国图书馆收藏部门均采用CODEN码进行文献/期刊识别。
论知识发现与数据挖掘 篇8
关键词:空间数据挖掘;知识发现;方法
中图分类号:P208 文献标识码:A 文章编号:1007-9599 (2012) 09-0000-02
科技发展日新月异,网络技术的发展将整个世界联成一体,人们可以超越时空的概念,利用网络,相互之间进行信息交换、协同工作,这种信息交换与工作协同在方便了人们的同时必然造成信息与数据的无限扩张,会使人们在提取有用信息和知识时,如同大海捞针一样无力,面对大量的数据,传统的数据分析手段难以应付,导致越来越严重的数据灾难,为了有效解决这一问题,知识发现与数据挖掘技术开始出现。
一、特点及过程
(一)特点
作为一门新兴学科,知识发现具有极大的发展前途和有广泛应用前景,知识发现是用一种简洁的方式从大量数据中抽取信息的一种技术,知识发现不需要预先进行假设或者提出问题,就可以找到那些非预期的有用的或有潜在价值的信息,是一种有价值的搜寻过程。
数据挖掘也称知识挖掘,可以看成数据库中的知识发现,是从大量庞杂的数据中获取信息和知识的过程。数据挖掘其一开始出现的目的就是应用,因此数据挖掘的研究成果是很讲求实际的。数据挖掘技术不是简单的数据库的检索、调用,而是对数据进行全方位的统计、分析和推理, 以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。
(二)过程
知识发现的内涵与知识挖掘,知识发现是从数据库中发现知识的整个过程,数据挖掘是具体这个过程的关键步骤,因此,知识发现与数据挖掘通常在使用时是不加区分的。一个完整的知识挖掘过程如下:
数据库→数据的准备→数据挖掘→知识评价→知识表示→知识库。
二、方法
知识发现与数据挖掘方法有很多,其中比较常见的有以下几种:
(一)空间分析法
空间分析法是一种总称,其利用一定的技术理论对空間的叠置、拓扑结构、图像以及距离好空间缓冲区进行分析,把探测性的数据分析与空间分析相结合,构成探测性的空间分析,聚焦数据,发现隐含在其中的特征和规律。
(二)统计分析法
统计分析法是一种通过对研究对象的规模、范围数量关系信息的分析研究,认识和揭示事物间的相互关系、变化规律和发展趋势,进一步进行对象评估、特征预测、规律统计,借以达到对事物的正确解释和预测的一种研究方法。
(三)聚类方法
聚类分析是基于物理特性的聚类或分类,根据一定的标准大型多维空间数据集,以确定相应的区域,数据被分为一组的一系列相互区分,发现法律数据集。作为统计学的一个分支,聚类分析无需背景知识可以直接发现有意义的空间聚类结构。
(四)遗传算法
遗传算法是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,自适应地调整搜索方向,不需要确定的规则,能在搜索过程中自动获取和积累有关搜索空间的知识,并可通过自适应机制控制搜索过程以求得最优解。
(五)神经网络方法
这种方法利用神经元练成网络,通过这种形式使系统成为具有存储、联想等一些列的功能的自适应非线性动态系统。这种方法的优点是具有并行性、直观性和抗噪声性。
(六)模糊集理论
模糊集用模糊隶属函数确定的隶属度描述不精确的属性数据,重在处理空间数据挖掘和知识发现中不精确的概率。我们都知道模糊是一种客观存在,一个系统越复杂,精确化就越难,因此模糊性就越强。在根据模糊集理论,类型和空间实体分别作为模糊集合和集合元素。在空间数据挖掘中,模糊集可用作模糊决策、模糊评判、模糊聚类分析、模糊模式识别、计算置信度和合成证据等。
(七)粗集理论
粗糙集是上近似和下近似集组成,然后以此为基础来处理不精确,不确定和不完整的信息,智能数据决策的工具,更恰当地基于空间数据挖掘的属性不确定性。
(八)云模型
云模型是一种新的方法,它用自然语言值表示定性概念与其定量数据表示之间的不确定性转换模型,反应的是客观世界中的概念的随机性和模糊性,并将二者紧密集合,集成在一起构成定量与定性间的映射。
(九)决策树
决策树方法是,根据不同的特点,分类或决策树结构的集合,从而创造发现的规则和模式,仅仅意味着一个简单的产生规则和发现规律。
三、应用
知识发现与挖掘技术在信息发现与信息提供发面都有着重要意义。
(一)在信息发现中的应用
其在信息发现中的应用主要有以下几种:
1. Web 数据开采
随着网络的普及,互联网已经广泛的应用于人们生产生活的各个方面,可以说人们对此并不陌生,我们知道,人们所获取的信息大部分都要来自于因特网,而因特网的数据信息不仅庞杂,更是非结构的、无序的、动态的,要想在因特网上获取符合要求的信息,对用户来说十分困难,基于此,Web 数据开采作为一项已解决上述问题为目的的新技术被人们提了出来。Web 数据开采由信息采集、识别、分类构成其实现过程,就目前来说,它主要有网络智能体和智能信息捕捉器两种实现形式。所谓智能体就是一个具有控制问题求解机理的计算单元,智能体具有一定的智能型,可以模拟人类的行为和关系,可以自主运行并提供相应的服务。用户在智能体的神经网络技术引导下,可以很迅速的进入所需页面,通常情况下这些页面都是需要通过长时间的交互才能到达的。智能捕捉器以自动捕捉、采集和整理领域所需信息为目的, 其根据用户输入的对捕捉需求的定义进行查找,先查找到信息源登记表,然后根据信息源提供的信息粒度进行筛选找出信息源,再根据模型算法确定并选取最佳搜索路径,按逻辑式自动组织搜索关键字,还可以同时对应多个特定领域范围内的信息捕捉。
2.智能搜索引擎
面对无边的数据海洋,智能搜索引擎是很好的应用工具,智能搜索引擎的检索机制是关键词匹配原则,可以帮助用户更好的寻找信息资源。目前的搜索引擎还不完善,有着诸如不划分知识领域、知识量少等一些列问题,其搜索的效率并不高,因此人们开始着眼于智能搜索引擎的开发,智能搜索引擎很好的弥补了现行搜索引擎的不足。
3.多语种信息发现
多语种信息资源使人们在获取知识时的最大障碍,一直以来,地理和语言的障碍都使人们获取知识时产生一定的困难,随着科技的发展,人们研究出多语种信息发现,这可以很好的解决多语种障碍,使地球成为名符其实的地球村,实现信息数据资源的真正共享。多语种信息发现主要应用在多语种电子文档获取、翻译、检索方面。
(二)在信息提供中的应用
知识发现与数据挖掘技术在信息提供中主要应用在以下几个方面:
1.知识共享
知识共享是一個我们十分熟悉的词汇,这种共享发生在一个虚拟的团体中,这个团体的成员依靠网络相互联系、相互支持、资源共享一次可以更快更好的解决问题。
2.信息智能“推”
所谓信息智能推是指在信息的搜索过程中,机器通过关键词识别和预测用户的兴趣或偏好, 从而及时地、有针对性地向用户主动推送相关知识和最新信息,这样既可以减轻网络负担,也可以扩大用户范围。
3.其他
除了上述两种外还有个性化服务、互动式服务和语义交互,就不一一赘述了。
四、结束语
知识发现与知识挖掘作为新兴的研究领域,已经得到了广泛的应用,但是作为一项崭新的技术,知识发现与知识挖掘目前仍处于起步阶段,仍有很多研究难题有待解决,比如数据访问的效率和可伸缩性,发现模式的精炼等等,所以对它的研究将会一直持续下去,其应用前景也会更加美好。
参考文献:
[1]杨武,陈庄.数据库知识发现技术及应用[J].重庆工学院学报:自然科学版,2001,15(2):32-34
[2]韩惠琴,刘柏嵩.数字图书馆中的知识发现[J].情报学报,2001,20(3):16-19
[3]李德仁,王树良,史文中.论空间数据挖掘和知识发现[J].武汉大学学报?信息科学版,2001,26(6):491-499
[4]白石磊,毛雪岷,王儒敬.基于数据库和知识库的知识发现研究综述[J].广西师范大学学报:自然科学版,2003(1):136- 138