非结构信息

2024-06-28

非结构信息(共12篇)

非结构信息 篇1

1 引言

自计算机技术被引入信息资源的组织和管理领域中以来,数据库技术和方法便成为数字信息有效组织和管理的重要手段之一。在长期的实践中,数据库以其独特的优点表明了它是信息资源组织、管理与共享的最佳方法。目前,某银行总行加快了系统上收和数据上收的工作,核心处理和存储的集中化趋势愈发明显,也正是在这种背景下,银行的分支行一级的机构,在数字信息资源的收集、处理、存储、管理和分析加工等环节上出现了这样或那样的问题。总行虽然有整合了各生产交易系统和管理信息系统的数据总线规划,但离全面应用还有一定距离,造成的尴尬就是,分支行信息技术管理部门收集了越来越多的基础数据,或者可以理解为未经结构化和资源描述定义的元数据(Metadata),但是却依然无法满足经营管理部门提出的各类在技术人员觉得是无理的、率性的或者是想当然的信息检索需求。但如果我们换位思考一下,可能会发现那些需求对经营管理部门又是必需和及时的。从某种意义上讲,作为技术人员不应该猜测或揣度那些检索需求的目的和意义,而经营管理部门在提出检索需求的时候也不用考虑信息技术人员的处理难度和他们当时的心情,我们就认为这个问题解决了!本文是想通过对当前主流的系统架构的了解以及非结构化信息检索的手段的讨论,提出一个具体可行的SOA处理模型。

2 SOA概述

2.1 SOA定义

服务的概念早在CORBA出现时就产生了[1]。JINI的发展又进一步推动了SOA的早期概念体系的建立。Gartner在1996年第1次阐述了SOA的概念[2],并认为未来SOA会成为占绝对优势的软件工程方法,从而结束已长达40多年的传统软件体系架构的主导地位。但是由于当时技术发展的限制,始终没有广泛应用。近几年以来,随着Web Service、XML技术的发展,实现SOA时机逐渐成熟,并且由于Microsoft、m M等厂商不遗余力的推崇,SOA已经成为企业应用中的核心概念之一,并成为软件工程技术发展的重要趋势。

迄今为止。对SOA并没有一个公认的统一定义。IBM的定义:面向服务的体系结构(Service-Oriented Architectur e,SOA)是一个组件模型,它将应用程序的不同功能单元(称为服务)通过这些服务之间定义良好的接口和契约联系起来。接口是采用中立的方式进行定义的,它应该独立于实现服务的硬件平台、操作系统和编程语言。这使得构建在各种这样的系统中的服务可以一种统一和通用的方式进行交互。

2.2 SOA的特性

SOA的几个关键特性[3]包括:一种粗粒度、松耦合服务架构,服务之间通过简单、精确定义适配器进行通讯,不涉及底层编程适配器和通讯模型。

SOA服务具有平台独立的自我描述XML文档。Web服务描述语言(WSDL,Web Ser vices Descr iption Language)是用于描述服务的标准语言。

SOA服务用消息进行通信,该消息通常使用XML Schema来定义(也叫做XSD,XML Schema Definition)。消费者和提供者或消费者和服务之间的通信多见于不知道提供者的环境中。服务间的通讯也可以看作企业内部处理的关键商业文档。

在一个企业内部,SOA服务通过一个扮演目录列表(directory listing)角色的登记处(Registry)来进行维护。应用程序在登记处(Registry)寻找并调用某项服务。统一描述,定义和集成(UDDI,Universal Description,Definition,and Integration)是服务登记的标准[4]。

每项SOA服务都有一个与之相关的服务品质(Qo S,quality of service)。Qo S的一些关键元素有安全需求(例如认证和授权),可靠通信(确保消息“仅且仅仅”发送一次,从而过滤重复信息。),以及谁能调用服务的策略。SOA对企业在信息检索方面带来了很多优势,并且也产生了一定的效益,具体可见图1。

3 非结构化信息和半结构化检索技术的发展和现状

近些年,第三代数据库也发展起来,与第二代数据库产品最大的区别就是它是面向对象的数据库,能很好地描摹现实世界的实际应用,能更接近用户,但作为一种数据库系统,其最大的缺点就是查询功能弱,查询效率低。由于组织结构的复杂,有走第一代数据库结构的老路的感觉,由于目前其特定的用户群和使用缺陷,在金融系统中并没有得到什么应用。随着网络信息尤其是web信息的广泛应用和关注,对web数据集成的半结构化数据库显示了重要价值,此外,多媒体数据库信息和数据库技术的结合使得多媒体数据库也应运而生。目前,分行通过使用oracle10g数据库以及sqlserver2008数据库的最新版本,都增加了对非结构化或半结构化信息的存储和检索支持。

首先,我们要对非结构化和半结构化的信息数据要有一个清晰的概念,非结构化信息和原始信息或者未加工的一次信息是有区别的,后者是零散的数据要素的堆积,存在大量的冗余和无效信息,它应该是属于非结构数据的子集,也就是说非结构化信息的内容要更加复杂,它也可能包含大量梳理过的,能够准确描述和表达一定主题内涵的要意,但是它与结构化的信息相比,没有或者很难定位key值,信息要素的组合是非规律化和难以用简单的结构化的描述语言实现的,而半结构化的信息,是在web应用快速发展的过程中自然形成的,我们每个人都有网上冲浪的经历,而支撑web展现各种丰富多彩的信息内容的,正是我们所称谓的半结构化信息描述语言,而被我们熟知的一般就是html和xml这两种半结构化描述语言了。这里,我们关心的是通过这种半结构化信息描述语言所表达内容的查询和检索,直白地说,就是如何方便灵活地从类似web页面的内容信息里获得自己所需的东西[5]。

非结构化信息管理和应用现在日益重要。媒体和研究报告都说85%以上的信息是非结构化的,像文件、电子邮件、网页、多媒体信息、银行、保险、票据等等。传统的非结构化信息处理,应该说侧重于电子化的文档,类似于像很多传统的应用,电子影响系统,电子档案等等。这一些系统我觉得他们缺乏对非结构化信息全生命周期和智能化的管理[6]。目前非结构化信息也已经日益成为我们政府、企业等决策的依据。大家可以看到目前政府支持信息服务、知识管理已成为新兴行业,所以信息开发和利用非常重要。传统的数据管理特别是像关系数据库系统,应用中对非结构化的数据应该只提供一些表层的管理。所以怎样将非结构化数据有效的管理起来,能够进行数据和知识挖掘,提取当中的隐含信息,对决策进行支持成为当今亟待解决的主要问题。

4 Xml在非结构化信息描述和处理中的作用

在银行实际应用中,除了总分行推广应用的OLTP(on-line transaction processing)体系的生产交易系统和OLAP(On-Line Analytical Processing)体系的管理信息系统,现在也越来越多地涉及跨企业跨部门的系统应用,随之而来的检索需求也逐渐增加,是我们需要关注的。

XML(e Xtensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)[7]。Xml是In ter n et环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。

XML和oracle和sqlserver等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,XML仅仅是展示数据。事实上XML与其他数据表现形式最大的不同是:他极其简单。这是一个看上去有点琐细的优点,但正是这点使XML与众不同。

XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的唯一公共语言,虽然不同的应用软件也支持其它的数据交换格式,但不久之后他们都将支持XML,那就意味着程序可以更容易的与Windows、Mac OS,Linux以及其他平台下产生的信息结合,然后可以很容易加载XML数据到程序中并分析他,并以XML格式输出结果。

随着XM L数据库理论的逐渐成熟。我们可以将各种非结构化数据直接用XML进行描述。在整个系统实现上,去掉了数据转换层,不必将各种数据在统一转换成XML的格式。如果处理的XML文档来自数据结构不一的联合系统,那么这种功能就有很大优势。然后就可以在基于SOA的一个平台上构建功能强大的组合式数据服务。

5 应用模型

通过对上述知识内容的探讨和理解,我们最终建立了以soa架构的管理方法就银行可能涉及的非结构化和半结构化的信息数据为依托,建立一个初步的应用模型,这个模型是轻量的,不涉及具体技术细节的实现方法,通过目前i t市场和技术领域内主流的成熟产品应用,这个模型的搭建应该是快速简洁的。

先让我们了解一下银行相关数据信息的现状,银行目前掌握的数据主要是以下几块:

(1)依托历史数据系统和数据仓库项目存储的银行主要交易系统和管理系统的历史数据;

(2)散步于各存储设备中和老旧系统中的存量数据这部分主要是数据集中前的交易数据;

(3)通过总分行系统公布的交易接口,通过开发接口代码获得的联机查询和报表数据;

(4)与银行相关的金融机构和企业单位的关联数据信息;

(5)散布于个人或部门的各类金融文献、电子台帐

通过对涉及的数据信息的初步分析和判断,我们可以将这些数据分为结构化、半结构化、非结构化等三类,在不改变现有数据信息结构和存储位置的前提下封装一套结构解析机制,并提交用户一个统一的检索入口,通过解析模块识别检索需求,并拼装检索描述语言由此类描述语言分析器产品来组织数据库检索子查询语句,由调度控制模块根据子查询语句的数据源描述,向各个数据提供渠道发起查询,之后由数据信息整合模块处理各渠道反馈数据,组织成用户检索所需格式,通过统一展示平台发布。这其中,xml语言作为检索描述语言的中间语法语言,起到结构描述、处理方式定义、检索类型选择、最终展示结果格式化等作用,结合这三类数据信息的自身特点,我们提出一个通用的检索模型,模型图如图2所示。

上图描述了检索模型的最原始逻辑结构,其核心为“数据集成处理子系统”,其数据信息来源和基础是结构化、半结构化、非结构化数据源,这里我们可以抽象为数据库、半结构化信息源、非结构化数据源等3类。

从数据库的研究角度看,web网站上的信息也可以看做是一个更大、更复杂的数据库,web上的每一个站点就是一个数据源,每个数据源的结构都不一样,这就构成了一个巨大的异构的数据库环境。如何在这些异构的数据源进行集成,向用户提供一个统一的视图,方便用户利用这些数据,可采用非结构化或半结构化数据库实现。

数据集成子系统的功能是从数据源处抽取或者集成数据并且给上层应用提供一个单一的、一致的关系数据库接口,实际上,xml就是一个半结构化数据模型,数据集成子系统有包裹器(wrappers)、映射器(mapper)、抽象器(extractor)三个基本组成模块。如图3所示:

包裹器与数据源打交道并使用分散的数据成为一些类似与关系数据库的表集合。包裹器使用源描述语言sdl(source Description language)来表示原始数据,sdl是一种专门用于描述数据源行为的人工语言,简单的几行语句就能够捕获大多数复杂的web站点结构,包括那些动态生成web页面的站点,使用包裹器,任何数据源都可以使用sql语句进行查询

映射器形成的关系数据表可能具有不同的模式和词汇。如一些包裹器以公里为单位表示距离,而另外一些包裹器使用海里作为单位表示距离,需要体现映射规则的集合,并用映射描述语言mdl(map Description language)来给出变换规则集合。

抽象器从非机构化的数据中抽象半结构化数据信息,用抽象描述语言edl描述抽象规则。

数据发布子系统作为处理结果的展示模块,可以独立与整个架构,可以实现基于soa架构的一个通用展示平台,遵循j2ee标准,在银行现有web展示平台的基础上,可以快速完成开发功能。

6 结束语

本文将SOA体系结构与Web服务技术的良好封装性、松散耦合性、异构互操作性等优越性用于非结构化信息检索,可以有效的弥补传统Web技术和数据库技术的不足,从而将非结构化数据有效的管理起来,能够进行数据和知识挖掘,提取当中的隐含信息,更好的进行决策分析。对比建立数据仓库,该模型也降低了实施的成本。在实施时我们运用正确的方法去使用SOA,从而能够通过按需获得的信息、服务重复使用、流程优化、集成创新的第三方Web服务,获得业务效率、灵敏性及创新。让SOA数据集成处理子系统成为SOA的基石,这可以确保我们建立的应用模型能够得到最佳的管理和治理。

参考文献

[1]王紫瑶等.SOA核心技术及应用[M].北京:电子工业出版社,2008,5:50-60.

[2]王满红,陈荣华译.伊尔.SOA概念、技术与设计[M].北京:机械工业出版社,2007,1:30-36.

[3]邢少敏,周伯生.SoA研究进展[J].计算机科学,2008,35(9):13-19.

[4]李长云.一个面向服务的支持动态演化的软件模型[J].计算机学报,2006,29(7):9-16.

[5]王滨,黄永峰,许晓东.基于SOA的应用程序框架研究与实现[J].计算机工程与设计,2006,27(7):1198-1200.

[6]高岩,张少鑫,张斌等.基于SOA架构的Web服务组合系统[J].小型微型计算机系统,2007,28(4):729-732.

[7]Extensible Markup Language(XML)[EB/OL].http://www.w3.org/XML.

非结构信息 篇2

结构化数据: 能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号,传统的关系数据模型、行数据,存储于数据库,可用二维表结构表示,

半结构化数据: 所谓半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,XML、HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。

英语中动结构:典型非典型 篇3

【关键词】典型英语 非典型英语 中动结构

英语中中动结构特征主要包括家族相似或原型特征,而其中具有原型特征的中动结构则被称之为典型中动结构,而具有家族相似特征的中动结构则被称之为非典型中动结构。本文整合了国内外相关文献的研究成果,简要总结和梳理一下典型和非典型英语中动结构的相关内容。

一、英语中动结构简析

英语中动结构的基本特征分为句法特征与语义特征两种。其中英语中动结构句法特征为非事件性与描述性,故而中动词不像其他动词能够于时态上导致句子形式变化。英语中动结构语义特征为:主语非施事性、施事隐含和非事件性相关。其中主语非施事性相关指的是受事主语允许出现受事外如处所和工具类似的角色主语;施事隐含相关指的是语义层面上中动句中的谓语动词在逻辑上存在一个事件主语(施事角色),而在实际的句法上又不予体现。通常认为,该施事角色并没有具体指代,而是指向不确定的施事角色;非事件性相关,多数学者赞同EMC具备非事件性特征,简单而言,就是说中动句只表示状态和属性,而不表示事件,故而中动词没有形态上的变化,类似表状态的动词都不能在祈使句与现在进行时中使用。

二、典型英语的中动结构

典型英语的中动结构语义类型探析:基于表达语义范畴而言,典型英语中的中动结构主要分为两大类型,其分别是便捷性或事件易发生中动句和事物适意性中动句两类。该类中动结构在实践应用中其语用意义具有评价功能。

1.类型一:便捷性或事物易发性中动句。该类型的中动句,在典型英语表达中通常采用with no trouble、without any difficulty、effortlessly、easily等修辞词汇,而使用该类修辞的中动句是最为典型的中动句,因此很有必要从该类中动句开始来解析英语中动结构。

(1)Handle apricots gently because these fragile fruits bruise easily.

(2)Watch carefully because nuts burn easily.

(3)A good tent puts up in less than six minutes.

其中例句(1)和(2)中easily都表示便捷性,(3)中 in less 意思是不足什么什么,在句子中也表达了便捷性。

2.类型二:事物适意性中动句。该中动句主要用来表达某事物使用和操作的适意性,也可以说是灵便性或舒适性。该中动句中常用副词主要包括smithlty、comfortably、well等。

(1)The pack handles comfortably.

(2)These QRs close smoothly and firmly if you keep the pivot points lub ed.

其中例句(1)中comfortably表示舒服的,在句子中则在表达施事适意性中的舒适度,smoothly 和firmly表示平稳和牢固的,也在表达某事物操作的适意性。

三、非典型英语中动结构

在认知语言学中认为语言是边界模糊且难以界定清楚的,简单而言,就是说语言本身没有所谓的共同特征和同质性。自然语言的使用者是人类,但并不独属于人类,也即自然语言有其特定的规律,而非单纯作为人类语言工具存在。其特征主要为:范畴成员基本都有原型和家族相仿性特征,简单而言就是成员拥有典型性特征。具有典型性特征成员还具有典型特征逐步衰减的趋势,也就是说,该典型特征成员存在于典型和边缘典型特征之间,是具有较宽范围的成员区间。具体到英语中动结构中,该特征依然存在,因此英语中动结构定义大致也可以进行这样粗略定义的。

在设计特点中动句被称之为中动句的原因在于,它本身和适意性及易发性都拥有和句子中动词、主语构成动宾结构的特征。而这种动宾结构特征,则被称之为中动句首要界定属性。第二个共同特征,则是该类型中动句都具有非事件性与通指性。在这两点共同特征之外,该类中动句不适用其他限制条件约束。因为该类句子不以表达实施动作与行为情状为目的,主要以表达主语特性为目的,故而不具有蕴涵施事,对于情景责任发生的归属主语也没有暗示作用。特别需要注意的地方是,该类句子的设计特点的中动结构在形态上具有自成一体的特征。

在事物适意性与事物便捷性和易发性两种中动句外,还有另外一个大类的中动句,该中动句主要表达事物设计特点,其修饰用语主要为独立结构、介词等复合型修饰用词。

1.Palyset folds up into a storage case with handle for easy carrying.

2.This dress buttons in the back.

其中例句 1、2中使用的虽然都是介词短语,例句1使用的独立引用结构,例句2则表示了处所。

本文主要探讨了英语中动结构并对典型和非典型英语中的中动结构,并对其中语义类型和简单探讨,

参考文献:

[1]杨佑文.英语中动结构:典型与非典型[J].解放军外国语学院学报,2011(04):18-23,31.

[2]滕春艳.隐性助动词与英汉非典型的中动结构生成[J].渤海大学学报(哲学社会科学版),2013(03):152-153.

非结构信息 篇4

在日常生活中自然灾害和事故不定时地会发生,并且这些事件的严重程度在范围和规模上逐渐增加。不止是自然灾害或者是像地震,洪水,台风,火灾,生态危机,流行病传染病等的事故,同时,社会经济危机,生态危机,饥饿,污染,社会不安定因素,恐怖袭击等时常困扰着现代社会。这些威胁不仅给人类带来生命财产的损失甚至严重威胁到政权的稳定。

因此,应急管理成为政府行政措施的重要方面,对突发事件实行管理旨在降低,处理或是避免危险。具体表现为,在灾害发生前进行准备,对灾害的响应,以及事后的支持重建工作。应急管理包括一系列应急措施和相关法律政策,好的应急措施可以最小化事故发生的可能以及事故造成的损失,在一定程度上保证社会安定,在此层面上,应急管理对政府对社会是有重要价值的。

为了做好应急处理工作,行政部门要搜集大量相关信息,包括法律文件,规章制度,应急准备,规则政策,研究资料以及以往的应急经验。在应急管理中,决策者会面临大量的信息,不同的权威机构会给出不同的信息。对于应急管理部门,管理信息和知识显得尤其重要。应急管理系统包括大量的非结构化的信息,这些信息可以帮助制定明智的措施,但是,很少有学者就非结构化的电子信息进行研究报告, 很少有对非结构化电子信息进行定义,分析,以及解释它是如何给应急管理提供服务的。本文旨在说明非结构化管理信息系统是如何建立以及如何组织管理应急管理信息。

1相关基础概念

1.1非结构化信息

许多学者指出绝大多数有潜在价值的信息都是以非结构化形式存在的。非结构化信息正在引领科学的艺术性潮流。在应急管理中,决策者需要分析大量的非结构化文本和文件来获得或者推断出对做出决策有用或者支持决策的相关信息。非结构化信息可以视为一种计算机化的信息,它不是一种数据模型或是一种能够轻松实用的计算机程序,它包括自然语言, 书面文件,演讲,声音,静止的形象或者是录像。不同于结构化的文件信息,非结构化信息不是被储存在数据库中或者是有注释的文件中,它有其固有的结构,可以根据文档中的形态,语法其他方面推测出来。

总体上来说,半结构化信息有特定的模型,它可以让机器对信息进行识别和分析。但是,这种半结构化信息不能够为信息管理的自动化服务,因为它虽然有一定的结构,但是语义不确定,比如HTML网页上的table等不确定的字段。所以即使信息是以结构化的形式体现出来的,但是如果不能为加工任务提供帮助的话,仍被视为非结构化信息。

1.2非结构化信息管理

非结构化信息是未被管理的信息,由于缺少结构,非结构化信息很难被收集, 获取,分类。在组织中,非结构化信息被视作是关键性的智力资产。为了掌握分析这种形象化的信息,一些管理方法应运而生。

现代企业将应用非结构化信息放在了优先的位置。学者们认为管理非结构化信息的挑战在于管理者需要辨别,定位, 并且要能将实体与利益关系联系起来,最重要的是要能将其中至关重要的知识挖掘出来。将非结构化信息分割成许多部分来研究是管理非结构化信息的正确做法, 这些部分包括文本挖掘,分类,信息检索。 在此过程中,将非结构化信息结构化有助于进行信息的加工处理。

在对半结构化信息以及非结构化信息的管理中,新生代的数据检索技术起到很重要的作用,通过增强对元数据的搜索能力、内容、行为分析来对半结构化信息以及非结构化信息进行有效管理。所以软件商不仅满足于传统的软件要求——对结构化数据进行处理,他们开始关注于探索新的思路,新的方法来管理非结构化内容。这些新的思路拓展了商业层面,使得软件制造商提高效率,减少成本,更好地迎合目标市场,目标消费者加速产品推向市场的速度,抢占市场份额,迅速获得高额利润。

虽然说对非结构化信息管理的理念和技术都有了显著的提高和改进,但是仍然存在着一些缺陷。目前没有将非结构化管理应用于管理动态知识和知识流上的案例,理论没有能得到实践的有效证明, 所以对非结构化信息管理的挑战在于如何有效地进行信息分析,辨别,定位,将实体和利益联系起来,以及探索非结构化信息中至关重要的关键点。

1.3非结构化管理信息系统(UIMS)

非结构化管理信息系统有三个层级, 输入——非结构化信息管理——输出。其中,输入的内容包括组织中的非结构化信息,组织外的非结构化信息,以及该产业的公共认知。非结构化管理信息系统由四部分组成:词库模型,新概念的启发,概念之间的关系,动态知识流和多元化。非结构化管理信息系统的输出旨在提供一个简单的方法来区分不同人对非结构化信息的不同的观点。

下面对非结构化管理信息系统的四个部分进行一些解释:1)词库模型:词库模型包括控制性词汇,同义词的概念, 保留词,词语之间的层次结构关系等。这个模型是持续不断的更新的,它会从公众词汇中提取组织需要的词汇,一旦公众词汇有更新,就会受到公司相关负责人的关注,他们会实时地进行更新。同时,更新的来源也可能是新概念的启发,如果有新鲜的概念出现,就会反馈到词库模型,词库模型据此进行更新。2)新概念的启发:概念的启发和输入以及词库模型有关,在词库模型中没有出现过的概念,就可以视作一个新的概念。概念的流行度由概念的普及度来衡量,然而概念的强度由它在特定时段出现在非结构化信息的频率决定。3) 概念之间的关系:概念之间的关系显示不同概念的重要性程度。概念之间的关系显示他们之间的共同点和相互促进影响的程度。4)动态知识流模型:脑力工作是复杂的,没有固定程序的,是非线性的。在社会工作中,知识是分散在员工之中的,脑力工作由员工来完成,促进员工之间的交流来帮助他们交换认知,融合,推动改革创新,以实现非结构化管理信息系统的与时俱进。

2应急管理的非结构化管理信息系统

将非结构化管理信息系统应用于应急管理,是非结构化管理信息系统的运用的新领域,将非结构管理信息系统和全球定位系统(Global Position System),网络远程视频监控系统(Remote Video Monitor),车辆追踪系统(Vehicle Tracking),个人数字助理(Personal Digital Assistant) 和便携无线数据(Handheld Wireless Data Terminals)遥感(Remote Sensing)等相结合,充分发挥非结构化管理信息系统对非结构化信息的收集,分析,加工,反馈的作用,给应急管理提供有效帮助。

2.1应急管理的非结构化管理信息系统的作用

应急管理要求非结构化管理信息系统建立在短时间内收集到的信息上,这些信息源自决策过程中的多样性和综合性的资源。如果,决策者没有能有效地整合信息,没有能获得专业知识,那么就有可能导致决策者做出错误决策,错误决策可能会带来严重的后果,没能及时反应迅速做出战略部署,错失良机,使人身财产安全受到严重威胁,影响政府威望。同时相关人员应该注意到,不同的信息被存储在不同的文档和数据库中,许多信息被保存在文本文件中。由于缺乏对信息的有效管理,对决策有用的信息不能得到妥善的管理,导致决策者很难迅速精准专业地定位信息。这些做法严重降低了应急管理的效率和应急管理的反应时间。所以,决策者可以考虑建立一个辅助的系统提供管理文本信息的帮助,在紧急情况下可以提供应急响应方案,降低风险。

非结构化管理信息系统为应急管理提供支持和帮助,在应急管理中,非结构化管理主要为突发性的事件提供信息和知识以便分析建模。知识模型主要提供不同的方面的信息,整理一些对决策有用信息的必要的文本以便决策者进行合理决策。相关的信息和知识通过非结构化管理信息系统相互作用,相互影响,基于B/S模式的非结构化管理信息系统,可以很好地被应用到实践操作中。

2.2应急管理的非结构化管理信息系统机制的建立过程

(1)收集应急管理需要的信息

对信息处理的第一步就是搜集相关的信息。在应急管理中,需要对应急管理涉及道德对象的有关信息进行收集整理分析,这些信息大多是非结构化的,以文档的形式保存。在收集应急管理信息过程中,要注意不断更新数据,保证数据的时效性,这样才能为决策者提供有效信息。

(2)重新界定信息类别

为了使非结构化管理信息系统能更好地用到应急管理中,应该对管理过程中的信息进行重新分类界定而不是一成不变。使用者可以将与应急管理有关的一些特殊的信息类别添加进来,采用自动划分类别的做法可以减少传统做法可能带来的大量的不必要成本,以及大量冗余信息,提高非结构化管理信息系统的效率, 提高时效性。

(3)文本分析

在自动划分类别的方法下,一旦获取了应急管理的信息,非结构化管理系统就会立即对文本进行分析挖掘,突出显示文件的特征,将一些文本标注上向量坐标。

(4)自动划分类别

在自动划分类别前,一些文件被人为地选作标志性范例来构建非结构化管理信息系统。每一种范例确定后,相应的类别就作为标志性的向量坐标确定下来,通过向量坐标之间的相似度,可以自动的进行文件的归类,提高效率,降低了成本。

(5)应急管理信息的反馈

由于应急管理信息的分类事前已经确定了,相应的处理方式比较单一,不能完全做到为决策者提供有用的信息。信息之间是完全封闭的,不能实现信息之间的交流反馈,所以,在处理信息时候,注意在战略全局角度利用应急管理的非结构化管理信息系统所提供的信息,从全面战略角度制定决策,这样才能实现基于非结构化管理信息系统的应急管理机制的健全。

3总结和展望

基于非结构化管理信息系统的应急管理机制旨在减少致命性的危险系数,提高应对突发事件的能力。其中关键在于应急管理要能获得有关专家权威性的意见以及文件,案例等非结构化的信息,决策者才能站在全局的角度进行综合性的决策,总的来说,迅速的应急能力建立在对信息的大量搜索以及分析的基础之上。

虽然政府在实施基于非结构化管理信息系统的应急管理机制时可能会遇到诸多困难,实施起来会遇到很多阻碍,但是,一旦建成,会带来丰厚的回报,不仅加强了政府的威信度,同时提高生活质量, 加强安全保障。

可以预见,在未来,基于非结构化管理信息系统的应急管理机制会受到广泛关注和应用,信息时代的迅猛发展为基于非结构化管理信息系统的应急管理机制的实现以及推广提供了良好契机。

摘要:应急管理是各国政府关注的焦点,政府需要对自然灾害等难以遇见的突发事件进行迅速反应力求在最大程度上减少人民群众的人身财产损失。在应急管理中存在着大量的信息,有效地搜集、整理、分析这些数据对于应急管理而言是非常重要的。本文旨在利用非结构化的管理信息系统来对应急管理中的信息进行组织、管理,以给决策者提供准确、及时、完整的信息,给决策者进行正确决策提供帮助。

非结构化存储数据方案之一 篇5

非结构化数据包括文本、图像、音频、视频、PDF、电子表格等。非结构化数据存储通常有两种方式:

1.将非结构化数据以文件的方式存储在文件系统中,同时将指向文件的链接或路径存储在数据库表中。这种方式数据读写的速度较快,但数据管理不方便,并需要额外考虑事务处理的一致性和数据的安全性。

2.将非结构化数据存储在传统的数据库表的大对象字段中。这种方式充分利用数据库的事务、管理和安全特性,但在数据查询和读写的性能不高。

非系统风险与公司最优资本结构 篇6

关键词 资本结构;非系统风险;不完备市场;效用无差别定价

中图分类号 F224.0 文献标识码 A

Idiosyncratic Risk and Optimal

Capital Structure of Corporation

WANG Xiaolin1, YANG Zhaojun2

(1. School of Economy, Henan University, Kaifeng, Henan 475004, China;

2.School of Finance and Statistics, Hunan University, Changsha,Hunan 410079,China)

Abstract The company often faces enormous idiosyncratic risk, and the current capital structure theory rarely involves the impact of idiosyncratic risk on the financing decision. Based on consumption utility indifference pricing method and through the application of stochastic control and optimal stopping theory, this paper considered the problems of pricing equity and debt, optimal capital structure and optimal default trigger determined by equity holders. This paper finds that: (1)Appropriate combination of equity and debt provides diversification benefits; The diversification benefits becomes increasingly weaker with a growth of the risk aversion parameter. (2) Risk aversion parameter has a significant impact upon the optimal default trigger and the equity value, but a slight impact on the debt value. (3) It is an feasible econometric method to estimate the absolution risk aversion parameter based on empirical research.

Key words capital structure;idiosyncratic risk;incomplete market;utility indifference pricing

1 引 言

资本结构是指指公司各种资本的价值构成及其比例,其中研究的重心是如何通过优化公司资本结构来提升公司总价值.对资本结构的定量研究始于1958年提出的ModiglianiMiller(MM)定理随后所有的公司金融理论可以看成是放松MM定理假设条件的扩展,更为重要的是,MM定理提出的无套利定价思想在随后发展的资产定价理论中得到广泛应用..作为公司金融理论基石的的MM定理指出:在完美市场本文“完美市场”指没有税收、没有破产成本、完全竞争、没有摩擦及信息对称的理想化完备市场.条件下,公司总价值与资本结构无关.Brennan & Schwartz(1978)[1]运用BlackScholes期权定价理论,兼顾公司所得税和破产成本,建立了公司债权和公司价值的函数关系式,首次对公司最优资本结构进行了严格定量的分析.Leland(1994)[2]在Brennan & Schwartz(1978) [1]和Black & Cox(1976)[3]的基础之上,考虑公司拥有息票支付为常数的永久性债权,在破产条件内生和外生两种情况下,分析了公司债权与公司价值的函数关系,得出了债权价值、收益差价(yield spread)和最优资本结构的解析解.Leland & Toft(1996)[4]研究公司拥有有限期债权的资本结构,得出了破产概率、信用差价(credit spread)、最优杠杆与债权期限的相互变动规律,分析了信用差价的期限结构.Goldstein et al.(2001)[5]引入收益流服从几何布朗运动的EBITbased模型,讨论了公司拥有永久性债权的动态资本结构问题.Xu & Li(2010)[6]假设收益流服从算术布朗运动,研究在不对称信息下公司的资本结构、讨论债权人的信念更新问题和债券价值,指出算术布朗运动比对应的几何布朗运动更符合现实,比如很多刚创立的公司开始都是产生负收益流,或者有些公司会出现经营性损失,这些情况都不能用恒取正值的几何布朗运动表示.

然而,包括上述论文在内的几乎所有文献在讨论资本结构问题时,都是基于风险中性或市场完备性假设.应该承认:风险中性假设极大地简化了问题的复杂性,特别是对于完备理想的金融市场,风险中性定价方法可以得到唯一合理的无套利价格.遗憾的是:资本市场常常不是完备的,如受市场摩擦、信息不对称等因素的影响,风险中性理论难以合理地解释许多重要的经济现象.理论上,风险中性者只关心收益的平均值,完全没有考虑收益的大起大落可能产生的巨大危害.因而,这种模型下的投资理论会对风险资产给出过分乐观的定价.这种过分乐观的风险中性理论价格容易诱导或鼓励投资者过分冒险投资,一旦碰到不利的局面,就会致使企业破产,进而由于“多米诺骨牌效应”,有可能导致大范围金融危机.事实上,始于2008年的全球金融危机与这种过分冒险投资有必然的联系.因此,代替最大收益选择最大效用作为投资目标是必要的,这也是经济管理科学的共识.

nlc202309041802

在非完备市场条件下,尤其是未上市公司,信息不对称且资产流动性差,投资者通常面临不可对冲的非系统风险,因此,风险态度对资产定价具有重大的影响.于是,基于效用的投资消费定价理论得到迅速发展:如Miao & Wang(2007)[7]、Ewald & Yang(2008)[8]、Yang &Yang(2010)[9]采用了基于效用的投资消费定价准则研究实物期权和最优投融资问题.杨金强和杨招军(2011)[10]考虑了在给定的债务及企业所得税下,通过最优消费、实业资本投资、破产保护及金融风险投资,通过资本资产定价及消费效用无差别定价理论得到了企业资本的隐含价值、最优经营策略、企业家的期望收益率、贝塔系数、系统和非系统风险溢价.并有Leung et al(2008)[11]、Sirca & Zariphopoulou(2010)[12]、Liang & Jiang(2012) [13]利用效用无差别定价建立了可违约债券的信用风险模型.

在非完备市场条件下,公司发行风险债券可以明显改善公司投资者的风险承担结构,分散风险.风险债券分散公司风险的作用已在早期的文献中提出,如Chen et al(2012)[14]假设风险债券(股权)本身的非系统风险(不)可以完全分散,基于效用考虑了企业家的最优投资消费、实业投融资和退出选择,研究企业的最优资本结构,证明企业的风险债券分散公司风险的作用.虽然这些研究工作和本文一样,也是基于效用无差别定价原理,但前者志在讨论公司不确定性投资(实物期权)问题,而且本文依照Leung et al(2008)[11]等的假设,由于公司资产较差的流通性,债券投资者在公司破产时也面临不可以对冲的非系统风险.

本文假设公司收益流服从算术布朗运动,公司资本结构包括息票支付为常数的永久性债权和股权资本.在没有税收和破产成本的条件下,针对市场的不完备性,本文基于消费效用无差别定价原理,研究由股权资本持有人决定违约时间的股权价值和债权价值,分析最优资本结构,计算最优破产触发水平.本文贡献如下:1)本文论证了适当的股权融资和债券融资的组合可以分散非系统风险,随着投资者风险厌恶系数的增大,债权分散公司风险的作用减弱; 2)本文发现投资者的风险态度对破产条件、股权价值有显著影响,但对债权价值影响较小; 3)作为本文理论结果的一个应用,本文提出了通过实证估计投资者绝对风险厌恶系数的计量方法.

2 随机权益的定价

实际上的公司往往不是采取单纯的股权融资,而是股权融资和债权融资的混合,这一现象的通常解释是:债权融资可以减少公司税收负担.这一解释是正确的,但并不完整.实际上,另外一个更重要的原因应该是:混合融资相比单纯的股权融资可以明显改善投资者承受的风险结构,分散公司非系统风险.诚然,如果投资者是风险中性的且无税收和破产成本,正如著名的MM定理,混合融资与单纯的股权融资并没有区别.然而,正如前面所言,风险中性假设从来不是科学的,其假设之所以盛行,最大的原因是从计算上极大地简化了问题的复杂性.下文的模型和数值仿真结果印证了这一理论分析的正确性.

2.1 模型的建立

4 总 结

消费效用无差别定价是一种对随机权益的非线性定价,其方法是“线性定价”准则的延伸.在完备市场条件下,消费效用无差别定价可以导出经典的线性定价理论,因此,它是传统线性定价理论的推广.在不完备市场中,消费效用无差别定价相较风险中性定价的主要优点在于:前者是收益和风险的平衡,而后者只关心收益的大小,完全忽略了风险的存在.

本文利用动态规划原理和数理分析方法,针对不完备市场条件,基于相应CARA效用的效用无差别定价原理,给出了无杠杆(纯股权)公司价值、股权价值、可违约债权价值以及最优资本结构,本文还得出了公司最优破产条件、股权价值和债权价值与风险厌恶程度、收益流的波动率之间的关系,以及最优资本结构与风险厌恶程度、公司收益流的波动率之间的关系. 研究结果表明,投资者的风险厌恶程度越高,破产触发水平越高,股权资本和违约债权价值越小,最优资本结构下的债权比重(最优财务杠杆)越小,债权的收益率溢价越大;公司收益流的波动率越大,则破产触发水平越高,股权资本和违约债权价值越小,最优财务杠杆越小,最优债权收益率溢价越大.作为本文理论结果的一个潜在应用,通过实际公司财务杠杆的统计,利用本文理论可以反推投资者的绝对风险厌恶系数,从而对这一重要、但又难以计量的经济模型参数给出科学的估计.

最后指出,与现有理论方法相比,本文虽然在充分考虑投资者风险态度的基础上对公司资产、股权、债权做出了严格的价值评估,但并没有涉及破产成本和税收规避条件,如何在不完备市场条件下,结合这些因素进行更系统的分析将是值得进一步研究的重要问题.

参考文献

[1] M J BRENNAN, E S SCHWARTZ. Corporate income taxes, valuation and the problem of optimal capital structure[J]. Journal of Business, 1978, 51(1): 103-114.

[2] H LELAND. Corporate debt value, Bond covenants, and optimal capital structure[J]. Journal of Finance, 1994, 49(4): 1213-1252.

[3] F BLACK, J C COX. Valuing corporate securities: Some effects of bond indenture Provisions[J]. Journal of Finance, 1976, 31(2): 351-367.

nlc202309041802

[4] H LELAND, K TOFT. Optimal capital structure, endogenous bankruptcy, and the term structure of credit spreads[J]. Journal of Finance, 1996, 51(3): 987-1019.

[5] R GOLDSTEIN, N JU, H LELAND. An ebitbased model of dynamic capital structure[J]. Journal of Business, 2001, 74(4): 483-511.

[6] R XU, S LI. Belief updating, debt pricing and financial decisions under asymmetric information[J]. Research in International Business and Finance,2010, 24(2): 123-137.

[7] J J MIAO, N WANG. Investment, consumption and hedging under incomplete markets[J]. Journal of Financial Economics, 2007, 86(3): 608-642.

[8] C O EWALD, Z J YANG. Utility based pricing and exercising of real options under geometric mean reversion and risk aversion toward idiosyncratic risk[J]. Mathimatical Methods of Operations Research, 2008, 68(1): 97-123.

[9] J J YANG, Z J YANG. Consumption utilitybased pricing and timing of the option to invest with partial information[J]. Computational Economics, 2012, 39(2): 195-217.

[10]杨金强, 杨招军. 最优投资消费与破产保护[J]. 系统工程理论与实践,2013,33(4):853-860.

[11]T LEUNG, R SIRCAR, T ZARIPHOPOULOU. Credit derivatives and risk aversion[J]. In Advances in Econometrics, 2008, 22: 275-291.

[12]R SIRCA, T ZARIPHOPOULOU. Utility valuation of credit derivatives and application to CDOs[J]. Quantitative Finance, 2010, 10(2): 195-208.

[13]G LIANG, L JIANG. A modified structural model for credit risk[J]. IMA Journal of Management Mathematics, 2012, 23(2): 147-170.

[14]H CHEN, J J MIAO, N WANG. Enterpreneurial finance and nondiversifiable risk[J]. The Review of Financial Studies, 2012, 23(12):4348-4388.

[15]D DUFFIE. Dynamic asset pricing theory[M]. Third Edition, Princerton: Princeton University Press, 2001.

[16]Jr R E LUCAS. Asset prices in an exchange economy[J]. Econometrica, 1978, 46(6): 1429-1445.

非结构信息 篇7

不同的语言具有不同的语言组织系统。在二语习得的过程中,尤其是在初级阶段,语言学习者倾向于把自己母语中的词汇及句法元素直接翻译为目标语言(Phinney 1987,Hirakawa1990)。但是很多时候,要想找到令人满意的翻译方法会比较麻烦,甚至不太可能;即使是看起来本应该非常简单的词汇翻译有时候也会非常棘手。

这其中比较典型的一个问题就是中文初学者在理解带有“的”字的中文短句时常常会遇到困难(下称:“的”短句问题)。本文作者在与两个中文初学者(一个法国女生和一个美国男生)的接触和合作过程中发现的另外一个问题是:他们经常会不自觉地将自己母语中的“who”短句生硬地翻译成中文,从而输出一个对于中文作为母语的人来说很奇怪甚至是无法理解的句子(下称:“who”短句问题)。以下为现实交流中关于这两个问题的实际短句:

“的”短句问题

A1:(尽管婚姻已不再是)每个男女必须完成的"事业",...

A2:考虑这个问题的关键(在于)...

A3:(该给孩子吃什么成了)他们这些天最担心的问题.

“who”短句问题

B1:(我碰到)那个男孩谁来到这里几天前。(I met the boywho came here several days before.)

B2:(就是)那个女人谁来到我家里上个星期天。(La fillequi venait chez moi le dernier dimanche.-The girl who came to my house last Sunday.)

关于“的”短句问题。这名法国学生经常抱怨说,类似于A1-A3这样的中文句子的结构和意思让她一头雾水。在与她就这个问题交流过几次之后,本文作者发现,她每次在试图理解这类句子的时候都会在头脑中把它们翻译成法语。所以对她来说,A1就相当于:...chaque homme et chaque femme doifinir un métier...(...every man and every woman should finish a career...)

有了这种理解之后她就无法再把这个短句和前面的内容联系起来,因为类似下面这样的法语句子在她看来完全是一团糟:Même si mariage n'est pas non plus chaque homme e chaque femme doit finir un métier.(Although marriage is not any more every man and every woman has to complete a career.)

另外那名美国学生也经常遭遇同样的问题。

关于“who”短句问题。本文作者在两位学生不知情的情况下1记录了数十个他们在和我交谈的过程中说出的问题短句;B1和B2就是其中两个。

仅仅从B1和B2就可以清楚地看出引起这两种问题的深层原因:两名学生只是用他们的母语组织了一下他们所想表达的意思,然后把母语句子直接翻译成了中文。

因此很明显现在的关键问题就是:为什么这两名学生在理解“的”短语的时候会有困难?为什么把“who”短语一个词一个词地翻译成中文是无法接受的?如何绕开或解决二语习得者面临的类似问题呢?在下面的章节中本文作者就将试图找出这些问题的满意答案。

2 这种问题为什么会产生?—信息结构分析

为了解释二语习得者面临的类似困难和尴尬,本文作者建议采用语言学中的信息结构分析理论。

2.1 这个理论是什么

对句子和小句的结构及信息组成进行信息结构方面的分析在很长时间以来都是语言学界的一个热点。参与讨论研究和推动发展的学者中不乏很多知名的重量级语言学家,并且产出了大量的相关文献,其中的一些包括Jan Firbas(1987,1991,1992,等),Lambrecht(1994,2004),Halliday(1967,1994)等等。

对于信息结构本身,Lambrecht(1994:5)的定义为:

INFORMATION STRUCTURE:That component of sentence grammar in which propositions as conceptual representations of states of affairs are paired with lexicogrammatical structures in accordance with the mental states of interlocutors who use and interpret these structures as units of information in given discourse contexts.

为便于对相关理论有一个基本的了解,下面将主要介绍该理论中与本文讨论内容最为相关的一些基本概念。

1)主位和述位(theme and rheme)

简单地说,主位是一个句子的起点,其中的元素2主要是为整个句子传递信息打下基础,而述位中的元素则包含了对于整个句子来说最有价值3的信息。句子中的元素属于主位还是述位主要取决于他们传达的信息是新信息还是旧信息4(Svoboda 1981,Firbas 1992),虽然另外一些学者(Halliday:1967,1994)坚持认为,一句话中处在最前面的元素肯定应该被视作主位。

本文就采用新旧信息一派的观点,认为:主位是一个句子传达主要信息的基础和起点,不一定总在句子的最前面,而述位传达了说话人最希望听话人获取的信息。

2)信息焦点(information Focus)

信息焦点是信息结构分析中另外一个很关键但同样引发颇多争议的概念。虽然关于信息焦点的定义很多,但是大部分观点中存在一个一致性的认识(Lambrecht 1994,Dik 1997),本文也将遵循这种认识,即:信息焦点是一个句子中最重要的元素;没有这个焦点,该句子无法传达有价值的信息,甚至令人完全无法理解。

3)词序(word order)

词序的概念与本文讨论的问题相关性最强。词序是语言学研究中被讨论最多的问题之一,相关的重要语言学家包括Bolinger(1952),Li(1975),Firbas(1992),Downing&Noonan(1995)和Givón(2001,Vol.I)等。其基本概念是,词序对于信息结构具有线性修饰的作用,即句子中的元素倾向于传达比它前面的元素更重要的信息,但是在很多情况下词序的这种作用会被其它因素淡化甚至完全逆转,比如语境因素(Firbas1992)。

在介绍了信息结构理论之后,下文将致力于在该理论框架下回答第一部分结尾所提出的问题。

2.2 从信息结构的视角解释这两个问题

虽然从整个句子的结构来看,这两类小句可能扮演主谓或者述位的角色,但为便于讨论,下文统一将他们视作相对独立的小句或词组。

1)“的”小句问题

A1:(尽管婚姻已不再是)每个男女必须完成的“事业”,...

如果在信息结构的框架内分析,我们可以发现“每个男女必须完成的事业”属于整个句子的主位,即:后面的小句将会传达说话人最倾向于传达的信息。但是,为了清楚地分析这个小句而不是整个句子的信息结构,我们这里将它视作一个独立的小句。

这样来看,事业是这个小句的焦点,因为它传达了最新的消息从而对这个小句的交际目的贡献最大。线性修饰的概念在这里也得到了体现:从每个男女到必须到完成,最后再到事业,所传达的信息越来越有价值,说话人的交际目的越来越清晰。对于A2和A3也可以做出类似的解析。

那么,为什么如此“完美”的小句对这两个中文学习者来说如此不可捉摸呢?答案就是,相关的两种语言使用了不同的信息组织方式。比如,A1E就是对A1的一个比较令人满意的理解:A1E:a career that every man and every woman is supposed to follow

表面来看这里无论career还是线性修饰都没有守住阵脚———career在that小句前面,这就意味着:要么career传达了不重要的信息,要么就是线性修饰没有得到遵守。但是,如果我们采用本文作者在另外一篇文章(马,2008)中的观点,就很容易走出这个困境:

...the information below the level of theme/rheme and focus should be left to syntax and semantics.(...在主位述位和信息焦点这两个层级之下的信息结构应该由句法和语义来负责。)

也就是说,信息结构的分析应该停留在主位述位和信息焦点这个层级。在A1E里,我们只需确认career是焦点即可,至于that小句,由于它在句法和语义上和career不可分割,所以应该被排除在焦点分析之外,不用再考虑它是否遵循线性修饰的规律。

总的来说,两位学生之所以认为类似于A1-A3这样的小句难于理解是因为中文小句采用了一种比较独特的句法结构,使得信息结构相关的概念和要求能够得到较好的反应和遵循。但这种结构在英语和法语中没有。这就是为什么两位学生在被告知应该把A1理解为A1E的时候他们会抱怨:为什么中文里总是反着来呢?

2)“who”小句问题

我们把B2作为例子。

B2:就是那个女人谁来到我家里上个星期天.

B2F:La fille qui venait chez moi le dernier dimanche.(The girl who came to my house last Sunday.)

很明显这名法国学生将B2F直接翻译成了B2。中文母语者会认为B2很奇怪,因为他们一般认为在这样的小句里每个词所包含信息的重要性应该逐步上升,但在B2里—给他们解释之后意思之后—他们发现焦点居然在最前面。

这名学生造出这样一个令人不解的句子并不是因为她没有意识到La fille是焦点,而是因为她在中文里找不到一个与qui小句相对应的结构。

通过对这两种典型问题的分析我们发现,至少就这两种小句来看,中文的句法结构更为松散因而可以比较严格地遵循线性修饰和焦点分析,而法语和英语可以利用qui或who结构把信息焦点突显出来,所以也适用信息结构的分析。因而,可以说这两种小句之前存在着非对称性对应关系,即两者的词序和句法结构之间相互对应,但属于逆向对应而非一一对应。这种对应在下面第三部分的讨论中也将得到体现。

3 如何解决这两个问题

在了解了学生遇到困难的深层次原因之后,本文作者设计了两套办法分别用来解决这两个问题,而且这两套办法的有效性得到了一定程度的验证。

对于“的”小句,可以将它们转换成法语或英语里的qu(que)或who短句来理解。

具体理解方法为:把中文小句里“的”之后的词组或短语作为qui(que)或who短句的核心,把“的”之前的元素作为目标短句的从句(即qui(que)或who之后的从句),并且在新的短句中可以保持他们原有的词序。

依照这种方法,这名法国学生成功地将A3理解为A3F。

A3:(该给孩子吃什么成了)他们这些天最担心的问题

A3F:le problème qu'ils dans les derniers jours s'occupen le plus(the problem that they these days worried about the most)

这种理解或许不完美,但对学习者来说已经足够清晰。该学生在后来的学习当中除了个别特殊情况之外基本上都能够利用这个方法快速、准确地理解类似小句的意识。而且在稍加思索或提示之后她甚至可以自己理解更复杂的、具有两层“的”结构的短句,比如:他见过的污染最严重的城市。

关于“who”小句,基本转换方法为:

如果要把一个“who”短句转换成中文短句,可以把本来想要放在最前面的元素———一般是qui或who之前的短语———放在最后面,把其它短语———一般在qui或who之后的从句里———放在最前面,然后中间使用“的”字。

B1:(我碰到)那个男孩谁来到这里几天前.

B1E:(I met)the boy who came here several days ago.

B2:(就是)那个女人谁来到我家里上个星期天.

B2F:La fille qui venait chez moi le dernier dimanche.(The girl who came to my house last Sunday.)

利用这种方法,这名美国学生在想说B1E的时候实际上可以说出来类似于“来到这里几天前的男孩”这样的中文小句,甚至是B1。而这名法国学生在想表达B2F的时候会表达出类似于“来到我家里上个星期天的女人”这样的小句。

从上面的分析可以看出,有两个现象在这两种解决办法中都有体现。第一个就是在目标语言中对母语词序的颠倒,另外一个就是在目标语言中加入特殊的元素,比如法语里的“qui”和中文里的“的”。而这也再一次体现了两种问题之间存在着非对称性对应关系。

4 结束语

本文通过对中文初学者遇到的两个典型问题的对比分析,认为这两个问题所涉及的小句在结构和语义方面存在着非对称性对应关系,即两者的对称为反方向的而非一对一的。在信息结构理论的框架下可以发现这种特殊的对应关系有着深层的原因,即:相关的两种语言使用了不同的信息构架系统。中文由于具有相对松散的句法结构,因此与线性修饰及信息焦点等相关的理论描述有很强的一致性;而英语和法语采用了一种更为紧凑的信息构建方式,虽然表面上不符合但其实也论证了信息结构相关理论的描述。

根据对这两个问题的此种理解而设计的两种方法在很大程度上可以帮助两位学习者解决所遇到的困难,因此是有效的;而这反过来又证明了本文对这两个问题进行的信息结构性的解释至少在一定程度上是可取的。

本文的不足之处在于,只对一种类似的对应关系进行了分析并且语料不够丰富,这使得本文所得结论的总体有效性无法完全保证。因此以后的类似研究可以在下面几个方向进行:在信息结构理论的框架下分析更多的实际语料;将这种信息结构的分析扩大应用到其它一些典型的语言结构中以便证实或证反它的有效性;讨论是否有可能将类似研究所得出的结论与二语习得相关的研究结合起来。

参考文献

[1]Bolinger,Dwight L.Linear Modification[M].Havard University Press,publications of the Modern Language Association,1952(67):1117-1144.

[2]Firbas,Jan.On Some Basic Issues of the Theory of Functional Sentence Perspective II:On Wallace L.Chafe's View on New and Old Information and Communicative Dynamism[M].Brno Studies in English,1987(17):51-59.

[3]Hirakawa M A.study of the L2acquisition of English reflex-ives[J].Second Language Research,1990(6):60-85.

非限定动词结构的歧义研究 篇8

广泛使用非限定动词是英语的一个显著特点, 英语语法中“没有哪一部分是如此蓬勃地发展着” (Curme, 1989:171) 。卢敏 (2004:54) 指出, 使用非限定动词能够保持语法结构的凝练。非限定动词的这些特点极大地丰富了英语动词的表达手段, 但是由于非限定动词结构容易引起歧义现象, 使该结构的教学变得更加复杂。笔者将探讨非限定动词结构使用中的歧义和解歧措施, 以期对语言教学有所帮助。

二、非限定动词结构的定义

不同理论下对非限定动词结构有不同的定义。先看几本西方词典中给出的定义。1.Longman Dictionary of Language Teaching&Applied Linguistics

非限定动词是动词的一种形式, 不因主语的人称或数的不同而异, 没有时态。不定式和分词是英语非限定动词的形式。

2.A Dictionary of Grammatical Terms in Linguistics

非限定动词指各种不作谓语中心的动词的语法形式, 主要包括过去分词、不定式和动名词。

3.Dictionary of Language and Linguistics

非限定动词指动词没有人称、数或时的限制的形式, 如分词、动名词、不定式。

我国学者对于非限定动词的定义也存在差异。赵朝珠 (1981:1) 指出:非限定动词指的是在句中除用作谓语以外的其它句子成分的动词形式, 或是指只能与助动词和情态动词一起构成谓语的那些动词形式。何桂金 (1996:11) 则认为非限定动词在句中不用作谓语或谓语的第一部分, 没有人称、数、时态和语气变化。

这些定义虽然各有道理, 但却没有明确统一的标准, 我们只能从广义和狭义两方面进行模糊区分。英语中如此, 对汉语也有争议。一般认为, 汉语动词没有限定和非限定动词之分, 有的学者则认为汉语中也有非限定动词结构, 只不过这一结构中动词没有什么形态变化 (石毓智, 2001:2) 。这些模糊方面给中国英语学习者掌握非限定动词结构带来了一定的困难。

三、非限定动词结构的歧义现象

歧义有多种定义。张克礼 (1993) 认为, 歧义就是有多种理解, 或说有多种意义, 歧义结构就是有多种理解说有多种意义的结构。歧义是语言中的一个普遍的现象。Kess等 (1972:12) 甚至提出了“语言无处不歧义”的观点。

导致歧义的原因一般有语义关系与句法结构等方面。下面我们就从这两方面说明非限定动词结构的歧义现象。

1. 语义关系导致的歧义

对非限定动词结构而言, 对词义的不同理解可以导致歧义。如:Flying planes can be dangerous.“Flying”既可以被看作动词意义又可当作形容词意义, 因此, 我们可以将句子理解为“To fly planes can be dangerous.”或“Planes that are flying can be dangerous.”。

2. 句法结构导致的歧义

结构歧义 (structure ambiguity) 是指在句法方面一个句子包含不止一种语法关系导致的歧义现象。在表层结构中, 由于对非限定动词位置的不同组合, 往往导致歧义的发生。如:“The fish is ready to eat.”对“to eat”的语法功能的不同划分则会导致歧义的发生, 我们可以理解为“The fish is ready for us to eat.” (将“to eat”看作省略成分“for us”中“us”的宾语补足语) 或“The fish is ready to ea something.” (将“to eat”看作目的状语) 。

由于语言的经济化, 现代英语中会出现大量的省略现象, 非限定结构本身就是语言简化的结果, 从而导致大量歧义发生。

四、基于语境的解歧措施

顾名思义, 非限定动词是不受限制的。其实, 它只是在人称、数和时态方面相对来说不受限制;离开这一条件, 它必须受到另外条件的限制。这些限制实际上都是由不同的语境因素造成的, 从而这类语境起到制约歧义的作用。根据笔者的教学实践经验, 这里只列举几种常见的情况:

1. 受逻辑主语的限制

非限定动词就其本身带与不带逻辑主语而言可分为简单和复杂两种结构。简单结构虽然本身不带逻辑主语, 但其逻辑主语通常出现在句中, 可能是句子的主语、表语或宾语等, 如:I heard her singing in the classroom.本身带逻辑主语的非限定动词称为非限定动词复合结构, 在这些结构中, 要根据逻辑主语是动作的执行者还是承受者来确定非限定动词的语态, 如:Her money stolen, she darednot go home.

2. 受特定动词的限制

非限定动词由于受特定动词的限制而表现出各种形态或具有不同的含义。如:What made you choose that book?不定式tochoose的形式受到“make”的制约而变为“choose”。

此外, 许多特定动词要求后面跟特定的非限定动词形式, 如finish, pretend后分别要求跟动名词或不定式结构。如:Have you finished writing?/Don’t pretend to be asleep.

3. 受情态动词的限制

情态动词都可以与不定式的一般形式一起组成谓语, 没有什么特殊含义, 但情态动词与不定式的完成形式一起构成谓语则有一定的特殊含义。如:You should have come here earlier. (带有责备之意)

4. 受介词的限制

动词放到介词后面, 必须用动名词。如:She is glad athearing the good news.

5. 受形容词的限制

有些不定式放到相应的形容词之后有不同的含义。如:“John is eager to please.”和“John is easy to please.”的含义就不一样。

6. 受语序的限制

非限定动词由于在句中的位置不同, 充当的成分也不同。如:Eating too much is bad for your health. (主语) , The question is how to do it. (表语) 。

五、结语

在实际的语言教学中, 非限定动词结构一直是教学中的重点和难点。限于篇幅, 笔者只能从歧义及语境制约现象探讨非限定动词结构, 其实影响非限定动词结构使用的因素还有许多 (比如文体因素、口语与笔语差异因素等) , 这是本文的不足之处。尽管如此, 我们确信的是任何语言的使用都离不开语境———虽然歧义存在于语言的各个层面, 但是只要正确运用语境制约, 中国外语学习者就一定能突破这一语言难关。

参考文献

[1]Curme, G.O著.汪璜译.Syntax[M].北京:商务印书馆, 1989.

[2]Kess, J.F.&Hoppe, R.A.Ambiguity in Psycholinguis-tics[M].New York:The Free Press, 1972.

[3]何桂金.英语动词新编[M].重庆:重庆大学出版社, 1996.

[4]卢敏.英语笔译实务[M].北京:外文出版社, 2004.

[5]石毓智.汉语的限定动词和非限定动词之别[J].世界汉语教学, 2001, (2) :23-27.

[6]张克礼.英语歧义结构[M].天津:南开大学出版社, 1993.

注重对非结构构件抗震设计 篇9

1 附属构件

女儿墙及附在屋面上的构件等女儿墙是地震时最易遭受破坏和倒塌的建筑构件。这类构件的抗震问题是防止倒塌, 采取的抗震措施是加强非结构构件本身的整体性, 并与主体结构加强锚固连接。在抗震设防区, 屋面的女儿墙及檐口外挑构件应尽可能的采用现浇钢筋混凝土结构, 并且与主体结构可靠连接, 且双层双向配筋。对采用砖砌女儿墙时女儿墙在人流出入口和通道处应与主体结构锚固;非出入口无锚固的女儿墙高度, 6~8度时不宜超过0.5m, 9度时应有锚固。防震缝处女儿墙应留有足够的宽度, 缝两侧的自由端应予以加强。为提高砖砌女儿墙的抗震性能, 减轻地震灾害, 采用砖砌女儿墙时应满足以下要求:1) 不宜将女儿墙直接砌在屋面板上, 避免因屋面板插入墙内而使女儿墙根部与主体结构连接削弱;2) 女儿墙顶部应采用现浇通长钢筋混凝土压顶;3) 在女儿墙内不宜埋设灯杆、旗杆等构件, 如屋顶设有这些构件, 则尽可能不要同女儿墙接结。

2 非结构的墙体

多层或高层建筑的非承重墙体在地震时破坏的主要原因是主体结构变形或层间侧移, 隔墙连接和接缝不牢靠, 自身材料的原因及隔墙的刚度与主体结构的刚度不协调, 都是造成隔墙破坏的重要原因。钢筋混凝土结构常用的结构体系有:框架 、框架一剪力墙以及剪力墙结构体系。框架建筑地震时层间侧移较大, 其非结构填充墙普遍受到破坏。框架一剪力墙结构体系房屋地震时层间侧移较小, 其承重墙的破坏较轻。剪力墙结构体系房屋地震时层间侧移最小, 其隔墙的破坏甚为轻微。非承重隔墙的地震破坏同所选用的材料有关, 粘土砖隔墙普遍破坏 , 轻质材料隔墙破坏较轻, 且轻质极材隔墙的抗震性能又优于轻质块材隔墙。另外, 隔墙的破坏同间隔墙与主体结构构件连接方式有关, 长而高且与主体结构拉结不良的隔墙或未砌到梁或板的底部, 上端留空的隔墙, 破坏普遍较严重。在框架柱中留有钢筋并与墙体有较好拉结结构的, 震裂缝较少。而墙体由两种材料砌筑, 如空心砖墙与实心砖墙接槎砌筑, 或隔墙中有消火栓等嵌入物时, 震后两种材料交接处大多出现裂缝, 砖隔墙上端没有和梁或板底卡紧, 且砂浆不饱满, 接槎不好的, 震后常在交接处出现通长水平裂缝。针对以上震害, 结构设计人员在设计中应采取相应对策, 根据《建筑抗震设计规范》, 建筑多遇地震作用下的抗震变形验算弹性层间位移角限制框架为1/550、框架一剪力墙为1/800、剪力墙为1/1000, 为保证建筑的正常使用功能, 结构设计人员应当根据填充墙材料, 适当提高多遇地震作用弹性层间位移角限制, 如采用空心砖, 加气混凝土砌块, 层间位移角限制框架建议适当提高到1/600, 框架一剪力墙适当提高到1/900, 剪力墙适当提高到1/1100, 而对于采用轻质高强延性墙板层间位移角限制不提高。非承重墙体应优先采用轻质材料。鉴于非轻质材料的墙体在工程中的大量使用, 因此在抗震设计中是一个复杂而又不容忽视的问题。首先, 其造型和布置, 应根据设防烈度、房屋高度、建筑体型、结构层间变形、墙体抗侧力性能的利用等因素经综合分析后确定, 避免使结构形成刚度和强度上的突变。如有可能, 应采取适当的措施, 使其成为抗震的第一道防线。其次, 应保证墙体自身稳定及与结构体系的可靠拉结抗震, 如设拉结筋、系梁、圈梁、构造柱等, 应能适应不同方向的层间位移。在与主体结构连接时, 应注意两种连接方案与结构体系计算模型的对应一致。刚性连接时, 在布置上要使非结构墙体成为结构抗震体系的一部分, 并注意质量、刚度均匀对称, 在计算中要考虑非结构墙体的质量、刚度和强度, 在构造上要与主体结构紧密牢靠结合;柔性连接 (包括脱开) 时, 在布置上要避免非结构墙体与主体结构共同工作, 在计算上只考虑其重量, 不利用其刚度和强度, 在构造上要使非结构墙体和主体结构在水平方向能各自自由变形, 但要防止非结构墙体平面外倒塌。

3 建筑的装饰物

建筑的饰物指建筑贴面、装饰、顶棚和悬吊重物等, 地震时, 由于水平和竖向运动, 悬挂的吊顶和天棚系统特别容易破坏。吊顶和天棚坠落, 灯具连接不牢, 都会对公众生命安全产生威胁。装修部分的损坏虽然不至影响到整个建筑物的坚固性和稳定性, 但当它们塌落时, 对人和设备则具有严重的危险性。随着装修行业的发展, 在改造原有建筑空间的同时, 如不严格控制, 二次装修时, 容易造成对原有结构体系的破坏。如在承重墙上凿洞、随意扩大或移动门窗洞口;另一方面, 一些较为复杂的装饰造型, 只注重了外形, 没有形成合理稳定的结构体系, 易造成安全隐患, 所以应当加固。这类构件的抗震问题是防止落和装饰物的破坏, 采取的抗震措施是同主体结构的可靠连接。对重要的贴面和装饰, 也可采用柔性连接, 即使主体在地震作用下有较大变形, 也不致影响到贴面和装饰的损坏。对建筑物内的装饰构件应与主体结构、墙体有可靠连接, 避免震害情况下坠落、倾倒伤人。建筑物不宜采用无可靠连接的外装饰构件, 外装饰面材应与主体可靠连 (粘) 接。建筑屋顶非结构装饰构件宜优先采用钢结构形式。

4 建筑附属机电设备及支架

附属于建筑的机电设备和设施种类繁多, 其与结构体系的连接构件和部件在地震时破坏的主要原因是:1) 电梯配重脱离导轨;2) 支架间相对位移导致管道接头损坏;3) 后浇基础与主体结构连接不牢或固定螺栓强度不足造成设备位移或从支架上脱落;4) 悬挂构件强度不足导致灯具坠落;5) 不必要的隔震装置加大了设备的振动或发生共振, 反而降低了抗震性能等。上述机电设备和设施的抗震措施, 应根据设防烈度、建筑使用功能、房屋的高度、结构类型和变形特征、设备和设施所处的位置和运转要求等, 经综合分析后确定。应注意合理设计设备支架及与建筑物应有可靠的连接和锚固, 包括增加接头变形能力, 并应使设备在遭遇设防烈度的地震影响后能迅速恢复运行。 建筑附属机电设备的设置部位要适当, 支架设计时要注意防止设备系统和建筑结构发生谐振现象。

5 楼梯

发生强烈地震时, 楼梯间是重要的紧急逃生竖向通道, 楼梯间 (包括楼梯板) 的破坏会延误人员撤离及救援工作, 从而造成严重伤亡。《建筑抗震设计规范》修订增加了楼梯间的抗震设计要求。民用建筑中楼梯间是防震安全疏散的关键部位, 框架结构中必须采取相应措施:1) 楼梯间尽量不要设置在建筑物尽端山墙处;2) 在楼梯间的楼层标高处设置现浇钢筋混凝土圈梁 ;3) 楼梯间和人流通道的填充墙, 尚应采用钢丝网砂浆面层加强。当采用砖砌体房屋时楼梯间尚应符合下列要求:1) 顶层楼梯间墙体应沿墙高每隔500mm设2Φ6通长钢筋和Φ4分布短钢筋平面内点焊组成的拉结网片或Φ4点焊网片;7~9度时其他各层楼梯间墙体应在休息平台或楼层半高处设置60mm厚、纵向钢筋不应少于2Φ10的钢筋混凝土带或配筋砖带, 配筋砖带不少于3皮, 每皮的配筋不少于2Φ6, 砂浆强度等级不应低于M7.5且不低于同层墙体的砂浆强度等级。2) 楼梯间及门厅内墙阳角处的大梁支承长度不应小于500mm, 并应与圈梁连接。3) 装配式楼梯段应与平台板的梁可靠连接, 8、9度时不应采用装配式楼梯段;不应采用墙中悬挑式踏步或踏步竖肋插入墙体的楼梯, 不应采用无筋砖砌栏板。4) 突出屋顶的楼、电梯间, 构造柱应伸到顶部, 并与顶部圈梁连接, 所有墙体应沿墙高每隔500mm设2Ф6通长钢筋和Φ4分布短筋平面内点焊组成的拉结网片或Φ4点焊网片。

6 结束语

总之, 对非结构构件的设计, 可根据不同情况区别对待, 首先, 做好细部构造, 让非结构构件成为抗震结构的一部分, 在对主体结构计算分析时, 充分考虑非结构构件的质量、刚度、强度和变形能力, 而在对非结构构件的构造做法上防止非结构构件参与工作;其次, 对楼梯间等重要的紧急逃生竖向通道, 要加强抗震设计。

参考文献

[1]GB50011-2010, 建筑抗震设计规范[S].北京:中国建筑工业出版社.

[2]黄世敏, 杨沈.建筑震害与设计对策[M].北京:中国计划出版社.

非结构化数据:被忽视的富矿 篇10

在数据分析行业, 大致的统计是, 世界上约80%的数据都是非结构化数据。此前, 数据分析对象绝大部分是结构化数据, 比如姓名、性别、年龄这些信息, 可以以Word, Excel等形式呈现的数据。而非结构化数据是更加“莫可名状”的:它们通常藏在我们的聊天记录、邮件、发布的图片、语音以及视频中。

在中美两国科技界对未来技术的甄选中, 大数据分析通常位列其中, 而非结构化数据又被认为是大数据产业的一个核心。目前, 国内的现有数据绝大部分是结构化的, 对于非结构化数据的分析处在“有概念、无工具”的状态。

点评:大数据分析, 特别是对非结构化数据的分析, 是未来技术发展的方向。对于非结构化数据的分析工具来说, 电商平台海量的商家数据、客户评论就是一个富矿。如果利用好这些非结构化数据, 未来就能打开庞大的市场。

非结构信息 篇11

关键词:水文地质;非结构化数据;信息

一、非结构化数据的定义

相对于结构化数据(即行数据,存储在现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括数据库里,可以用二维表结构来逻辑表达式所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。据统计,非结构化数据占到现有数据总量的80%以上。

二、非结构化水文地质数据的特点

1、专业性强。水文地质数据涉及到的大部分是和水文地质相关的信息,如水文地质图、物探、测井曲线、地质构造三维结构图、各种水文视频资料等内容。对于这些数据的分析和解释,不同的经验背景、不同分析方法得出的分析结论可能依然会有差异。

2、媒体形式多。水文地质资料包括数字化的文本、实物、照片、电子出版物、数字及三维地质图、地质构造图等各种各样的水文地质相关资源。其存储媒介已不限于印刷体,它包含文本、声音、图像、视频等多种媒体形式,类型复杂。

3、存储容量大。水文地质相关的各类资料非常多,要实现由计算机来进行处理分析,则需要对大量资料进行信息抽取和数字化,随着资料的不断完善,资料的积累导致的数据会成倍增长并将一直持续下去。

三、水文地质数据信息的管理及使用现状

1、管理现状。目前,在国内各水文地质、勘察设计等单位之间没有形成有效的资源共享,各单位的详细信息资源基本都相互独立,产生了信息孤岛。同时,在单位内部,除部分结构化的信息资料(如地质结构数据等)由计算机进行管理,大部分的应用系统中的非结构化数据,如报告、报表、图片等都是以二进制的格式保存在结构化数据库的BLOB字段中。保存在BLOB字段中的好处是调用文件的速度很快,维护和管理简单;缺点一是由于非结构化数据文件大,在数据量不断增大的情况下,会使得结构化数据库迅速膨胀,导致数据库性能下降,进而影响整个应用系统的性能;二是由于各个应用系统相对封闭和独立,其他应用无法共享相关文档资料,信息之间的关联程度低,不能有效发挥信息之间的关联解释作用,极大的降低了数据的价值。

2、使用现状。由于上述的管理现状,水文地质资料在使用上存在影响资料价值有效发挥及工作效率低的问题。例如,在本单位所掌握的资料区域内执行任务时,由于信息资料管理的自动化程度低,资料之间的关联关系没有有效建立,查阅资料时就需要翻阅不同存储位置、不同存储介质的大量信息,以便为制定决策提供依据,极大的降低工作效率。如果到本单位所掌握的资料区域外执行任务,所能得到的参考资料非常少,通常需要提前进行现场勘查或到当地有关单位索取相关资料。

四、水文地质数据的应用分析

第一类决策指挥层:主要关心的是水源分布及施工進度情况,从宏观上掌握控制水环境,以便能够及时进行任务分派、调整、做出指挥决策。

第二类工程地质人员:主要关心如何利用现有水文地质资料及以往的知识和经验分析某一区域的水文地质情况,寻找水源位置,评估施工效率和施工成本,报表打印,为施工、钻井设计以及水源侦查过程中所遇到的一些问题提供相关资料和解决办法。

第三类施工技术人员:包括钻井指挥人员、机台管理人员、设备操作人员等,主要关心施工区域的地质构造,应采用的施工工艺,发生故障时应采取的处理办法。

五、水文地质信息知识抽取模型的建立

1、对水文地质非结构化数据进行专业细分,使其作为一个独立的专业领域来进行专门处理,从而极大缩小数据的管理范围,提供管理的专业化水平。因此,集成行业的相关数据,或者说为了搜索和分析而对这些数据进行专业细分,其实现的可能性就非常大。

2、在非结构化水文地质数据采集的方式上采用元数据管理和系统自动学习修正的技术,从而提高数据质量。对于非结构化的水文地质数据,大部分都无法直接由计算机来进行统一管理和使用,必须对其本质信息进行抽取和总结,从而提取出便于计算机管理的有价值的信息。抽取的这些信息便是非结构化数据的元数据描述。这些元数据通常无法由计算机直接生成,需要由专业人员对其进行解释分析生成。

3、在数据使用上采用全文检索技术和信息自动关联的方法。根据调查,地质工作者每天30%的工作时间,用于收集信息:72%的领导者认为,知识没有在他们的组织得到重复利用。从这些异构、繁杂、丰富的内容中,准确、快速地找到自己所需要的信息,减少信息搜寻时间,能够创造巨大的价值。当非结构化的水文地质元数据库建立好以后,信息查找就变的和处理结构化数据一样简单了。

六、非结构数据模型存在的问题

1、各水文地质单位之间的数据共享问题。由于这些水文地质数据可能涉及到国家利益和各单位的自身利益,因此有些数据通常属于保密范畴,通常不便于联网使用。因此,这些详细的水文地质资料需要由国家相关部门来统一进行整合,统一管理使用,及时进行数据更新,从而方便相关部门执行任务时进行查找使用。

2、结构化数据与非结构化数据之间的互通问题。以上模型的建立是基于非结构化的水文地质数据而得出的,对于结构化的水文地质数据依然保存在结构化的数据库中,二者之间如果要建立关联,则需要一个中间的特殊纽带来完成。纽带的选择非常重要,我们将地理坐标和区域名称作为这一关键性的关联纽带,在结构化和非结构化水文地质数据之间建立联系。

3、专业化解释的问题。对于非结构化的水文地质数据,由于其专业化程度较高,很多数据都需要进行分析解释,因此,元数据构建的工作量非常大。

非结构信息 篇12

陈英副司长在讲话时表示, “大数据”已经成为当今信息领域一个新的热点, 此时成立标准工作组正当其时, 工作组的成立是我国软件行业的一件大事。他要求工作组力争在非结构化数据管理领域不但制定出适合当前产业需要和技术发展的国家标准, 同时也要使我国的标准化成果能够走向国际, 影响国际标准化的进展, 体现中国的实践, 发出中国的声音。

四位院士对工作组的成立给予了充分肯定, 对工作组的未来工作提出期望。他们一致认为, 非结构化数据管理对于“大数据”时代具有重要意义, 在文化教育、数字传媒、医疗保障、社会管理、互联网服务、电子政务、电子商务、企业高端信息应用服务以及行业应用等国家社会经济的重要领域都有着广泛的应用前景。“大数据”是当前全世界都在关注的技术领域, 在非结构化数据管理标准化工作上, 我国和外国同行站在同一起跑线上。他们希望我国的标准化工作一定要从中国的实际情况出发, 积极把握国际标准动态, 切实提高国内非结构化数据管理标准水平, 促进产业和应用的发展。

据悉, “十一五”期间依托国家“核高基”科技重大专项“非结构化数据管理系统”课题, 北京航空航天大学、清华大学、浙江大学等课题承担单位紧密围绕国家、社会和产业需求, 突破了四面体数据模型、分布式柔性事务模型以及跨媒体计算理论及方法等一批非结构化数据管理的核心技术, 成功研制了三款自主的非结构化数据管理系统产品, 并应用于多媒体数据管理、数字图书馆、舆情分析、中国科技资源共享服务平台、智能交通信息服务、流程工业集成、航空航天制造服务、医学影像数据处理等若干重大领域。

为凝练、固化“核高基”重大专项课题的研究成果, 推动非结构化数据管理技术与产业的发展, 2012年3月31日, 经全国信息技术标准化技术委员会2012年第一次主任会议批准成立“非结构化数据管理标准工作组”。工作组负责制定和完善我国非结构化数据管理领域的标准体系, 制定我国非结构化数据管理相关国家标准, 并对口ISO/IEC JTC1/SC32/WG4国际标准化组织。该工作组组长由北京航空航天大学计算机学院院长马殿富教授担任, 工业和信息化部软件服务业司副司长陈英、中国工程院院士潘云鹤和孙家广、中国科学院院士李未和梅宏担任工作组顾问, 秘书处设在中国电子技术标准化研究院。

工作组组长马殿富表示, 工作组将系统深入地研究非结构化数据管理领域的标准体系、制定非结构化数据管理体系结构、数据模型、特征抽取、语义标注、查询语言、应用模式以及相关数据挖掘和系统集成等国家标准, 以及与关系型数据库等的互操作标准;支持非结构化数据管理产品开发商产品研制, 提出面向不同领域和应用服务的非结构数据管理规范, 支持高端信息应用服务企业产品系统开发;建立基于国家标准的非结构化数据管理公共测试平台;提供非结构化数据管理标准应用实施的咨询服务。同时, 我们也要注重非结构化数据管理工作组与国际相关标准化组织联系, 推进我国的非结构化数据管理标准在国际相关标准化组织推广。

上一篇:人文意义下一篇:中国画的构图要点