定性数据

2024-09-07

定性数据(精选10篇)

定性数据 篇1

同学们知道用极差描述数据的离散程度简单明了, 但由于极差仅仅由其中的最大值和最小值所确定, 个别远离群体的极端值会在很大程度上影响极差, 因而极差往往不能充分反映一组数据的实际离散程度. 而方差能非常精确地反映一组数据的离散程度, 用方差不仅可以用来解决实际问题, 而且还是中考的热点问题.

一、直接给出方差, 判断稳定性

例1甲、乙两个参加市组织的省“农运会”铅球项目选拔赛, 各投掷6次, 记录成绩, 计算平均数和方差的结果为:甲=13.5 m, 乙=13.5 m, s甲2=0.55, s乙2=0.50, 则成绩较稳定的是_______ (填“甲”或“乙”) .

【考点】方差.

【解析】根据方差的定义, 方差越小数据越稳定.因为s甲2=0.55>s乙2=0.50, 方差小的为乙, 所以成绩比较稳定的是乙.

二、根据统计图求解方差, 判断稳定性

例2 甲、乙射击运动员进行10次射击, 甲的成绩是7, 7, 8, 9, 8, 9, 10, 9, 9, 9, 乙的成绩如图1所示.则甲、乙射击成绩的方差之间关系是s甲2_______s乙2 (填“<”“, =”“, >”) .

【考点】折线统计图, 方差.

【解析】由已知, 甲的平均成绩= (7+7+8+9+8+9+10+9+9+9) ÷10=8.5,

乙的平均成绩= (8+9+7+10+7+9+10+7+10+8) ÷10=8.5,

∴s甲2=[2× (7 -8.5) 2+2× (8 -8.5) 2+5 × (9 -8.5) 2+ (10-8.5) 2]÷10=0.85,

s乙2=[3× (7-8.5) 2+2× (8-8.5) 2+2× (9-8.5) 2+3× (10-8.5) 2]÷10=1.45.

∴ s甲2<s乙2.

三、根据统计表求解方差, 判断稳定性

例3某次跳绳比赛中, 统计甲、乙两班学生每分钟跳绳的成绩情况如下表 (单位:次) :

下列三个命题:

1甲班平均成绩低于乙班平均成绩;

2甲班成绩的波动比乙班成绩的波动大;

3甲班成绩优秀人数少于乙班成绩优秀人数 (跳绳次数≥150次为优秀) .

其中正确的命题是_______. (只填序号)

【考点】算术平均数, 方差, 中位数.

【解析】根据平均数、中位数、方差的意义分析三个说法:两个班的平均成绩均为135次, 故1错误;方差表示数据的波动大小, 甲班的方差大于乙班的, 说明甲班的成绩波动大, 故2正确;中位数是数据按从小到大排列后, 中间的数或中间两数的平均数, 甲班的中位数小于乙班的, 说明甲班成绩优秀人数不会多于乙班成绩优秀人数, 故3正确.故答案为2 3.

定性数据 篇2

隧道围岩量测数据处理与稳定性分析

本文并采用MATLAB工程计算软件对火烧沟隧道围岩量测数据进行了实例处理与分析,为今后类似隧道工程施工提供依据.

作 者:张洪亮 Zhang hongliang 作者单位:辽宁省路桥建设一公司,辽宁沈阳,110000刊 名:辽宁省交通高等专科学校学报英文刊名:JOURNAL OF LIAONING PROVINCIAL COLLEGE OF COMMUNICATIONS年,卷(期):200911(2)分类号:U456.3关键词:隧道 新奥法 量测 回归分析 计算软件 稳定性

定性数据 篇3

关键词:网络控制系统;数据包丢失;系统建模;稳定性

中图分类号:TP311.52 文献标识码:A 文章编号:1007-9599 (2012) 09-0000-02

一、具有数据包丢失的网络控制系统概述

在网络控制系统中的各种信息进行数据交换和传输的唯一通道就是通讯网络,比如:控制系统的状态信息、传感器的数据测量、控制量的状态信息等。网络控制系统的基本结构如下图所示:

图 1 网络控制系统结构图

网络数据在传输过程中主要存在以下问题:数据包丢失、网络诱导时延、单包传传输、网络节点的工作模式、多包传输、网络调度、数据包乱序等,这些问题都会影响网络控制系统的设计、建模、稳定性分析。并且网络在传输过程中,发生数据包丢失会呈现不确定特性和明显的时变,很难准确地描述其特性。随着混合系统与切换系统的出现,为研究有数据包丢失的网络控制系统提供了相应的解决方法。对于以控制器作为事件驱动,以传感器作为时间驱动的网络控制系统,并且忽略网络诱导时延,将网络数据包是否传输成功等效为控制开关的断开与闭合,建立有数据包丢失的网络控制系统模型。

通过异步动态系统分析闭环系统数据丢失指数的稳定性,研究闭环系统稳定中网络数据包的丢失率范围。假设网络数据包的丢失率是独立且同分布,网络控制系统为切换系统,在网络数据包丢失的环境下,切换系统数据包的丢失率与系数矩阵的切换概率同分布。还可以假设执行器、控制器、传感器都是时间驱动,并且时钟完全同步,通过两个对角的二元矩阵对控制的器数据包丢失和传感器的数据包丢失分别进行描述,同时还要假设它们都是具有同分布,并且独立的随机变量,对网络控制系统中的LQG控制器和克服网络数据包丢失的观测器进行设计。

二、针对数据丢失的网络控制系统建模

网络控制系统中的执行器、控制器、传感器通过通讯网络来控制信息和传输测量数据。当执行器、控制器、传感器通过通讯网络进行数据传输时,很容易产生数据的碰撞,从而造成数据的传输和接收出错、节点竞争失败、数据包在规定时间内没到达接收端。当网络控制系统的功能和结构一定时,其网络负载也是一定的。因此,有数据包丢失的网络控制系统,可以等效为按一定速率进行切换的开关,如下图所示:

u(kT) x(kT)/y(kT)

K2

S1 S2

S1? S2?

v(kT) x?(kT)/y?(kT)

圖 2 有数据丢失的网络控制系统

在图2中,(1)u(kT)表示在第k周期由通讯网络传输过来的控制信号,也就是执行器输入;(2)x(kT)/y(kT)表示在第k周期中传感器的检测输出;(3)x?(kT)/y?(kT)则表示由通讯网络传输时的控制器输入;(4)v(kT)表示在控制器计算后所输出的控制信号;(5)开关K1作为执行器与控制器之间的通讯网络;(6)开关K2作为控制器与传感器之间的通讯网络。如果网络数据包由通讯网络传输成功时,则视为通讯网络(开关)接通;如果当网络数据包丢失时,则视为通讯网络(开关)断开;如果当数据包的丢失率一定时,则视为网络(开关)按一定的速率断开与接通;如果当通讯网络开关断开时,则数据包丢失。通讯网络(开关)的接通与断开的动态输出模型可以表示如下:

(1)S1(K1闭合时), 则 u(kT)= v(kT)

(2)S1?(K1断开时),则 u(kT)=u((k一1)T)

(3)S2(K2闭合时), 则 x?(kT)/y?(kT)= x(kT)/y(kT)

(4)S2?(K2断开时),则 x?(kT)/y?(kT)= x?((k-1)T)/ y?((k-1)T)

在网络控制系统的运行中,系统通常会发生4种状态,如下表所示:

K2K1x?(kT)/y?(kT)u(kT)

断S2?时断S1?时x?(k)/y?(k)= x?(k-1) y?(k-1)u(k)=u(k-1)

通S2时通S1时x?(k)/y?(k)=x(k)/y(k)u(k)=v(k)

通S2时断S1?时x?(k)/y?(k)=x(k)/y(k)u(k)=u(k-1)

断S2?时通S1时x?(k)/y?(k)= x?(k-1) y?(k-1)u(k)=v(k)

表 1 网络状态与节点状态之间的关系

三、 稳定性分析

针对一个不确定时延的,事先设计好的网络控制系统,要充分考虑到网络数据包在传输中的丢失,并且要假设网络数据包的丢失发生率是一定的,研究闭环控制系统是否稳定。要是在某一个周期内,发生S1?或者S1 S2?事件,都有可能导致没有新的控制量在被控对象上发生作用,所以,可以合并这两个事件为一个事件。同时,数据包传输成功为CU,也就是有新的控制量在被控对象上发生作用;数据包传输失败则为CNU,也就是没有新的控制量在被控对象上发生作用,则可以简化闭环系统,如下图所示:

VK XK

CU CNU

UK

图 3 简化等效的网络控制系统

(1)如果数据包成功传输CU发生时,则uK就能成功的传输到执行器,并充分考虑到通讯网络传输的时延,那么

v(t)= vk-1 tk

uk tk+Tk

(2)如果数据包传输失败CNU发生时,则uK就不能传输到执行器,那么

v(t)=vk-1 , tk

下面对被控对象的模型进行描述,可以把被控对象的状态方程设为:

x(t)=Ax(t)+Bv(t) , y(t)=Cx(t)

其中x∈Rn为对象的被控状态;v∈R作为对象输入;y∈R作为对象输出。如果在任意一个周期内,数据包传输成功CU发生,充分考虑到时延,那么

xk+1=Gxk+HD(tk)uk+H1(tk)vk-1 , vk=uk , yk=Cxk

如果任意一个周期内,数据包传输失败CNU发生,那么

xk+1=Gxk+Hvk-1 , vk=vk-1 , yk=Cxk

定义增广向量: Sk= xk , Sk+1=¢1sk+T1uk , yk=C?SK

vk-1

其中i=1,2时,对应事件CU,CNU, ¢1= G H1(tk) ,¢2= G H , 0 0 0 1

T1= H0(tk) , T2= 0 , C?=[C 0]

1 0

如果不考慮网络数据包丢失的影响,那么控制器则为: uk=Kxk , 其中

K∈R1*N表示控制器的增益,那么闭环系统可以表示为:

Sk+1=¢1sk , yk=C?SK , 其中i=1,2时,

¢1= G+ H0(tk)K H1(tk) , ¢2= G H

K 0 0 1

当t(k)为时变不确定时,¢1=¢1+D?F(k)E? , 其中 ¢1= G+ H0K H1

K 0

D?= D , E?=[ EK-E ] 。

0

如果控制器节点域传感器节点的网络数据传输的成功率为已知的常数,用r1,r2 表示。当0

四、结束语

在网络控制系统中还有许多的问题等待着我们去研究,比如:当被控对象为线性系统时,要充分考虑到数据包的时序错乱、通讯网络诱导时延,针对数据包丢失的网络控制系统的分析、建模、控制;对于长时延的多包数据传输的网络控制系统的分析、建模、控制;当被控对象时非线性系统时,网络控制系统的分析、建模、控制;要设计好控制策略,确保闭环系统运行的稳定性。在网络控制系统中,系统的性能与网络调度和控制策略密切相关。

参考文献:

[1]于之训,陈辉堂,王月娟.时延网络控制系统均方指数稳定的研究[J].控制与决策,2000(15)

[2]樊卫华,蔡骅,陈庆伟,胡维礼.基于异步动态系统的网络控制系统建模[J].东南大学学报(自然科学版),2003(33)

[3]邓士普,王树青.基于网络的控制系统研究综述[J].化工自动化及仪表,2003(06)

[4]朱其新,胡寿松.网络控制系统的分析与建模[J].信息与控制,2003

定性数据 篇4

随着计算机技术的快速发展, 传统的确定性数据 (Deterministic Data) 管理技术也得到了极大的发展。近年来, 随着具有感知能力、计算能力和通信能力的微型传感器的广泛应用, 不确定性数据 (Uncertain Data) 得到广泛的重视。在许多现实的应用中, 例如:经济、军事、物流、金融、电信等领域, 数据的不确定性普遍存在, 不确定性数据成为数据库的主要数据。传统的数据管理技术却无法有效管理不确定性数据, 这就引发了学术界和工业界对研发新型的不确定性数据管理技术的需求。

一般说来, 传感器数据是以一种实时动态、持续变化的数据流的形式存在, 同时由于传感器数据的精确度受到传感器各方面参数的影响[1], 使得传感器数据流是一种不确定信息。目前, 基于传感器数据流的不确定性数据库的研究还比较少, 其研究对象主要集中于无线传感器网络、无线射频系统、数字化家庭、股票交易系统、网络监测系统、道路交通监测系统、电信通话记录系统等[2]。主要研究方向有:原型系统设计与实现[3]、查询处理优化[4]、分布式数据流[5]、不确定数据流的研究[6]等。

本文主要研究对象是传感器数据流, 其目的在于研究一个组织、管理传感器不确定数据流的数据库系统。在对国外数据流管理原型系统研究的基础上[7], 比较了一般数据流数据库和不确定数据流数据库, 在RedHat Linux 9.0平台上部分地实现了不确定数据流数据库系统UCDS (Uncertain Data Stream Database System) 。实现的语言为C/C++, 系统采用了面向对象的设计与实现方法。

1 UCDS系统概述

不确定性数据库是高效地获取不确定性数据, 科学地组合和管理不确定性数据的数据库系统。UCDS数据库系统部分地实现了不确定数据流的管理功能, 包括带可信度的属性值的查询管理, 具有动态性的属性值的查询管理, 不确定输入数据的预处理和一般数据流 (即不包括不确定信息的数据流) 的查询管理等。

本文的不确定据库系统中的算子分为两类:一般数据操作算子和不确定的动态数据操作算子。一般数据操作算子还可以分为关系-数据操作算子和数据-数据操作算子。这两种算子中既包含一元操作也包含二元操作。由于不确定数据的属性是以一定概率取值的, 因此对不确定性属性值进行连接、聚集等操作没有意义。这里保留了大多数的一般数据操作算子, 增加的不确定性动态数据算子主要有CONF, PROB和PDF算子。CONF表示求属性值的隶属度, PROB表示求动态属性值的概率, PDF表示求动态属性值的概率密度函数。这些算子和运算符的词法、语法分析由LEX与YACC两个分析器完成。LEX是一个通用的词法分析生成器。它可以分析任何语言的词法, YACC由贝尔实验室开发, 是一个通用语法分析器。具体关于LEX和YACC的技术资料请参考文献[8]。

2 UCDS的体系结构

UCDS采用客户机/服务器体系结构, 如图1所示, 主要的子系统有:用户接口子系统、计划子系统、执行子系统和不确定数据预处理子系统。其中计划子系统和执行子系统是核心部分。计划子系统负责把UCQL注册和查询语句进行词法语法分析并转换成内部表示方式, 经过优化形成物理查询计划。执行子系统负责查询语句的执行。

2.1 用户接口子系统

用户接口子系统由三部分组成:服务器模块、数据源获取模块 (关系或动态数据元组的获得) 和查询结果输出模块。服务器模块功能有:服务器的配置、动态数据或关系的注册模块、不确定数据查询的注册和运行。

2.2 计划子系统

计划子系统的结构如图2所示。由词法和语法分析、逻辑和物理计划产生器、查询管理器、表管理器和计划管理器等组成。计划子系统负责把UCQL语句进行词法语法分析并转换成内部形式, 并经过优化形成物理查询计划。

语法分析 将查询字符串转换成表示查询的语法树, 语法解析也适用于动态数据与关系的注册。该子系统主要是通过YACC与LEX对UCQL语句进行语法分析与词法分析。

语义分析 把语法树转换成查询的内部表示结构。语义分析主要解决以下问题:解决属性参照;补充实现UCQL的缺省及缺失信息 (例如“SELECT*”中的“*”) ;把基于字符串的动态数据流名称、属性标识符转换成内部的表示形式。

逻辑计划产生器 把查询的内部表示形式转换成查询的逻辑计划。该逻辑计划是由逻辑算子组成, 逻辑算子与关系代数算子类似 (例如:SELECT, PROJECT, JION) 。增加逻辑计划查询层的原因是:由逻辑计划到物理计划的转换比直接到物理计划层要容易, 同时, 逻辑计划中的算子比与底层细节有紧密关系的物理计划算子更抽象。

物理计划产生器 把查询的逻辑计划转换成查询的物理计划。物理计划中的算子可以准确地在执行子系统中应用。

查询管理器 查询管理器存储注册的查询, 它为每个查询分配一个惟一的ID号, 目的在于方便系统其他部分的使用。

表管理器 表管理器存储注册的动态数据流和关系的名称和数据模式, 这些数据流和关系可以是输入的数据流和原始的关系, 也可以是查询得到的中间结果。

计划管理器 计划管理器存储了与所有注册查询相对应的物理查询计划。

2.3 执行子系统的实现

执行子系统如图3所示, 负责查询语句的执行。

执行子系统中的数据有三种类型:元组、元素和中间数据。元组是数据的基本单元。在逻辑上, 元组是属性值的集合;在实现时, 一个元组是属性值集合所对应的内存单元的指针。元素是一个带有时间戳与符号的元组。中间数据是一种只有时间戳的元素, 与元组的符号无关。中间数据将用于算子间时间进程的通讯。

每个查询计划包括三种元素:算子、队列和大纲。

(1) 算子:算子用于处理输入并把输出放入输出队列。

(2) 队列:连接输入算子和输出算子, 队列中包含部分数据流或整个关系, 也可看作是执行算子前的一个缓存区。

(3) 大纲:存储了查询计划的中间状态, 连接算子必须能获得当前窗口输入的所有数据流元组, 所以连接算子必须具有一个大纲。而投影操作和不消除重复数据的并操作就不需要大纲。

如有如下两个对数据流S1, S2的查询Q1和Q2:

Q1:SELECT B, MAX (A) FROM TS1[ROWS 10 000] GROUP BY B;

Q2:SELECT*FROM S1[ROWS5000], S2[RANGE 500 SECONDS] WHERE S1.A=S2.A;

窗口算子1从队列1中读入数据流元组S1, 更新大纲1, 并把带有元素的数据流输出到队列3和队列4, 大纲1包括最近到达的10 000个元组, 这里选择查询1和查询2中较大的一个。同理, 大纲2则存储最近500 s到达的元组。聚集算子求出对相同S1.B数据流元组中最大的S1.A的值, 并将结果存储在大纲6中, 将带有元素的数据流放入队列6中, 因为大纲6中的结果是持续增长的, 所以必有较旧的结果被剔除出大纲6, 从而大纲6必须从大纲3中寻找新的满足查询的结果。所以大纲3仅仅是队列1的一个时间戳较小的数据流拷贝, 可以看出大纲3和大纲1是共享的关系而不是简单复制的关系, 同理大纲4和大纲1, 及大纲5和大纲2。连接算子结果为大纲4和队列5进行连接, 已经大纲5和队列4进行连接的结果。

同时, 图3中的还有四个功能模块起着重要的作用:

(1) 存储分配:

系统中的所有元组由存储分配算符对象进行分配空间。一个存储分配算符由一个算子拥有, 用来分配空间给算子输出元素的元组。不是所有的算子都拥有一个存储分配符, 例如, 选择算子只是简单地输出、输入元组, 并不产生新元组。存储分配算符也跟踪元组的空间使用与收回元组不使用的空间。

(2) 存储单元:

存储分配算符与大纲的描述主要集中在算子的接口上。大多数存储分配算符与大纲的实际逻辑是在存储单元内实现。每一个存储单元支持一个存储分配单元和一个大纲集合。每一个大纲与一个存储单元关联, 并且大纲中的所有元组的分配由存储单元进行分配。

(3) 内存管理器:

内存管理器管理一个公共内存池, 按照需要以页为单位为存储单元、索引、队列分配内存。

(4) 调度器:

调度器分成两部分, 一部分负责系统内算子的调度, 另一部分负责持续查询的事务调度。

3 结 语

针对传感器数据流具有不确定性的特点, 采用客户机/服务器体系结构, 在RedHat Linux 9.0平台上部分地实现了基于UCDS系统。本数据库系统虽然只是实现了部分功能, 但对不确定性数据库系统的研究仍不失为一次有益的探索。

摘要:针对不确定的传感器数据流, 在对国外数据流管理原型系统研究的基础上, 采用客户机/服务器体系结构, 在Red Hat Linux 9.0平台上部分地实现了不确定数据流数据库系统 (UCDS) 。详细描述了不确定数据流数据库系统的基本定义、系统的体系结构等, 为不确定性数据库的研究做出了有益的探索。

关键词:不确定性数据,不确定性数据库,体系结构,数据结构

参考文献

[1]李建中, 李金宝, 石胜飞.传感器网络及其数据管理的概念、问题与进展[J].软件学报, 2003, 14 (10) :1717-1727.

[2]BABCOCK B, BABU S, DATAR M, et al.Models andissues in data streams system[C]//Proceedings of the 21stACM SIGACT-SIGMOD-SIGART Symposium on Princi-ples of Database Systems.Madison:ACM Press, 2002:1-16.

[3]ARASU A, BABCOCK B, BABU S.STREAM:the Stan-ford data stream management system[J].IEEE Data Engi-neering Bulletin, 2003, 26 (1) :19-26.

[4]GOLAB L, TAMER M.Processing sliding window multi-joins in continuous queries overdata streams[C]//Proceed-ings of the 29thInternationall Conference on VLDB.Berlin:Morgan Kauf mann Publishers, 2003:500-511.

[5]BULUT A, SINGH A K, VITENBERG R.Distributed da-ta streams indexing using content-based routing paradigm[C]//Parallel and Distributed Processing Symposium2005, Proceedings 19th IEEE International.Washington DC:IEEE Computer Society, 2005:94-94.

[6]SARMA A D, HEFFERY S R, FRANKLIN MJ, et al.Esti mating data stream quality for object-detection applica-tions[C]//Proceedings of the 3rd International ACM SIG-MOD Workshop on Information Qualityin Information Sys-tems.Chicago:Illinois, 2006:16-28.

[7]BONNET P, GEHRKE J, SESHADR P.Towards sensordatabase systems[C]//Proceedings of the 2nd InternationalConference Mobile data Management.Hong Kong:Spring-er-Verlag, 2001:3-14.

定性数据 篇5

用图表展示定性数据试题

本卷共分为1大题50小题,作答时间为180分钟,总分100分,60分及格。

一、单项选择题(共50题,每题2分。每题的备选项中,只有一个最符合题意)

1.我国现行的统计基本法是______。A.中华人民共和国统计法

B.中华人民共和国统计法实施细则 C.统计行政法规 D.统计规章 E.规范性文件

2.某企业的全部实收资本中,国有经济成分的出资人拥有40%的股本,集体经济成分的出资人拥有30%的股本,私人经济成分的出资人拥有30%的股本。请根据上述资料,回答下列问题:该企业若实施改制,改制后国有经济成分的出资人拥有50%的股本,私人经济成分的出资人拥有50%的股本,未明确由谁绝对控股,则此时该企业属于______ A.国有控股 B.私人控股 C.集体控股 D.其他

3.B企业均为一般纳税企业,增值税税率17%)加工材料(非金银首饰),原材料价款为68万元,加工费用9.36万元(含增值税),由受托方代收代缴消费税4.5万元,材料已经加工完毕验收入库,收回后继续用于生产应税消费品。该材料加工后入库成本是__万元。A.77.36 B.81.86 C.76 D.80.5

4.事业单位在财产清查中发现事业用材料盘亏,其中属于正常损耗的应__。A.计入当期经背支出 B.计入当期事业支出 C.直接抵减一般基金

D.冲减事业用材料盘盈价值

5.某公司上年末资产负债表部分余额如下:资产总计为6000000元,其中流动资产2000000元,负债总计2000000元,其中流动负债1600000元。假定本年发生以下经济业务:(1)企业收到投资者投入的资本金500000元,款项已经存入银行。(2)企业从外地购入甲材料1000千克,每千克20元;乙材料4000千克,每千克10元,增值税额10200元。企业以银行存款支付上述甲乙两种材料的货款及运杂费5000元,运杂费按材料重量比例进行分摊。(3)向希望小学捐款30000元,已从银行存款账户支付。(4)企业本年销售收入1000000元,企业增值税额为170000元,款项已收并存入银行。根据以下要求选择正确答案。根据上述经济事项(2),外购材料的运杂费分摊率为__。A.0.50元/千克 B.0.083元/千克 C.166.67元/千克 D.1.00元/千克

6.长江公司期末“委托代销商品”科目的余额为10万元,“工程物资”科目的余额为 100万元,“分期收款发出商品”科目的余额为40万元,“原材料”科目的余额为60万元,“材料成本差异”科目的贷方余额为5万元。假定不考虑其他因素,该公司资产负债表中“存货”项目的金额为__万元。A.105 B.115 C.205 D.215

7.某企业上年末资产负债表部分项目的余额如下:货币资金230000元,应收账款42450元,存货132000元,固定资产原价510000元,累计折旧183000元。该企业本发生下列经济业务:

(1)购入A材料一批,买价为20000元,增值税额为3400元;购入B材料一批,买价为10000元,增值税额为1700元;购入A、B两种材料共发生运杂费900元,按材料的买价比例分配;材料的货款和运杂费共计36000元均以银行存款支付,材料已验收入库。(2)对企业行政管理部门使用的固定资产计提折旧600元。

(3)销售产品一批,售价为30000元,增值税税率为17%,货款尚未收到;该批产品的生产成本为22000元,销售产品应交纳的城市维护建设税及教育费附加为500元。根据上述资料,计算该企业本年的应收账款周转率为__。A.30000/[(42450+77550)/2]=0.5次 B.30000/42450=0.707次

C.30000/(42450+77550)=0.25次 D.30000/77550=0.387次

8.下列项目中__属于工业企业其他业务收入。A.罚款收入

B.原材料销售收入 C.出售机器设备收入 D.出售自研专利收入

9.下列关于金融环境的内容的说法不正确的是__。A.金融工具是货币资金或金融资产借以转让的工具

B.金融市场按期限分为短期资金市场和长期资金市场,即货币市场和资本市场 C.金融市场的组织方式是指金融市场的交易采用的方式 D.资本市场所交易的金融工具具有较强的货币性

10.“消费者人均月收入”(x2,单位:元)及“商品需求量”(y,单位:件),建立多元线性回归方程如下:y=4990.519-35.66597x1+6.19273x2,请根据上述结果,从下列备选答案中选出正确答案。对该回归方程进行显著性检验,计算检验的统计量F=72.53930,对应的概率值P=0.000021 ,下列说法不正确的是______。A.原假设为H0:β1=β2 B.备择假设为H0:β1,β2至少有一个不等于0 C.临界值F 的自由度为(k,n-k)D.由F检验的原则可知,在显著性概率为0.05的条件下,回归方程的线性关系存在,拒绝原假设

11.一国货币汇率下跌,即货币贬值,则会导致__。A.进口贸易缩减

B.以本币标示的进口商品价格就会下跌

C.本国居民对进口商品的需求增大 D.扩大进口贸易

12.已知某资产负债简表的部分内容,如表6-1所示。表6-1 单位:亿元根据上述资料请回答:国外部门的金融负债为()亿元。A.-100 B.100 C.1300 D.1400

13.企业若要维持正常的偿债能力,__。A.已获利息倍数应小于1 B.流动比率大于2 C.已获利息倍数应大于1 D.速动比率大于1

14.某企业2011年1月1日购入B公司10%的有表决权股份,作为长期股权投资核算,实际支付价款300万元。2011年4月30日B公司宣告派发2009年现金股利100万元,当年B公司经营获利100万元,2011年年末企业的股票投资账面余额为__万元。A.290 B.300 C.310 D.320

15.以下是2005年全国资金流量表实物交易部分,请根据该表数据回答以下有关问题。表3-1 2005年企业部门净金融投资为()亿元。A.1196 B.-16937 C.-15741 D.-18133

16.部门、单位领导人在统计数据上弄虚作假的,主要采取______。A.通报批评 B.行政处分

C.追究刑事责任 D.责令改正自以罚款

17.某单位收到一份本县统计局制发的没有批准文号的统计报表。请回答:该县统计局的统计违法行为有______。

A.未经批准擅自组织实施统计调查 B.未经批准擅自改变统计调查制度

C.未按统计调查制度的规定报送有关统计资料 D.要求统计调查对象提供不真实的统计资料

18.某企业为增值税小规模纳税人,本月购入甲材料2 060公斤,每公斤单价(含增值税)50元,另外支付运杂费3 500元,运输途中发生合理损耗60公斤,入库前发生挑选整理费用620元。该批材料入库的实际单位成本为每公斤__元。A.50 B.51.81 C.52 D.53.56

19.表3-3是某年全国资金流量表部分资料:(单位:亿元)表3-3 设全国初次分配总收入为X亿元、住户部门可支配总收入为Y亿元,则该部门储蓄率的算式为()。A.A B.B C.C D.D

20.某企业2005年的税后利润为67万元,所得税税率为33%,利息支出为50万元,则该企业2005年的已获利息倍数为__。A.1.34 B.1.9 C.2 D.3

21.依据《行政处罚法》的规定,统计部门对给于某种处罚的案件应当依照当事人的申请组织听证。该种处罚是指______。A.警告 B.罚款

C.较大数额罚款 D.通报批评

22.统计台账;二是建立健全统计资料的______等管理制度。A.审核、交换 B.审查、档案

C.签署、交接、归档

D.审核、签署、交接、归档

23.表3-2是已公布的2006年我国国际收支平衡表简表,请根据此表在下列备选答案中选出正确答案。(2006年1美元对人民币的中间价为7.9718)已知我国2006年国内生产总值为210871.0亿元,则根据上表计算的2006年国民生产总值(或国民总收入)为()。A.209933.9 B.214135.8 C.211808.1 D.207606.2

24.某企业上年末资产负债表部分项目的余额如下:

货币资金460000元,应收账款89000元,存货264000元,固定资产原价1020000元,累计折旧366000元。该企业本发生下列经济业务:(1)购入甲材料一批,买价为40000元,增值税额为6800元;购入乙材料一批,买价为20000元,增值税额为3400元;购入甲、乙两种材料共发生运杂费1800元,按材料的买价比例分配;材料的货款和运杂费共计72000元均以银行存款支付,材料已验收入库。(2)对企业行政管理部门使用的固定资产计提折旧1200元。

(3)销售产品一批,售价为60000元,增值税税率为17%,货款尚未收到;该批产品的生产成本为44000元,销售产品应交纳的城市维护建设税及教育费附加为1000元。根据以下要求选择正确的答案。

根据上述资料,计算该公司本年的存货周转率为__。A.44000/(264000+220000)=0.091次 B.44000/I(264000+281800)/2]=0.161次 C.44000/264000=0.167次 D.44000/220000=0.2次

25.以下是2005年全国资金流量表实物交易部分,请根据该表数据回答以下有关问题。表3-1 2005年企业部门净金融投资为()亿元。A.1196 B.-16937 C.-15741 D.-18133

26.”消费者人均月收入”(x2,单位:元)及“商品需求量”(y,单位:件),建立多元线性回归方程如下:y=4990.519-35.66597x1+6.19273x2,请根据上述结果,从下列备选答案中选出正确答案。根据计算上述回归方程式的多重判定系数为0.9540,其正确的含义是______。A.在Y的变化中,有95.40%是由解释变量x1和x2决定的 B.在Y的总变差中,有95.40%可以由解释变量x2解释 C.在Y的总变差中,有95.40%可以由解释变量x1解释

D.在Y的总变差中,有95.40%可以由解释变量x1和x2解释

27.超支的广告费应计入__。A.营业外支出 B.销售费用 C.财务费用 D.管理费用

28.经济结构等进行计算和分析,在下列备选答案中选出正确答案。表3-5 衡量2004年国民经济增长率的代表性指标及数值是()。A.国民总收入增长9.9% B.国内生产总值增长9.5% C.支出法国内生产总值增长8.6% D.人均国内生产总值增长5.8%

29.某企业“应收账款”有三个明细分类账,其中“应收账款——甲企业”明细分类账月末借方余额为100000元,“应收账款——乙企业”明细分类账月末借方余额为400000元。“应收账款——丙企业”明细分类账月末贷方余额为100000元;“预收账款”有两个明细分类账,其中“预收账款——丁公司”明细分类账月末借方余额55000元,“预收账款——戊公司”明细分类账月末贷方余额为20000元;坏账准备月末贷方余额为3000元(均与应收账款相关),则该企业月末资产负债表的“应收账款”项目应为()元。A.697000 B.717000 C.552000 D.745000

30.某工业企业甲产品在生产过程中发现不可修复废品一批,该批废品的成本构成为:直接材料3200元,直接人工4000元,制造费用2000元。废品残料计价500元已回收入库,应收过失人赔偿款1000元。假定不考虑其他因素,该批废品的净损失为__元。A.7700 B.8700 C.9200 D.10700

31.已知某资产负债简表的部分内容,如表6-1所示。表6-1 单位:亿元根据上述资料请回答:该国的国民财产为()亿元。A.8630 B.8730 C.19230 D.19330

32.在统计执法中,被处罚单位在接到处罚通知后,如果既不在法定期限内申请复议或向人民法院提起诉讼,又拒不执行的,由查处机关依法______。A.强制执行 B.起诉

C.申请人民法院强制执行 D.与相关人协商解决

33.编制多步式利润表的第一步,应__。A.以营业收入为基础,计算营业利润 B.以营业收入为基础,计算利润总额 C.以营业利润为基础,计算利润总额 D.以利润总额为基础,计算净利润

34.技术性的统计工作,只能由______来承担。A.国家统计机构 B.部门统计机构

C.企业事业组织统计机构 D.民间调查机构

35.下列可作为统计违法违纪行为处分适用对象的是______。A.国家工作人员 B.所有统计违法者

C.企事业单位的管理人员

D.统计调查对象中承担经常性政府统计调查任务的人员

36.单位负责人是指依照法律或者法人组织章程规定,代表法人行使职权的负责人,又称______。A.单位主管 B.单位代表 C.法定代表人 D.法定负责人

37.某企业上年末资产负债表部分项目的余额如下:货币资金230000元,应收账款42450元,存货132000元,固定资产原价510000元,累计折旧183000元。该企业本发生下列经济业务:

(1)购入A材料一批,买价为20000元,增值税额为3400元;购入B材料一批,买价为10000元,增值税额为1700元;购入A、B两种材料共发生运杂费900元,按材料的买价比例分配;材料的货款和运杂费共计36000元均以银行存款支付,材料已验收入库。(2)对企业行政管理部门使用的固定资产计提折旧600元。

(3)销售产品一批,售价为30000元,增值税税率为17%,货款尚未收到;该批产品的生产成本为22000元,销售产品应交纳的城市维护建设税及教育费附加为500元。根据上述业务(1),计算A材料的实际采购成本为__。A.20300元 B.20600元 C.23400元 D.24000元

38.下列关于现金流量表的说法,正确的是__。

A.经营活动的现金流量最重要,是企业获得持续资金来源的主要途径 B.经营活动产生的现金流量应当采用直接法列示

C.筹资活动产生的现金流量净额,反映企业盈余背后是否有充足的现金流入 D.通常,企业经营活动产生的现金流量越多,说明企业销售畅通,资金周转快

39.登账后发现,会计人员在分配工资费用时,将车间管理人员的工资计入“管理费用”科目,此时应采用的更正方法是__。A.划线更正法 B.红字更正法 C.补充登记法

D.编制相反分录冲减

40.企业采用支付手续费方式委托代销商品,委托方确认商品销售收入的时间是__。A.签订代销协议时 B.发出商品时 C.收到代销清单时 D.收到代销款时

41.国民经济核算体系是由社会再生产核算表和______两大部分组成。A.国民经济账户 B.产业部门账户 C.国际收支体系

D.经济循环账户体系

42.年末应收账款余额分别为200万元和400万元;年初、年末存货余额分别为200万元和600万元;年末速动比率为1.2,年末现金与流动负债的比率为0.7。假定该企业流动资产由速动资产和存货组成,速动资产由应收账款和现金类资产组成,一年按360天计算。该企业2009的存货周转率为__次。A.3.6 B.4 C.4.8 D.5

43.下列完工产品和在产品的分配方法中,适用于产品数量较多,各月在产品数量变化也较大,且生产成本中直接材料成本和直接人工成本等加工成本的比重相差不大的产品的是__。A.约当产量比例法

B.在产品按固定成本计算法

C.在产品按所耗直接材料成本计价法 D.在产品按定额成本计价法

44.政府统计的整体功能是______。

A.提供统计信息和咨询意见,实行统计监督 B.搜集统计资料,实行统计监督 C.搜集统计信息,提供咨询意见 D.提供咨询意见,实行统计监督

45.下列各项中,可以计入递延收益项目的是__。A.罚款取得的款项

B.取得与资产相关的政府补助 C.接受捐赠资产 D.捐赠支出

46.统计法规定,县级以上人民政府______。A.可以设立统计机构

B.可以根据实际情况设立统计机构 C.应当设立统计机构

D.应当设立独立的统计机构

47.按照《统计法》和国务院办公厅转发国家统计局的《统计资料秘密管理办法》的规定,对外公布统计资料必须经过严格审批,并实行______的原则。A.统一领导 B.分级负责审批 C.分级负责 D.集中统一 E.集中统一领导

48.某企业系增值税一般纳税企业,本期购入原材料20000千克,发票中注明的价格为每千克5元,售价总额为100000元,增值税额为17000元。在购买过程中发生运输费用1000元,保险费用490元。原材料运抵企业,验收入库的原材料为19900千克。企业购进该原材料的单位成本为__元。A.5 B.5.1 C.5.85 D.5.92

49.根据哈罗德经济增长模型,若资本-产出比为5,储蓄率为30%,要使储蓄全部转化为投资,增长率应为()。A.5% B.6% C.15% D.25%

50.持有统计从业资格证书的人员是______。A.法定代表人 B.统计负责人 C.会计人员

谈测绘工程空间数据的不确定性 篇6

1 不确定性的一般概念

计量部门推荐的测量不确定度, 仍然是对随机误差的一种度量。A类标准不确定度相当于我们测量乎差中算术平均值的中误差;B类标准不确定度相当于我们所熟知的仪器的标称精度;合成标准不确定度相当于测量平差中的协方差传播律;而扩展不确定度相当于测量平差中的极限误差。所不同的是我们测量平差中算术平均值的中误差、仪器的标称精度和极限误差前面都有正负号“+-”, 而A类标准不确定度、B类标准不确定度和扩展不确定度表示的是不确定区间, 永远为正。可见尽管计量部门推荐的测量不确定度也是英文“uncenainty”, 但与海森贝格提出的、现实世界中的不确定性“uncenainty”在概念上有本质的区别。

海森贝格提出的不确定性“uncenainty”作为科学术语, 不仅出现在大地测量学、制图学、摄影测量学、计算机科学、数据库及其管理、空间科学、遥感科学技术、地理信息系统中, 而且早已在统计与概率科学、物理学、数学、生物、医学、天文学及地球科学中广泛引用。但把它作为科学的哲学思想还是最近的事。

不确定性作为科学的哲学思想, 其概念已经远远超出自然科学的领域, 在社会科学中也是屡见不鲜的。比如人类的认识系统中就存在不确定性。人的认识活动体现为把原有认识模式延伸并用于将要认识的客体。由于主体认识结构的不同, 对客体的认识与理解也会出现差异, 在相当大的程度上, 认识结果因人而异, 使认识出现不确定性。认识中的这种不确定性, 突出地表现在由经验认识向理论认识的升华过程中。认识的主体系统的不确定性主要是由认识主体的个体差异造成的。作为客体的外在表现的现象层次, 有自然现象、社会现象与精神现象。通常现象与客体的本来面目是有偏差的, 而且常常出现假象, 课题的现象与其本质间的复杂关系, 给人的认识活动带来了困难, 也制造了认识中的不确定性。

不确定性与“复杂性科学” (complexity science) 密切相关, 不确定性和系统科学一样是属于科学的哲学, 是属于方法论。复杂性科学是“诞生于有序与混沌边缘”.的科学。混沌就是无序, 因此复杂性科学是研究“诞生于有序与无序边缘”的科学。所谓“无序边缘”就是指介于有序与无序之间的、或有序与无序并存的现象。由于不确定性与复杂性科学是密切相关的, 所以它应具有复杂性科学的一般特征或共同特征。因此, 不确定性是指专门从事关于“有序与无序并存, 清楚与模糊并存, 线性与非线性并存, 正确与错误并存, 正常与异常并存”现象的学科, 是专门研究“矛盾的统一体”或“对立的统一体”现象的学科。

不确定性存在于自然科学技术的各个领域, 如微电子分子物理学、基因工程及医学中, 同时还存在于社会经济和人文科学的各个领域。总之, 客观世界和我们的生活里充满了不确定性。因此, Helen Coucleies提出了“和不确定性共处” (1iving with uncertainty) , Toddweer.Russell Congahon提出“未来的世界是不确定性分析的世纪” (the coming-age of Uncertain analysis) 是并不过分的。

2 空间数据的不确定性

关于空间数据不确定性的定义问题, 至今尚无统一的认识, 虽然对它有一些论述, 但都是初步的。Heuvelink把不确定性作为误差的同义词。Michael Goodchild把它看做比误差更为一般的空间数据质量问题, 即空间数据不确定性的含义要比误差更为广泛。Gottsegen则认为, 不确定性概念比误差或精度以及限制性概念要广。不确定性可以看做知识多少有点不完备的数据:这些数据是不可信的和不知道的。Peter Fisher将空间数据不确定性的研究分为四个方面:误差 (error) 、模糊 (vagueness) 、歧义 (ambiguity) 和不一致 (discord) 。

2.1 误差 (error)

如果物体可进行量测, 那么量测结果就一定含有误差。关于误差已有大量的研究, 其研究结果集中在位置准确性和专题准确性方面, 但最重要的还是对误差模型和误差结果的研究。

2.2 模糊 (vagueness)

某一个研究对象分类的中心或核心概念可以清楚地用分类术语进行定义和描述, 但该中心类与另一个中心类之间的边界条件却是不确定的, 这时就产生了模糊。这就是说一些接近类边界的研究实体很难划分为一个特定的类。

2.3 歧义 (ambiguity)

歧义是指当有一个已经定义好了的类概念, 但该类分类过程中具有几个同等有效但却相互矛盾的结果。

2.4 不一致 (discord)

不一致是当一个研究者使用一种分类方案, 但另一个研究者使用另一个毫不重叠的分类方案时产生的。

结束语

由以上的各种论述知, 在空间数据处理中, 至今对“不确定性”这个术语还没有明确的定义, 但大多数人认为不确定性与空间数据质量有关。

参考文献

[1]王立波.实用测量不确定度评定及案例[M].北京:中国计量出版社, 2007.

[2]倪育才.测绘工程空间数据不确定度评定[M].北京:中国计量出版社, 2006.

[3]刘智敏.不确定度及其实践[M].北京:中国标准出版社, 2000.

定性数据 篇7

传感器网络、数据集成、隐私保护等各种现实应用中会产生大量不确定性数据,不确定性数据广泛存在于军事、金融和电信等领域中。不确定性数据的排名要综合考虑分值大小和概率值大小,其Top-k查询在语义上具有歧义,不同的分值和概率值的结合方式会产生不同的查询结果,所以关系型数据库中传统的针对确定性数据的Top-k查询不能直接应用在不确定性数据上。

近年来,研究者们提出了多种针对不确定性数据的Top-k查询算法[1,2,3,4,5]以及查询优化[6],每种算法都定义了不同的查询语义,但是这些算法在计算排名第i位时,并没有考虑排在第i-1位的元组,这就导致了查询出来的结果不能很好地综合分值和概率值。

本文针对关系型数据库中的不确定性数据,在数据存储时加上一个概率维即概率字段表示该元组存在的概率值大小,当计算一个元组排在第i位时,会和排在第i-1的元组进行比较,选择两者中更好的作为第i位的查询结果,这样就更好地权衡了概率值和分值。

1 不确定性数据模型

1.1 数据不确定性

数据不确定性分为存在级不确定性和属性级不确定性[7]。存在级不确定性是指元组有一个概率值,表示该元组存在的可能性大小;属性级不确定性是指元组的属性具有一个概率值,以概率密度函数或者统计参数来描述特定属性的不确定性。

关系型数据库中存储存在级不确定性数据时,给每个元组加上一个概率维,表示该元组的可信度大小,在进行Top-k查询时,该概率维和数据的分值共同影响查询结果。

1.2 可能世界模型

研究者们针对不确定性数据提出了不同的数据模型,但是可能世界模型是最广泛的应用模型之一[8],也是所有不确定性数据模型的核心思想,即把不确定性关系转化为一系列的世界实例,每个世界实例根据其组成成员计算出相应的概率,所有世界实例的概率和为1。

下面通过例子来具体说明可能世界模型。假设在L1、L2、L3、L4、L5这5个不同的位置上分别安装了雷达来测试经过的车辆速度并记录下来形成表1。由于天气等原因导致记录的数据具有一定的偏差,故在表的最后一列增加Prob属性来表示元组存在的概率大小。由于这5个位置的距离相差足够远,不可能在30分钟内不同的雷达能够测试到同一辆车经过,所以,t1是独立的,t2和t3是互斥的,t4和t5也是互斥的,记为t2⊕t3,t4⊕t5,互斥和独立是关系Car的生成规则。

根据关系Car的生成规则,可以生成一系列的可能世界空间,由于t2⊕t3,t4⊕t5,故在同一个世界空间中有且只能出现一个,而t1是独立的,它可以出现或不出现在任意一个可能世界空间中,通过排列组合,可以得到如表2所示的所有可能世界空间,Prob表示其概率,例如:PW5发生的概率为(1-0.4)×0.7×0.6=0.252,所有的可能世界空间发生的概率之和为1。

2 P-kRanks查询处理

P-kRanks(Probability k Ranks Query)是针对关系型数据库中的不确定性数据的Top-k查询算法,它返回满足条件的前k个元组,该算法只考虑元组的存在级不确定性,数据模型采用可能世界模型。

2.1 P-kRanks查询语义

定义 设D为一个具有不确定性数据的关系型数据库,PW={PW1,PW2,…,PWn}是D的可能世界空间,PW中的元组按照分值排序函数F对其排序,xij表示在PWj中排在第i位的元组,则元组x排在第i位的概率P(xi)=∑wPW(xij)P(w),即在所有可能世界中排在第i位的概率之和,argmax'P(xi-1)表示元组x排在第i-1位概率第二大的元组,P-kRanks查询算法返回前K个元组{xi;i=1…k},其中,当argmax'P(xi-1)的分值大于argmaxP(xi),时,xi=max(argmaxP(xi),argmax'P(xi-1)),否则xi=argmaxP(xi)。

文献[3]中已经证明了按照分值排序大小进行读取对Top-k查询是充分并且必要的。

2.2 P-kRanks查询结果分析

对于表1的关系Car,从P-kRanks的语义上可以看出,当计算一个元组排在第i位时,会和排在i-1位的元组进行比较,选择其中更好的作为第i位的查询结果,这样从语义上就更好地权衡了概率值和分值,分值大的不一定就排在前面。也可以在P-kRanks中加入用户想要的概率阈值,比如,想要返回结果的概率值Prob大于0.41,那么P-2Ranks只返回一个结果t1。

例:对于表1的关系Car,P-2Ranks返回{t2,t1},t2在PW5和PW6中排在第一位,其概率为P(PW5)+P(PW6)=0.42,返回t2;t1在PW1、PW2、PW3和PW4排在第一位的概率为0.4,其概率值仅仅次于t2,t5在PW3和PW5排在第二位的概率值为0.324,t5的速度也小于t1,故返回t1。

2.3 P-kRanks算法实现

下面的算法描述了当k>1时,共有两层循环,第一层循环min(k,source.length)次,第二层循环source.length次,每次循环找出一个最有可能成为Top-k的元组。3、4步表示如果某个元组已经是返回结果中的值,那么结束本次循环;7-9步控制扫描的深度,如果当前元组排在第n位的概率值小于前一个元组排在第n位的概率值,就不再继续往下扫描元组,结束本次循环;11-15步计算出排在第i位概率最大的元组,Q[i][]存放了排在第i位概率从大到小的元组;18步比较当前找出的最可能排在第i位的元组answer[i],如果该元组的概率值和分值均小于Q[i-1][1],则返回Q[i-1][1],使其排在第i位,代替answer[i]。当k=1时,不需要保存上一个步骤的结果,也不需要和上一个步骤的结果进行比较,只需要找出在所有可能世界模型中排在第1位概率最大的元组即可,则不执行第10和15-18步,其他步骤一样。

P-kRanks算法

输入:元组根据分值降序排列source[],k,用户自定义的概率阈值prob

变量:answer[]:长度为k的向量,存放查询结果,初始化为空;Q[][]:二维数组,存放中间结果,初始化为空;Pt,n:元组t排在第n位的概率;N:返回的结果个数,初始化为0。

1. while(i<min(k,source.length)) do

2. for n=1 to source.length do

3. if answer[]中有source[n] then

4. continue

5. t=source[n]

6. 计算Pt,n

7. if Pt,n小于Pt-1,n

8. continue

9. end if

10. if Pt,,n大于prob then

11. if Pt,i大于answer[i].prob then

12. answer[i].prob=Pt,i

13. 根据概率值从大到小依次将t放入Q[i][]中

14. answer[i]=t

15. end if

16. end if

17. end for

18. if answer[i].prob<Q[i-1][1].prob AND

answer[i].sorce<Q[i-1][1].sorce then

19. answer[i]=Q[i-1][1]

20. end if

21. i++

end while

复杂度分析:假设有m个元组,返回k个元组,算法一共有两层循环,在实际应用中k值远远小于m值,k相对于m来说可以看作为一个常数,故时间复杂度为kO(m)。算法需要对元组的概率值就行排序存入到Q[i][]这个二维数组中,这个依据选择的排序算法所需的空间复杂度。从算法的复杂度分析可以看出,该算法是可行的。

3 实验结果与分析

实验环境是Visual Studio 2010,运行在Pentium Dual-Core CPU 2.3GHZ、2GB内存、Window XP操作系统的PC之上。算法由扫描深度和查询时间这两个标准来评价其性能。

实验使用应用最为广泛的R-statistical(www.r-project.org)来产生不同的数据集,每个数据集包含80 000个元组,数据集中的元组分值都服从均匀分布,根据概率值的不同分布分为三类:(1) uu:概率值服从均匀分布;(2) un:概率值服从正太分布,均值分别取0.5和0.9,标准差均取0.2;(3) uexp:概率值服从指数分布,均值分别取0.2和0.5。

图1显示了算法的扫描深度随k变化的情况,可以看出,扫描深度随着k的增大而增大,当数据集中的元组概率越大,则扫描深度越小,数据集un(0.9)上的扫描深度最小,数据集uexp(0.2)的扫描深度最大。图2反映了算法的查询时间随k的变化情况,从中可以看出,查询时间也是随k的增大而增大,概率越大查询时间越长,当k小于100时,运行时间在10s以下。

综上所述,P-kRanks算法的扫描深度和运行时间随k增大而增大,元组的概率密度越大,则扫描深度越小,实验的运行结果显示,P-kRanks算法是有效的。

4 结 语

关系型数据库中不确定性数据的出现,使得传统的Top-k查询不能直接应用在不确定性数据上,必须定义出适合不确定性数据的Top-k查询语义。用户不仅仅关心查询前k个元祖的分值大小,也关心查询结果存在的概率大小,然而现有的针对不确定性数据的Top-k查询没有很好地权衡元组的分值和概率值,故提出了一种新的查询算法P-kRanks。在新语义下,计算排在第i位的元组时会考虑i-1位的元组概率值和分值,从中选取概率值和分值大的元组作为返回结果,这样就更好的满足了用户的查询需求。实验的结果表明了算法的有效性,但是该算法在如何利用剪枝等启发式技术来减少计算量有待提高,这也是以后努力的方向。

摘要:Top-k查询在传统的存储确定性数据的关系型数据库中得到了广泛的应用,但是对于存储不确定性数据的数据库,Top-k查询必须结合元组的分值和不确定性来处理。已有的Top-k查询没有很好地结合元组的分值和不确定性,因此,定义一种新的针对不确定性数据的Top-k查询语义,并且实现了查询算法,在新语义下,计算第i位排名时考虑了第i-1位元组,能够更好地权衡分值和不确定性。不同数据集上的实验显示,该算法是有效的。

关键词:不确定性,关系型数据库,Top-k

参考文献

[1]Cormode G,Li F,Yi K.Semantics of ranking queries for probabilisticdata and expected ranks[C]//ICED,2009.

[2]Mohamed A Soliman,Ihab F ILYyAS,Kevin Chen-Chuan Chang.Top-kQuery Processing in Uncertain Databases[C]//Proceeding of the 23rdIEEE International Conference on Data Engineering.Istanbul,2007:896-905.

[3]Ming Hua,Jian Pei,Wenjie Zhang,et al.Efficiently Answering Probabi-listic Threshold Top-k Queries on Uncertain Data[C]//Proceeding ofthe 24th IEEE International Conference on Data Engineering.2008:1403-1405.

[4]Cheqing Jin,Ke Yi,Lei Chen,et al.Sliding-Window Top-k Queries onUncertain Streams[J].Proceedings of the VLDB Endowment,2008,1(1):301-312.

[5]Ge T,Zdonik S,Madden S.Top-k queries on uncertain data:on scoredistribution and typical answers[C]//Proceeding of the 35th SIGMODinternational conference on Management of data.Providence,Rhode Is-land,USA,2009.

[6]刘德喜,万常选,刘喜平,等.不确定数据库中基于x-tuple的高效Top-k查询处理算法[J].计算机研究与发展,2010,47(8):1415-1423.

[7]周傲英,金澈清,王国仁,等.不确定性数据管理技术研究综述[J].计算机学报,2009,32(1):1-16.

[8]Green T J,Tannen V.Models for incomplete and probabilistic informa-tion[J].IEEE Data Engineering Bulletin,2006,29(1):17-24.

定性数据 篇8

关键词:捷联惯组,测试数据,二次修正插值法,时间序列,惯组误差系数

捷联惯组具有稳定期指标,但目前很难保证每个稳定期都对捷联惯组进行测试,因此稳定性数据较乱。同时,由于测试次数较少,更增加了描述其时间特性的难度。在这种情况下,通过一次插值来构建其误差系数的时间序列,误差必然会很大,而且插值点也将很不均匀。从文献[1]的正态性检验结果可以看出,捷联惯组标定结果的正态性并不好,带有很大的随机性。为此,本文提出了二次修正插值法,通过两次使用样条函数插值法来构建捷联惯组测试数据的时间序列,为捷联惯组测试结果的时间序列建模分析创造条件。

所谓时间序列,也叫时间数列或动态数列,它是将某种统计指标的数值按时间先后顺序排列起来所形成的数据序列。时间序列预测就是通过分析时间序列,并根据其反映出来的发展过程、发展方向以及发展趋势,进行类推或延伸,从而预测下一段时间或以后若干年内可能达到的水平[2]。

1 二次修正插值法

捷联惯组的测试应该严格按照稳定期要求进行测试,但由于惯组数量较多,测试时间也较长,这个要求一般不能得到满足,因而不能保证测试结果的等间隔性。同时,由于惯组测试次数较少,样本容量也无法满足模拟训练所需要的样本量要求。因此,需要利用二次修正插值法[3]来实现测试数据的等间隔化和样本容量的扩充。

1.1 第一次修正插值

第一次插值的目的是实现测试数据的等间隔化,即以原始测试数据为基础,以稳定期为间隔,采用三次样条函数插值法,对惯组稳定性测试数据进行第一次插值。在插值的过程中,以历次测试结果作为插值的基本点,对于在稳定期内有多次测试的,一般取其测试结果的平均值作为插值的基本点;然后,以稳定期为基本时间单位选择插值点进行插值。在对插值点进行准确性检验时,要以基本点为依据,以稳定期内的指标为标准,进行检验和修正,从而获得以稳定期为基本时间单位的时间序列,称为基本时间序列。

1.2 第二次修正插值

通过第一次插值后,获得了捷联惯组历次测试数据的基本时间序列,但是其样本容量还是相对较小。要用一个容量很小的样本进行建模,很难准确预测捷联惯组误差系数的变化趋势,因此,需要进行第二次修正插值。

第二次插值的目的是为了扩大样本容量,解决小样本建模容量不足的问题,即以第一次插值所得等间隔序列的元素作为基本点,并在任意两个相邻的基本点之间进行等点数插值,其插值的方法依然是采用三次样条函数插值法。同时,插值点的个数可根据建模所需样本容量来选取,一般最小间隔取为月的整数倍。在插值结束后同样需要对插值点进行准确性检验,其方法与第一次的一样,以保证所有的插值结果都必须满足稳定性要求。

2 时间序列的平稳性检验

时间序列的平稳性是建模的重要前提,是用于检验构建的时间序列是否具有不随时间的推移而变化的统计特性。在实际工作中最常用逆序检验法[4],其基本原理是:

设样本序列x1,x2,…,xN足够长,并把样本序列分成k个相等的子序列,即N=kM。其中,M是一个较大的正整数;k也为正整数。

逆序检验法就是检验各子序列均值的差异性,把各子序列均值(或方差)μi(i=1,2,…,k)构成一个序列μ1,μ2,…,μk。当出现μj(j=i+1,i+2,…,k)>μi时则称之为μi的一个逆序,与μi相对应的逆序个数Ai称为μi的逆序数。那么序列x1,x2,…xN的逆序数的总和可以表达为:

A=i=1kAi(1)

由于{xk}是随机过程的一个样本,所以均值μi也应该是随机的。当{xk}是平稳序列时,μ1后面的l-1个随机数μi大于和小于μ1的概率是相等的,故μ1的逆序数A1的理论平均值E(A1)=(l-1)/2;同理,E(A2)=(l-2)/2,…,E(Ak)=(l-k)/2(k=1,2,…,l-1),从而逆序总数的理论平均值:

E(A)=i=1l-1E(Ai)=l(l-1)4(2)

逆序总数的理论方差为:

Var(A)=l(2l2+3l-5)72(3)

构造统计量:

U=A+0.5-E(A)Var(A)(4)

该统计量渐进服从N(0,1)分布,在显著性水平α=0.05的情况下,若满足|U|<1.96,则可以认为该序列为平稳序列,否则认为该序列是非平稳的。

由此得到x1,x2,…,xN平稳性检验的步骤如下:

(1)将x1,x2,…,xN分成k段,每段N/k个数据,并相应计算各段均值(或方差),得到序列μ1,μ2,…,μk;

(2)计算AU;

(3)由给定置信水平,查标准正态分布得za/2;

(4)若|U|<za/2,则以置信度1-α认为该残差数据序列具有平稳性,否则认为是不平稳的。

3 时间序列建模

由文献[5]可知,时间是影响捷联惯组稳定性的主要因素,随着时间的推移部分捷联惯组参数的稳定性会发生比较明显的变化,因此研究捷联惯组参数的时间特性是非常必要的。

3.1 ARMA时间序列建模

平稳序列ARMA(n,m)模型是指自回归移动平均模型,其表达式为:

Φ(B)xk=θ(B)ak(5)

式(5)中:Φ(B)=1-i=1nΦiBi,θ(B)=1-j=1mθjBj,n是AR(自回归)模型部分的阶次,m是MA(移动平均)模型部分的阶次,Φi是自回归模型参数,θj是滑动平均模型参数,B是后移算子,Bxk=xk-1,ak是残差,满足ak~(0,σ2,a)。

在许多实际问题中,所考虑的时间序列{xk}往往不是平稳的,不能用ARMA模型来表示。但是如果将{xk}进行有限次差分后,得到的时间序列{xk}将是平稳的,{xk}可以用ARMA模型来描述。

ARIMA(n,d,m)模型是指基于平稳化的自回归移动平均模型,它经过d阶差分,消除趋势项,使非平稳序列平稳化,其模型为:

Φ(B)(1-B)dxk=θ(B)ak(6)

因此,建立ARIMA(n,d,m)是建立在ARMA(n,m)模型基础之上的。在建模前要进行数据平稳化检验,如果随机序列是平稳的,取d=0。ARIMA(n,d,m)模型简化为ARMA(n,m)模型。

3.2 ARMA时间序列参数估计

ARMA(n,m)模型可以表示为:

xk=i=1nΦixk-i-j=1mθjak-j+ak(7)

对自回归模型参数Φi和滑动平均模型参数θj可以采用长自回归模型法。其思路是:基于观测序列建立起来的模型AR(n)、MA(m)、ARMA(n,m)都是等价系统的数学模型,具有相同的传递函数。因此,可以先估计出AR模型,然后利用传递函数的等价性,估计出ARMA的参数自回归模型参数Φi和滑动回归模型参数θj

随机序列{xk}可以用模型AR(p)表示,也可以用ARMA(n,m)表示,AR(p)描述的等价系统传递函数为:

1Φp(B)=11-i=1pΙiBi(8)

式(8)中:B为后移算子,Ii是逆函数,其取值等于AR(p)模型的参数Φi(i=1,2,…,p)。用ARMA(n,m)描述的等价系统传递函数为:

θm(B)Φn(B)=1-j=1mθjBj1-i=1nΦiBi(9)

由于不同形式的传递函数描述的系统是等价的,所以上述两式应该相等。把两式展开,得到等式:

(1-I1B-I2B2-…-IpBp)(1-θ1B-θ2B2-…

-θmBm)=1-Φ1B-Φ2B2-…-ΦnBn

对于B的相同阶次的系数应该相等,由此得到:

{Φ1=θ1+Ι1Φ2=θ2-θ1Ι1+Ι2Φ3=θ3-θ2Ι1-θ1Ι2+Ι3Φn=-θmΙn-m-θm-1Ιn-m+1--θ1Ιn-1+ΙnΦk=-θmΙk-m-θm-1Ιk-m+1--θ1Ιk-1+Ιk,(k>n)(10)

用最后一个方程,当kn+1,n+2,…,n+m的时候,可以用以下矩阵求出θj(j=1,2,…,m):

[Ιn+1Ιn+2Ιn+m]=[ΙnΙn-1Ιn-2Ιn-m+1Ιn+1ΙnΙn-1Ιn-m+2Ιn+m-1Ιn+m-2Ιn+m-3Ιn][θ1θ2θm](11)

在求出θj(j=1,2,…,m)以后,利用式(5)可以求出Φi(i=1,2,…,n)。关于Φi(i=1,2,…,n)的线性方程为:

[Φ1Φ2Φn]=[θ1θ2θm]+[1000-θ1100-θnθn-1θn-21][Ι1Ι2Ιn](12)

求解上述线性方程,便得到Φi(i=1,2,…,n)的值,长自回归模型法在估计Φiθj的过程中都是解线性方程组。它将ARMA(n,m)模型参数估计的非线性问题转化为线性问题来解决,大大简化了求解。

4 应用举例

现以某捷联惯组的误差系数K1x为例来构建捷联惯组测试数据的时间序列,该捷联惯组在3年内共进行了10次稳定性测试,测试数据如表1中序号1、7、10、13、16、22、28、31、34、37所示。

4.1 时间序列构建

在基本点的基础上用三次样条函数法进行第一次插值,插值结果如表1中序号4、19、25所示,共得到3个插值点,这3个点与基本点一共13个点,就构成了基本时间序列。

在基本时间序列的基础上用同样的方法进行第二次插值,在每相邻的两个基本点之间插入2个插值点,得到一个样本容量为37的二次插值时间序列,如表1所示。

基本点、插值点对应的曲线图如图1所示:

4.2 数据平稳性检验

a) 将上述时间序列分为6组,每组6个数据,得方差序列为:[3.050 761×10-8 4.286 550×10-9 2.574 614×10-9 1.018 866×10-9 6.514 175×10-9 1.124 191×10-9];

b) 根据逆序数的定义,统计可知逆序数总和A=4,进一步计算可得逆序总数的理论平均值及理论方差分别为7.5和7.08,代入到统计量U中得U≈1.13;

c) 由于在给定置信水平α=0.05的条件下|U| ≈1.13<1.96满足平稳性条件,因此,该时间序列是平稳的。

4.3 时间序列建模预测

下面对平稳的时间序列进行建模预测。由于陀螺漂移模型的阶次不易过高,一般不超过2到3阶[6]。同时,由于ARMA模型可近似地认为是一个线性系统,其传递函数一般是有理分式,即随机ARMA模型的自回归阶数必须要大于或等于滑动平均阶数[7],因此,得预测估计误差FPE判定数据如表2所示:

通过对上述数据进行综合评定,将ARMA模型的阶次定为(3,0),并通过计算可求得Φiθi,如表3所示:

因此,K1x的ARMA模型为:

xk=2.499 321xk-1-2.188 490xk-2+0.679 671xk-3。

对前36次的测试数据进行建模并进行预测,得第37次的预测值为4.501 592×102,而实际测试得到的数据为4.501 625×102,计算其相对误差为6.05×10-6<1.20×10-4,满足稳定性要求。

ARMA时间序列建模预测结果如图2所示:

5 结论

文中研究了捷联惯组稳定性建模分析方法,提出了二次修正插值法,为捷联惯组误差系数的时间序列建模提供了途径,特别是对捷联惯组测试数据在小样本条件下如何建模问题进行了深入地探讨和研究。同时,在时间序列平稳性检验合格的基础上进行了ARMA时间序列建模。通过建模预测分析了其误差系数稳定性变化,并进行了检验,具有工程应用价值。

参考文献

[1]肖正林,徐军辉,钱培贤.惯性组合误差射前标定方法研究.弹箭与制导学报,2004;24(4):362—366

[2]张美英,何杰.时间序列预测模型研究简介.江西科学,2009;10,27(5):697—701

[3]徐军辉,肖正林,钱培贤.捷联惯组历次测试数据时间序列建模与预报.弹箭与制导学报,2005;25(2):620—623

[4]周刚.平稳性检验方法研究.北京:国防大学,2004

[5]徐军辉.捷联惯性测量数据分析方法研究.西安:第二炮兵工程学院,2003

[6]李平.提高星敏感器测角精度的研究.哈尔滨:哈尔滨工程大学,2006

定性数据 篇9

2012年,上海学生参加了由经济合作与发展组织(OECD)组织实施的国际学生评估项目PISA(Programme for International Student Assessment)测试,取得了举世瞩目的好成绩.PISA 2012的主测试领域是数学,这是自PISA开测以来第2次将数学作为主测试领域(第1次是2003年),其目标是评估学生的数学素养(Mathematics Literacy).本次测试在内容维度依旧包含“变换与关系”、“空间与图形”、“数量”、“不确定性和数据”4个主题.本文基于PISA 2012测试中的“不确定性和数据”的样题及我国中考一试题展开分析,以求透过PISA 2012测试来反思我们的数学中考.

2 PISA 2012测试中“不确定性和数据”内容的分析

2.1 PISA 2012测试中数学素养的基本含义

PISA 2012测试以数学为主测,目的是评估学生运用数学知识和技能解决实际问题的能力,关注高层次的数学思维技能,其实质是对学生数学素养的检测.PISA 2012测试中数学素养的含义是个体在各种不同的背景下表述、运用和阐释数学的能力,包括数学推理以及运用数学概念、步骤、事实和工具来描述、解释和预测数学现象的能力.它帮助个体认识数学在现实世界中所起的作用,作出有根据的判断和决策,以促使学生成为具有建设性、参与意识和反思能力的公民.[1]

2.2 PISA 2012测试中数学素养的测评框架

PISA 2012测试的主要领域为数学,与第1次(PISA 2003)测评框架相比,PISA2012数学测评框架最大的不同是过程维度中放弃了“能力群”的提法,改为3种数学过程.其测评框架如表1所示.

上述3种数学过程的整合构成了问题解决的数学模型(如图1所示),实际上就是数学建模的过程,也是PISA 2012数学测试框架的基石.

2.3 PISA 2012测试中“不确定性和数据”的测评要求

在科学技术领域乃至日常生活中,不确定性现象随处可见.不确定性因此成为一个对诸多问题情境进行数学分析的重要视角.“不确定性和数据”包括识别序列中变化发生的位置,树立量化意识;认识测量中存在误差和不确定性,了解概率;在不确定性情境中能呈现、解释、评价所得结论;能科学地预测、解释投票结果、天气预报、经济模型、制造加工、考试成绩和调查发现中存在的不确定性现象.解密的PISA 2012试题中涉及“不确定性和数据”这一内容的试题中有一道要求学生检测表格中呈现的数据并解释为什么这些数据不适合用柱状图来表示,关注数据的解释和呈现.计算机辅助测试提供的强大的运算能力和数据处理能力得以让学生处理更大的数集.学生有机会选择合适的操作工具,分析和呈现数据,还可以从数据库中抽样.也可以使用不同的方法检测和描述数据,生成相互关联的数据图示,对包括数字内的随机结果进行一般化处理后,还可以使用类比的方法,探索其它概率现象的情境规律.例如事件发生的确切可能性和样本的性质.[1]

3 PISA 2012测试中的样题分析

本文选择了上海学生在正式测试中“不确定性和数据”部分的一道样题进行分析:

样题(记为T1)为了完成一项有关环境的家庭作业,学生们搜集了一些关于几种常见垃圾分解时间的信息如表2所示.

有一个学生想要以柱状图的形式来展示结果.请说出一个理由表明为什么柱状图不适合用来展示这些数据.

分析本题被置于科学性情境下,涉及一个科学性(分解时间)数据.数学主题是“不确定性和数据”,涉及数据的类别、解释和呈现,要求学生意识到时间跨度的相对长短会影响表征工具的选择.数学过程类别是“解释、应用和评估数学结果”,因为焦点在于评估数学结果(在本题中是指柱状图)在描述现实情境元素的数据方面的有效性.题目涉及对展示出的数据进行推理,以数学的方式思考数据和呈现之间的关系,并评估结果.问题解决者必须意识到,用柱状图来呈现这些数据的难点有以下两点之一:或者是因为一些类型的垃圾的分解时间范围太广(无法简单地在一个标准的柱状图上呈现);或者是因为不同种类的垃圾的时间变量差距太大(因此,如果要在一条时间轴上呈现出最长时间的跨度,那么最短的时间跨度在这条轴上就几乎看不见了).

给出如下回答的学生可以得分:“因为1—3,0.5,100这样的数据很难准确地在柱状图上表现”、“因为最高的量和最低的量之间相差很大,因此,很难准确地同时呈现100年和几天”.

问题的解答过程要求运用以下基本数学能力:阅读文本和理解表格需要“沟通”能力,给出简洁的书面推理需要更高水平的“沟通”能力.对问题“数学化”的要求比较低,只需要识别和提取出一个柱状图的关键数学特征.问题解决者必须理解对数据的一种简单、表格式的“表征”,同时想象一个图形的表示法,而将这两种表示法联系起来则是本题的一个关键考察点.“推理”和“设计策略”的要求相对较低.对“使用符号化的、正式的、专业的语言和运算”能力的考察体现在学生需要调动程序的和事实的知识来在头脑中构建柱状图,或者快速地画一个草图,特别是要想象出柱状图的纵轴,就必须理解刻度的含义.“使用数学工具”这一能力没有涉及.[1]

4 PISA 2012测试与我国中考试题的差异分析

PISA测试和我国的中考在测评理念、题目设置、评价标准等方面存在众多的不同之处.我国的中考主要考察学生知道了什么,而PISA测试则考察学生能否应用所知来做什么,更加侧重考察学生解决实际问题的能力.如我国以《课标》为基础编制的河南中考试卷(2014年)中一道试题就有代表性.[5]

试题(记为T2)下列说法中,正确的是().

(A)“打开电视,正在播放河南新闻节目”是必然事件

(B)某种彩票中奖概率为10%是指买10张一定有1张中奖

(C)神舟飞船发射前需要对零部件进行抽样检查

(D)了解某种节能灯的使用寿命适合抽样调查

答案为D,答对得3分,答错不给分.

此题的出题方式是我国考生所熟悉的,典型的应试题目.考生只要理解“必然事件”、“概率的意义”以及“抽样调查的适用范围”,就能够顺利地解答出此题.

两相比较,PISA测试与我国中考在命题方面有如下几个方面的差异.

4.1 出题风格

T1反映了PISA的出题风格,从表面上看不出来是对哪一具体数学概念或知识的考察,但实际上却要求学生综合运用所学知识来解答问题.T2是典型的中国应试风格,侧重考查学生对数学学科基础知识、基本技能、基本思想方法的掌握程度,属于知识和技能范畴,反映了《课标》对考试的要求.之所以出现这样的不同,主要是因为二者出题的依据不同,T1依据的是PISA 2012数学素养测评框架,T2依据的是《课标》.对比PISA 2012对“不确定性和数据”的测试要求和《课标》对初中数学“统计与概率”内容的要求,不难发现,《课标》更注重的是结果性目标的实现,而PISA测试则更加注重对学生能力的考察.

4.2 内容理念

T1体现了PISA 2012的内容理念,体现在依据测评目标而建构的测评内容框架中,PISA将数学问题按照内容进行分类,按照解决数学任务的流程进行分类,界定所需要数学的基本能力,建构评价成绩和题目难度的量表体系.[6]T2是为了考察学生对“必然事件”、“概率的意义”以及“抽样调查的适用范围”的理解,是为了甄别学生是否掌握基础知识而设计的.

4.3 测评背景

T1测试的问题是现实生活中学生熟悉的、经历的、或将要遇到的问题,具有现实意义.PISA 2012将问题背景分为“个人性的”、“社会性的”、“职业性的”、“科学性的”4类.我国T2试题属于科学性的背景,与学生的现实生活有点距离,具有程式化的背景特点.

4.4 评卷理念

T1属于开放性题目.评卷时由培训合格的编码评分员依据评分标准给出相应编码的方式来评分.编码的评分方式有利于把握学生解题思维的性质和学生对更高层次思维方法的掌握情况.其双位编码首位给出了学生应得的分数,末位则按照学生在解决给定问题的过程中所使用的策略、或是按照阻碍学生得出正确解决方案的错误概念给出特定代码.[7]这样的评价方式可以使教师了解每个学生的思维方式,即便得相同分数的学生他们的思维方式也可能是不一样的,可以让老师明白每个学生做对或做错的原因在哪里,然后有针对性的进行教学.T2属封闭性题目.答案唯一,评价采用一刀切的方式,很难根据学生的答案来了解学生的思维方式.一部分学生确实是真正掌握了所要考查的知识点而做对了该题,而有一部分也可能是蒙对了.这样的评价方式不能够发现学生思维中的合理成分,不利于发挥评价的诊断和调节功能,无法使老师知晓学生数学思维的真实情况,不利于有效教学.

5 PISA 2012测试对我国中考的启示

5.1 试题的情境要与学生生活的真实情境相吻合

情境是联系试题和学生认知之间的桥梁.情境设计作为命题设计的重要环节将直接影响测试的有效性.在我国的中考试题中,情境创设比较单薄,存在着程式化特点,情境没有明确的分类.情境的采用,主要是依据命题专家的经验.PISA 2012将问题背景分为“个人性的”、“社会性的”、“职业性的”、“科学性的”4类,这实际上是在一定程度上框定了试题情境的来源,这就使得试题的情境与学生生活的真实情境更加吻合,可以有效地激发学生的求知欲望,增强学生学好数学的信心.同时也可以让学生经历“数学化”的过程,这对于培养学生的建模思想和问题解决能力是尤为重要的.因此,我们中考试题命制过程中试题情境的选择要借鉴PISA 2012测试题的情境,选择一些与学生生活的真实情境相吻合的情境.

5.2 试题建构中要注重过程性目标的实现

通过对比PISA测试样题和《课标》下的中考试题,不难发现我国的考试更加注重结果性目标,注重对显性知识的考查,而不注重对学习与思考过程的考查,长此以往,学生的创造力被扼杀,很多题目学生只要掌握了一定的做题模式,再加上反复练习,便可在考试中取得高分,这样,学生就沦为了考试的奴隶,为了考试而学习.众所周知,创新是一个民族的灵魂,是一个国家兴旺发达的不竭动力,如果学生只是死记硬背知识,而不注重知识习得与应用的过程,创新是很难的.因此,我们要在数学教育中对过程性目标和结果性目标都要考量,认真研究中考测试框架,能够能力分级,不断导向数学素养的测试.

5.3 命题要发挥考试的诊断和调节功能

考试除了有选拔功能之外,更重要的是诊断和调节功能.PISA的测评方式可以很好地让老师了解学生的思维方式,发现学生存在的问题,进行有针对性的教学.这种测评方式也可以让学生发现自己的不足,为以后的终身学习奠定基础.目前我国实行的一刀切的评价方式容易以偏概全,不能够准确地认识到学生的优势和薄弱环节,不能够让教师因材施教.为了更好地发挥考试的诊断和调节功能,应当借鉴PISA的测试经验,开展集体攻关,研究测试的理念、目标、内容,建立更加科学合理的测试体系,有效地发挥考试的诊断与调节功能.

5.4 命题要实现由经验性命题向科学性命题的转变

我国的中考作为高利害性的考试,对保密工作要求极高,试题的命制更多基于命题专家的经验,主观性较强,这使得测试的有效性和可靠性遭到质疑.在这样一个相对程式化的考试中,学生得高分就一定意味着能力强吗?这个问题值得我们深思.那么究竟该命制一些怎样的试题来考察学生的能力呢?借鉴PISA的测试框架可能有助于命题的科学性,对于保密性要求极高的中考,细化、完善框架的过程需要在保密和小规模测试间取得平衡.[8]虽然我国的毕业考试题目开始尝试从“知识立意”向“问题立意”和“能力立意”的转移,但推行得比较缓慢.[9]这其中主要的原因在于我国考试试题的背景往往是命题专家根据自己的经验建构出来的,而并非像PISA测试试题那样是具有现实意义的.我们的试题虽然也体现了“能力立意”,但是对能力的要求很低,仍属于应试题目的范畴.

参考文献

[1,2,3,4]OECD(2013),PISA 2012 Assessment and Analytical Framework:Mathematics,Reading,Science,Problem Solving and Financial Literacy,OECD Publishing:25,28-38,35,51-52.

[5]天利全国中考命题研究中心,北京天利考试信息网.2014新课标全国中考试题精选(数学)[M].拉萨:西藏人民出版社,2014.

[6]The Organization for Economic Co-operation and Development(OECD).What Students Know and Can Do:Student Performance in Mathematics,Reading and Science?(Volume I)[EB/OL].http://www.oecd.org/pisa/keyfindings/pisa-2012-results-volume-i.htm.

[7]OECD(2003).The PISA 2003 assessment framework-mathematics,read,science and problem solving knowledge and skills.[EB/OL].https://www.pisa.oecd.org/document/.2003.

[8]王鼎,毕晓楠,杨玉东.PISA数学测试框架制订过程的启示[J].上海教育,2010(03A):55-56.

定性数据 篇10

1 存在延时和丢包系统的建模

考虑网络只存在于传感器和控制器之间的情形, 为方便研究, 对系统进行如下假设: (1) 整个闭环回路的时延记为τk, 大小固定, 且τk<h (h为采样周期) ; (2) 数据丢包发生在传感器和控制器之间, 丢包率r一定; (3) 当存在丢包时, 执行器保持上一周期的控制输入; (4) 传感器为时钟触发, 采样周期一定, 控制器和执行器为事件触发, 即接收到数据立即进行相应的操作。

则系统可以描述成一个具有事件率约束的异步动态开关系统, 系统模型框图描述如下:

事件S1:无丢包发生, 传感器数据成功传送, 相当于开关接通, 消息传输存在时延。

事件S2:发生数据丢包情况, 相当于开关断开, 此时执行器沿用上一个周期的数据u (k-1) 。

对于S1, 控制器的输入可以表示如下:

设状态反馈控制律为:u (k) =Kxk,

由式 (1) 得离散化后的系统, 表示为:

对于S2, 控制输入u采用上一周期的值, 则离散化后的系统表示为:

其中

通过新变量Z (k) 进行替换:

因此, 广义被控对象的离散模型可以描述为:

定义1对应于闭环系统状态矩阵 (i=1, 2…) 出现的比率, 称为结构事件率[4], 用表示, 则应满足:

假设丢包率为r, 则S1事件发生的概率为1-r, S2事件发生概率为r。

2 指数稳定性分析

定义2若存在常数α>1, 使得limαk||xk||=0, 则称异步动态系统是指数稳定的。

引理1对于异步动态系统xk+1=FS (xk) , 其中, , 事件1, 2…N的结构事件率分别为r1, r2…rN。若存在Lyapunov函数V (xk) , 满足β1||x||2≤V (x) ≤β2||x||2 (β1, β2>0) , 且存在标量a, a1, …, aN>0, 满足条件:

则系统指数稳定。

定理1对于式 (2) 和式 (3) 描述的随机事件S1、S2的事件率分别是1-r、r, 若存在对称正定矩阵P、Q以及标量a1、a2>0, 使得下面矩阵不等式成立, 则网络控制系统是指数稳定的。

证明:令V (k) =xTkSxk+xk-1TLxk-1, 当事件S1发生时, 由式 (2) 可知

由上式和Schur补引理[5]可得, V (k+1) -a1-2V (k) 等价于式 (13) ,

将式 (12) 两边同时左乘、右乘diag{I S-1S-1}, 令P=S-1, Q=S-1LS-1, 可得式 (10) , 即式 (10) 等价于V (k+1) -a1-2V (k) <0

同理, 当S2发生时, 由式 (3) 可得

式 (8) 等价于V (k+1) -a1-2V (k) <0, 由引理1可知式 (9) 、 (10) 、 (11) 成立。

3 仿真分析

被控对象状态方程为

其中, x (t) ∈Rn, y (t) ∈Rq, u (t) ∈Rp, 分别为系统状态、输出和输入, A、B、C分别为适维矩阵。

对于系统模型利用线性二次型方法 (LQR) 求得系统的最优反馈增益, 利用假设丢包率r=0.2和LMI工具箱的feasp求解可行性问题。解得a1=1.174, a2=0.6, feasp的目标值tmin=-0.0712<0, 即存在可行解:使得在丢包率为0.2时系统保持指数稳定。设系统初始状态为x (0) =[10-10]T, 则系统的初始状态响应如图2, 可见系统保持指数稳定。

4 结论

控制系统中由于网络的存在会产生通信时延和数据丢包的问题, 本文将具有时延和丢包的系统建模为具有事件率约束的异步动态开关系统, 利用李亚普诺夫方法和线性矩阵不等式推导系统的指数稳定性条件, 利用Matlab的LMI工具箱求解线性矩阵不等式的可行解, 进而判断系统的稳定性。

摘要:该文对存在时延和数据掉包的网络控制系统进行建模, 并分析系统的指数稳定性。将具有网络诱导时延和数据丢包的系统建模为具有事件率约束的异步动态开关系统, 利用李亚普诺夫方法和线性矩阵不等式推导系统的指数稳定性条件, 通过求解线性矩阵不等式可行解的方法判断系统的稳定性, 最后通过仿真分析, 说明该方法是有效的。

关键词:网络诱导时延,数据丢包,线性矩阵不等式,指数稳定性,异步动态系统

参考文献

[1]刘磊明, 童朝南, 袁立.关于网络控制系统中的延迟对系统性能影响的研究[J].信息与控制, 2005 (03) .

[2]Dong J, Kim W.Markov-chain-based output feedback control for stabilization of networked control systems with random time delays and packet losses[J].International Journal of Control, Automation and Systems.2012, 10 (5) :1013-1022.

[3]Vanantwerp J G.Atutorial on linear and bilinear matrix inequalities[M].Elsevier Ltd, 2000:10, 363-385.

[4]Zhang W, Branicky M S, Phillips S M.Stability of networked control systems[Z].The Institute of Electrical and Electronics Engineers, Inc. (IEEE) , 2001:21 84.

上一篇:家族制度下一篇:跨文化交际问题分析