数据问题

2024-07-09

数据问题（共12篇）

数据问题篇1

随着档案管理现代化水平的提高, 档案管理系统也在不断的优化和升级, 同一全宗的档案分别保存在不同的档案管理系统中, 不利于档案的检索与利用。为使过去使用的《A档案管理系统》的目录数据都迁移到《B档案管理系统》中, 对迁移出的历史数据表要进行数据审核, 以确保各著录项的齐全、完整、准确, 导入到《B档案管理系统》中可以正常使用。在此, 笔者就数据审核过程中存在的问题、数据校验工具的应用以及数据校验工具的优化设计等进行探讨。

一、数据审核过程中存在的主要问题

1. 审核数据量大。

由于每个档案管理系统都会使用一到两年才会更新换代, 因此, 从《A档案管理系统》到《B档案管理系统》的数据迁移量很大, 需要审核的档案数据量就大。如果用手工筛选、查找不仅费时、费力, 还可能存在遗漏、重复等问题, 更主要的是会给将来的系统检索带来一定的困难。

2. 目录数据表格式与数据库文件格式匹配问题。

从《A档案管理系统》导出的目录数据表应与《B档案管理系统》的数据库文件格式相匹配, 如果不匹配, 导入到《B档案管理系统》也不会是有效数据。在实际工作中, 不匹配的情况时常出现, 这是数据审核应注意的问题。

3. 电子文件关联项重复。

如果许多电子文件重复链接, 导出的目录数据表就会存在电子文件关联项重复的问题, 因此, 相同的电子文件关联项只能保留一个。这就要求数据迁移时, 每个目录数据表内不允许存在相同的电子文件关联项, 如确实相同, 也必须修改, 删除重复的电子文件关联项, 并记录下来, 数据迁移之后再手动挂接。

二、数据校验工具的应用

鉴于人工审核的种种弊端, 智能化的校验工具体现了其强大的优势:

1. 操作简易。

数据校验工具操作简单, 使用时只需要选择配置文件和目录文件路径。配置文件作为一个模板, 决定了导入系统的数据格式, 所有已导入的系统数据都需要符合它的要求, 否则即使录入新系统也会被视为无效的数据。当点击配置文件对应的下拉菜单后, 可直接选择需要的配置文件类型。目录文件路径即选择待校验数据, 根据路径选择, 之后点击“校验”即可。点击“校验”后, 校验数据的错误会分别列出, 用户可按照校验工具指出的错误定位对数据进行修改。多次校验后直至校验工具弹出的提示是“没有发现错误数据校验成功”, 完成数据校验。

2. 准确性高。

首先, 数据校验工具的使用保证了著录项齐全、完整。校验结果常出现卷内文件表的题名责任者、文件序号、页号、归档单位、归档部门名称、密级等为空的提示。按照校验工具指出的错误定位在目录数据表中找到该件档案, 认真核对其实体档案, 将其补充完整;其次, 数据校验工具的使用保证了电子文件关联项无重复。校验工具可以校验出重复的电子文件关联项, 根据错误定位找到重复的电子文件进行相关处理;再次, 数据校验工具的使用保证了案卷和卷内文件相对应。通过“案卷和文件关联项”查明文件是否存在, 以适时补充或删除;最后, 数据校验工具的使用, 解决了格式匹配问题。数据校验工具与导入系统的数据库结构相匹配, 通过校验可以找到目录数据表的格式与导入系统的数据库文件格式不匹配的地方, 根据错误提示进行修改, 直到提示没有错误。

3. 效率较高。

应用数据校验工具会极大提高工作效率, 审核数据量越大, 提高工作效率的程度越明显。以会计档案为例, 2万多条会计类档案目录数据, 40多万个著录项, 如果用手工筛选、查找的方式检查目录数据中各著录项是否齐全、完整, 至少要4天以上的工作时间, 而应用数据校验工作仅用2天时间就完成了会计类档案全部的审核工作。

三、数据校验工具的优化设计

数据校验工具的使用虽然可以大大的降低劳动强度、提高工作效率, 但依然需要大量的时间和精力做好前期的数据统计工作。针对数据校验工具在使用时存在的弊端, 对数据校验工具进行优化设计, 主要从下面两个方面入手:

1. 提高智能化程度。

目前使用的数据校验工具在设计时缺少与档案管理规范的结合, 不够智能化, 在校验的过程中不能分析、判断出与档案管理规范不统一的地方。如:归档日期在档案日期之前, 校验工具不能识别这种错误。通过编程把基本的档案管理规范和著录要求加入到数据校验工具中, 更加智能地校验出存在的问题, 以提高校验工具的智能化程度。

2. 提高校验精细度。

目录工作薄内的案卷表和卷内文件表通过“案卷和文件的关联ID”关联, 但不能识别出各关联表内的相同的著录项是否一致, 如归档单位、日期等。设计后的校验工具可以校验出同一关联ID下的相同著录项是否一致;另外, 设计后的检验工具可以校验出案卷表内的件数与同一关联ID下卷内文件数是否是对应的。提高了校验精细度, 可以降低数据统计的工作量, 提高了工作效率。

参考文献

[1] .王婧韫.数据迁移的一般原则[J].电脑开发与应用, 2000.13

[2] .刘海英.冯文秀.杜晓通.管理信息系统升级过程中数据迁移的研究及实现.电力自动化备, 2005.37

数据问题篇2

数据库安全问题一直是人们关注的焦点之一，我们知道一个企业或者机构的数据库如果遭到的攻击，而这些数据库又保存着非常重要的数据，象银行、通信等数据库，后果将不堪设想。Oracle数据库使用了多种手段来保证数据库的安全性，如密码，角色，权限等等。

作为Oracle的数据库管理员都知道，数据库系统典型安装后，一般sys和system以及internal这三个用户具有默认的口令，数据库安装成功后，系统管理员作的第一件工作就是修改这些用户的口令，保证数据库的安全性。然而，众多管理员往往忽视了其中的一个安全问题，下面我们就将详细讨论这个问题。

Oracle数据库系统如果采用典型安装后，除了创建前面介绍的几个用户外，另外还自动创建了一个叫做DBSNMP的用户，该用户负责运行Oracle系统的智能代理（Intelligent Agent），该用户的缺省密码也是“DBSNMP”。如果忘记修改该用户的口令，任何人都可以通过该用户存取数据库系统。现在我们来看一下该用户具有哪些权限和角色，然后来分析一下该用户对数据库系统可能造成的损失。

启动SQL/PLUS程序，使用该用户登录进入：

SQL>select * from session_privs;CREATE SESSIONALTER SESSIONUNLIMITED TABLESPACECREATE TABLECREATE CLUSTERCREATE SYNONYMCREATE PUBLIC SYNONYMCREATE VIEWCREATE SEQUENCECREATE DATABASE LINKCREATE PROCEDURECREATE TRIGGERANALYZE ANYCREATE TYPECREATE OPERATORCREATE INDEXTYPE

可以看到该用户不是SYS或SYSTEM管理用户，然而，它却具有两个系统级权限：UNLIMITED TABLESPACE和CREATE PUBLIC SYNONYM，

看到这两个权限你应该马上想到，这些都是安全隐患，尤其是UNLIMITED TABLESPACE，它是破坏数据库系统的攻击点之一。如果这时候你还依然认为，即使有人利用这个没有修改的口令登录进数据库也造成不了什么损失的话，我就不得不提醒你：该用户具有UNLIMITED TABLESPACE的系统权限，它可以写一个小的脚本，然后恶意将系统用垃圾数据填满，这样数据库系统也就无法运行，并将直接导致最终的瘫痪。目前很多数据库系统都要求7X24的工作，如果出现了系统用垃圾数据填满的情况，那么，等数据库系统恢复时，恐怕不可挽回的损失已经造成了。

为了保证Oracle数据库系统运行的绝对安全，强烈建议数据库管理员修改该用户的默认口令，不要为不怀好意的人留下“方便之门”。

SSD的数据安全问题篇3

寿命短暂的闪存单元

SSD的存储密度有上升的趋势，闪存单元的尺寸越来越小，而且一个闪存单元可能被用于存储两三位的数据，这导致闪存单元的寿命更加短暂，每一个闪存单元存储一个数据位的单层单元可以应付100 000次写操作，而一个单元存储两位的多层单元（MLC）则只能够承受3 000次写操作，存储三位的三层单元（TLC）只能够承受1 000次写操作。

闪存单元的设计原理决定了它们的寿命极其有限：闪存单元通过浮动栅极（floating gate）的状态来存储数据，当向控制栅极（control gate）施加电压时可以为浮动栅极充电，让电子可以穿过薄薄的绝缘层到达浮动栅极，在此状态下，即使不再施加控制电压，电子也将留在浮动栅极，浮动栅极形成电场，可以阻止读取电流，因此对该单元的读取值为“0”。如果要将单元写入一个“1”，那么需要向控制栅极反向施加电压，通过绝缘层移出浮动栅极中的电子，在不带电的状态下，浮动栅极将允许读取电流通过，在这种情况下，对该单元的读取值为“1”。

浮动栅极周围的绝缘层磨损是闪存单元寿命短暂的原因，每一次电子穿越绝缘层的过程都将导致金属氧化物的损耗，随着时间的推移，绝缘层的金属氧化物损耗得差不多之后，原子键就会断裂，部分电子可能会在穿越过程中被困在氧化物中，导致负电荷积累，越来越多的控制电流被抵消。闪存单元的擦写操作需要的时间会越来越长，最终时间已经长到足以影响SSD性能的时候，SSD控制器将丢弃它。因此，闪存单元的删除和写操作是决定闪存单元寿命的关键，而闪存单元在实际使用中并不是逐一单独访问的，而是被链接起来成为一个256KB或者512KB的区块，这就导致SSD的每一次擦写操作都可能影响更多的闪存单元。因而，SSD需要通过控制器对写操作进行计划和管理，尽可能地避免放大擦写操作对闪存单元寿命的影响。

不管闪存单元有什么样的技术缺陷，在SSD容量更大并且价格更低廉的迫切需求下，制造商能够做的只能是不断地提高数据密度。如上所述，现如今的SSD，闪存单元不再是存储一个“0”或“1”的数据位，而是每一个单元存储两个位甚至三个位，闪存单元中不同的电压等级代表不同的“0”与“1”的组合。这需要大幅度地降低电压的容差，否则不足以弥补劣化的绝缘层所带来的影响。因而每一个单元存储两个数据位的多层单元只能够承受3 000次写操作，存储三个数据位的三层单元只能够承受1 000次，而不再是原来的100 000次写入和删除操作。另外，要以合理的价格扩张产能，以及在闪存存储设备小型化的需求下，制造商不断地压缩闪存单元的尺寸，这导致绝缘层以及闪存单元其他结构的尺寸同样被压缩，更容易受到磨损。

SSD的使用寿命

在正常的使用过程中，SSD很快就无法工作，这种担心已经被证明是毫无根据的。IT数码港经销商的存储产品经理托马斯·韦泽通过退换货率来描述这一问题，他认为SSD的退换货率并不比传统的机械硬盘高，而SSD的制造商OCZ的代表也表示，他们的SSD受益于所使用的NAND单元和动态补偿等先进技术的应用，从普通用户的角度来考虑，SSD的寿命完全够用。除了这些相对比较空泛的描述之外，一个更具体的证明是三星的IT存储事业部产品经理所提供的，该公司的产品通过固件缓解闪存单元的有限生命周期，根据目前的经验，840 EVO的耐用性和可靠性超过3年，840 PRO则超过5年。并且该公司的一个120GB容量的测试驱动器，目前已经用来写过563TB的数据，至今仍然工作正常。按照563TB的数据计算，这一驱动器相当于已经全盘擦写了4 700次，如果以每天全盘擦写一次来计算，这将需要持续12年。实际上，在互联网上也有许多用户提到，自己的SSD已经被用来写过几百TB的数据。

SSD能够使用多久与其所设计的使用强度也有一定关系，这通常可以根据制造商的保修期限来判断。高价位的OCZ Vector 150SSD设计的使用强度是5年内可以每天擦写50GB数据，因而，这种SSD有很长的保修期。而最便宜的OCZ Vertex 450设计的使用强度是3年内可以每天擦写20GB数据。对于一般用户来说，由于这个使用强度是按照每天擦写设计的，所以可以确保使用寿命足够长。同样的道理，三星的SSD也分为专业版本和普通的消费版本，分别提供5年和3年的保修期。因而，当我们选择SSD时，如果追求更高的稳定性与寿命，可以选择5年保修期的专业版本。而且在日常的使用过程中，适当地控制每天擦写的数据量，理论上可以延长SSD的使用寿命。

使用CrystalDiskInfo之类的工具可以读出SSD的使用情况等许多相关的统计信息，例如写入的数据量和磨损量指示等。不过，这些从0到100的数字有点过于抽象，因而，我们可以使用SSDLife（ssd-life.com）来分析这些记录，并预测SSD剩余的使用寿命。首次启动软件，SSDLife将记录数据的写入量，如果长期使用可以安装该软件，软件能够更准确地预测寿命。不过，通过SMART值预测驱动器寿命的准确率自然不会是百分之百，许多驱动器在SMART值预测将损坏之后，仍然可以使用很长的一段时间。不过，如果SMART值显示SSD寿命即将终结，那么我们应该定期为SSD上的数据进行备份。endprint

当SSD出现故障时

SSD的控制器能够有计划地安排写入操作以减少闪存单元的擦写次数，并尽可能地给闪存单元平均分配写入任务，避免个别闪存单元过早地磨损。此外，控制器能够标记寿命终结的闪存单元，并用其他的闪存单元替换以避免区块内的所有闪存单元无法使用。个别生产商宣称他们的SSD可以替换的闪存单元多达30%，在出现故障的闪存单元能够得到替换的情况下，SSD除了出现轻微的性能损失和SMART值有相应的变化外，基本上不会对用户有任何影响。这种情况将一直持续到有缺陷的闪存单元所占比例过大的时候，当这种情况发生时，SSD将切换到只读模式。我们可以通过写操作和系统不稳定的错误信息预测这一天的到来，如果写操作的时间过长，Windows将取消它并提示失败的信息，而当SSD是系统驱动器时，操作系统将可能出现死机等不稳定的状况。

除了有缺陷的存储单元之外，有缺陷的固件也可以导致SSD不稳定，然而这种故障通常不会丢失数据。我们可以将固件存在缺陷的SSD连接到移动硬盘盒，或者通过SATA线连接电脑，然后使用专业的工具对其进行更新和备份。在本文最后部分，我们将为大家介绍如何创建一个可以启动系统的闪存盘，并使用其中包含的硬盘工具为系统驱动器创建镜像备份，或者从有故障的SSD中拷贝数据。

需要注意的是，如果需要使用SSD工具在线更新固件，那么要使用SATA数据线直接将SSD连接到电脑上，SSD工具无法通过USB连接在线更新固件。如果SSD是由于固件的缺陷而出现故障，例如文章开头所介绍的SandForce SF-2000固件缺陷，那么在更新SSD固件之后，SSD上的文件应该可以再次被读取。接下来，我们可以使用上面提到的工具克隆驱动器或复制文件，完成后使用SSD工具的“Secure erase”功能重置SSD。最后重新将数据复制或者克隆到SSD上，并检查SSD是否能够正常工作。

当硬盘寿命完全终结时

最坏的情况是在BIOS中找不到SSD，并且SSD在Windows数据载体管理系统或资源管理器中都不可见。此时，某些配备Indilinx控制器的特殊型号，可以从电脑上断开SSD的电源和SATA线，通过一个跳线重新设置BIOS，尝试让SSD可以重新被访问。不过，对于大部分SSD来说，如果SSD在其他电脑或者USB移动硬盘盒中也无法访问，那么这通常意味着SSD的控制器或者一些核心部件已经损坏。在这种情况下，SSD上保存的数据仍然存在于存储器单元中，但是控制器的故障导致它们无法被读取。

如果这些数据没有备份，必要时可以联系一些专业的数据恢复公司进行恢复，个人用户自行恢复的可能性基本为零。数据恢复公司Kroll Ontrack的经理马丁·希勒告诫大家，尝试自行恢复控制器故障的SSD通常只能带来更大的麻烦。专业的数据恢复专家可以从闪存单元中直接读出数据，并通过软件来完成本该由控制器执行的任务，将数据重建成文件。至于是否能够成功恢复数据，将取决于控制器的复杂性与控制器厂商的信息公开程度，还有数据恢复专家的水平。

数据问题篇4

1 单位性质字段

“单位性质:行政事业单位填写行政、事业, 企业党委按国家统计局、国家工商行政管理局《关于经济类型划分的暂行规定》填写国有、集体、私用、外资、港澳台、联营、股份制、个体或其他。个人住宅填写个人。” (《国土资源管理 (乡镇篇) 》

《土地登记实务》一书中土地使用权登记申请人情况表中单位性质的部分都是以如下格式填写的:

“单位性质|□行政 □事业

企业 (□国有□集体□私用□外资□港澳台□联营□股份制□个体□其他) □个人”

笔者认为比较准确地界定单位性质, 应先明确将单位性质划分为行政、事业、企业、个人四个大类, 而从属于企业之下的各种性质应该编写第二等级代码, 否则容易引起填表人的概念混淆。还有“全民”性质在《关于经济类型划分的暂行规定》中, 已经取消, 且《土地登记实务》中所有申请人情况表中是不存在的, 应当去除该值。

2 土地权属性质

我国的土地权属性质分为:国有土地所有权、国有土地使用权、集体土地所有权、集体土地使用权及地役权等。土地权属性质是土地登记工作的一项重要内容。我国的土地除集体所有的以外, 均为国家所有, 所以在所有权性质登记时, 我国只对集体土地所有权登记, 而不对国有土地所有权进行登记。另外, 对地役权的登记在土地登记簿上一般把它记载在“登记的其他内容及变更登记事项”栏, 而不记载在“土地权属性质”栏。因此, 城镇地籍调查时土地权属性质调查分三种:国有土地使用权、集体土地所有权及集体土地使用权。集体土地使用权又分为:集体农用土地使用权、集体土地建设用地使用权、集体土地未利用地使用权。集体农用土地使用权主要是指对农业用地的承包经营权, 也包括依法取得的“四荒地”使用权。集体土地建设用地使用权可进一步分为农村居民宅基地使用权和乡村企事业建设用地使用权。

《土地登记实务》书中的《土地登记申请书》规定国有地土地权属性质分为国有建设用地使用权和国有农用地使用权。

综上所述, 结合《现行标准》中的关于使用权类型的内容, 笔者认为《现行标准》中关于权属性质和使用权类型界定上存在以下问题:

权属性质和使用权类型的数据集界定上存在概念重复。土地使用权是《物权法》中用益物权的范畴, 是从属于土地所有权的一项权利, 即土地使用权的数据集应是土地所有权数据集的一个子集。在《现行标准》中, 将土地所有权和土地使用权的界定放在并列等级上是不严密的, 应当在权属性质字段中只确定土地所有权类型。如果要根据《物权法》中关于用益物权的规定——即用益物权虽然是由所有权派生的权利, 但是用益物权的这种派生性并不影响用益物权作为一种独立的财产权的存在, 则在与国有土地所有权、集体土地所有权之外增加用益物权的选项。根据《物权法》中的用益物权的分类来区别于后面使用权类型的判断定义, 即应当以标的物的用途进行分类, (注:下面谈到的土地使用权类型的划分依据为使用权的设立方式) , 分为建设用地使用权、土地承包经营权、宅基地使用权和地役权等。

3 使用权类型

在《物权法》颁布之前, 在土地权利领域广泛使用“土地使用权”这一概念, 其内涵既包括农用地使用权, 也包括建设用地使用权。但在物权法立法中, 并未用“土地使用权”的概念, 其主要原因是考虑到土地承包经营权、建设用地使用权和宅基地使用权在设立、利用等方面存在较大的区别, 当事人的权利和义务也不尽相同。因此, 《物权法》根据土地的用途, 将土地使用权分解为建设用地使用权、土地承包经营权、宅基地使用权。其中建设用地使用权按照土地所有权分为国有土地建设用地使用权和集体土地建设用地使用权;国有土地建设用地使用权按照设立的方式分为出让国有建设用地使用权、划拨国有建设用地使用权、租赁、作价出资 (入股) 和授权经营等方式设立的国有土地建设用地使用权;集体土地建设用地使用权分为乡镇企业建设用地使用权 (按主体又可分为农村集体经济组织设立的独资经营企业和农村集体经济组织通过以符合要求的土地使用权入股、联营的形式与其他单位、个人设立的企业、乡村公益建设用地使用权、土地承包经营权、宅基地及其他等等。

《现行标准》和《南方标准》中土地使用权沿用了《物权法》公布以前土地使用权的定义。

4 土地等级的确定

《现行标准》、《南方标准》中, 土地级别代码是由综合、商业、住宅、工业四种用途+相应土地等级构成。《试行标准》中是完全由土地等级构成, 不包含土地用途。土地分等定级原则是遵循地域分异原则的, 等级的确定应建立在区域分异的基础上, 而不应与用途结合确定土地等级代码。一宗土地存在理论用途和实际用途。实际用途是批准土地使用权时所赋予的符合土地利用总体规划的法定权利, 而理论用途是存在多种可能性的。因此, 土地用途不应作为确定土地等级的附加因素。

参考文献

[1]第二次全国土地调查数据库建设规范[S].国务院第二次全国土地调查领导小组办公室发布, 2007, (12) .

[2]第二次全国土地调查技术规程 (TD/T1014-2007) [S].中华人民共和国国土资源部发布.

[3]土地利用数据库标准 (TD/T1016-2007) [S].中华人民共和国国土资源部发布.

校舍数据录入常见问题篇5

排查人陈建华、钟梁、蔡志平、谢静、侯文魁、刘健、廖仁贵、曾茂娣等

A级安全房屋鉴定文号编排规则：“房鉴字［2009］+学校顺序码+01、02、03…+号”

危房鉴定部门、鉴定文号、鉴定时间没有填

每栋建筑物均要规划，包括A级安全使用的房屋，不管五年规划表里面有没有。A级建筑规划时，规划资金和规划面积均填”0“

鉴定是赣州市建筑设计研究院，责任人填黄波

鉴定资质：甲级

单体建筑审核时危房鉴定等级没有选择，鉴定部门及鉴定文号错误，请修改排查日期填7月份或八月份

机构代码错误，应该为9位数，实在查找不到就然它空着。

先在校舍信息表单体建筑物修改，然后在详细信息表里修改

审核时发现多数学校建筑物信息表里面鉴定部门、鉴定文号没有按照要求填写，请撤消审核后修改。

提示：

填建筑物信息表示注意排查、鉴定部门人员统一，危房等级选择以及资金投资全部填入其它资金，不要填县级财政。

排查单位负责人填：区长大人的姓名廖长荣

排查负责人填：陈建华

审核基本信息表要求：

1、组织机构代码：9位数而非10位数

审核校舍信息管理表

学校详细信息表赣州市水东小学详细信息危房面积应等于单体建筑面积之和;教学及辅助用房危房面积应等于单体建筑面积之和;生活用房危房面积应等于单体建筑面积之和;D级危房面积应等于单体建筑面积之和;D级生活用房危房面积应等于单体建筑面积之和;liwenbing(李文兵)16:23:18

这个问题统一答复如下：

1、详细信息表录入前需录入所有建筑物信息表；

2、输入单体信息表时应注意里面危房等级情况及危房面积，安全的建筑选择等级为A级。

3、详细信息表建筑面积及危房建筑面积应该等于各单体建筑物之和，另外计算危房面积总和时不用计算A级房屋建筑面积。

填单体建筑物规划情况表时，A级危房虽然五年规划表里面没有规划，但是也要在此相应每栋A级的新增一栋规划建筑，规划投资和规划资金填“0”，开工日期可以随便。

通知：

由于区级审核工作量巨大，我一个人审核不过来，以后区级审核进行以下分工：开发区学校黄金中学刘小东主任

章贡区乡镇学校沙河中学樊友斌副校长

城区学校西津路小学朱阳明主任

请各学校审核了的学校报于以上三名区级审核员。

***

3区级审核账号：360702002密码：5328001

请参与区级审核，负责章贡区乡镇学校，请多帮忙，谢谢。如有什么问题，我们四个一起商量解决。

提示：

今天请各学校完成校安工程管理菜单下表格填写。

1、小数场址安全排查管理

2、校舍建筑安全排查管理

3、校舍鉴定管理

4、规划情况管理里面单体建筑规划信息维护表（按照五年规划来，如有变动需上报，A级校舍也要新增规划表，规划数据为0），单体规划填完后填校园规划信息表（该表是单体规划的汇总，特别注意不要包含你规划以前的校舍情况。）

另外需注意一下几点：

1、填建筑物信息表示注意排查、鉴定部门（赣州市建筑设计研究院）及人员（黄波（负责人）、廖仁贵、曾茂娣）统一，危房等级选择，鉴定单位资质甲级，鉴定日期2009年11月

2、填规划时资金投资全部填入其它资金，不要填县级财政，A级开工日期填2009年，其他危房改造开工日期按规划表格。

3、排查单位：章贡区校安工程排查组

排查单位负责人填：区长大人的姓名廖长荣

排查负责人填：陈建华，排查日期2009年7-8月

4、另外鉴定信息填写，指需要勾选安全鉴定，其它抗震鉴定、抗风鉴定的均不勾选。

更正：

规划信息管理里面校园规划表也需要填写，该表是单体规划的汇总，特别注意不要包含你规划以前的校舍情况。

补充更正：

D级危房拆除、迁移避险学校危房需新建校舍，需要在规划新建单体建筑维护添加新建信息。

耐火等级是“一级和三级”之分，一级即为：混凝土及以上结构，三级则为砖

木结构。如果是木、竹为主体的则应是四级啦~~~

提示：

企业统计中数据失真问题研究篇6

实事求是是统计工作的基础

列宁在《列宁全集》中这样写到：“统计工作不是把数字随便填到几个格格里去，而应当是用数字来说明所研究的现象在实际生活中已经充分呈现出来或正在呈现出来的各种社会类型。”由此看来，统计信息的质量是关乎统计工作生命的重要问题。

（一）实事求是是统计数据的基本要求

统计数据是统计分析和研究的基础。为了提高数据的质量和高质量的完成统计任务，统计就必须满足以下几点基本要求：

1.准确性。准确性是指统计的数据必须如实地反映客观实际、真实可靠。

2.及时性。及时性也就是时效性。在统计规定的时间内，尽快提供统计资料。

3.完整性。完整性及全面性，指对调查计划规定必须调查的单位、必须要调查的项目毫无遗漏地搜集其资料。

4.系统性。指统计提供的资料应该相互配套、自成体系。

（二）实事求是是统计工作的基本要求

统计进行宏观调控与微观管理的手段，如何保证统计数据客观真实的反映国民经济发展水平，不掺任何虚假水分，不受任何干扰，只有实事求的统计。

1.只有实事求是的统计才能为宏观决策和制定国民经济发展计划提供科学的依据。

2.只有实事求是的统计才能对国民经济运行过程进行及时的监测。

3.只有实事求是的统计才能为宏观经济分析提供基础数据。

（三）统计数据失真的危害

数据失真，带来的危害是极其严重的：

1.对国家来说，对上报的错误数据进行分析，使国家做出错误的决策，从而严重影响我国国民经济的正常运行，不能对国民经济运行进行及时的监测，不能很好的运用宏观政策对国民经济进行控制。

2.对企业本身来说，一是影响企业经营者科学的管理和决策；二是使投资者和融资者丧失向企业融资的信心；三是在政治、社会方面带来了不良影响，为腐败行为提供了温床；四是导致企业收入、利润虚增，财政虚收，企业资产流失。

企业统计工作的现状及统计数据失真的成因

企业统计机构是我国统计机构的重要组成部分，企业统计工作是我国政府统计工作的基础。但是，企业统计由于受内外部各种因素的影响，使得统计数据失真的情况大量存在：对于企业职工自身来说，为了提高自己的收入，他们会故意虚报产量，瞒报对自己不利的数据，导致数据失真；对于企业来说，为了自身的利益、单位领导人的声誉和职务升迁，虚报、瞒报、伪造、篡改统计资料，导致数据失真。

造成企业统计数据失真的原因是多方面的，归纳起来主要有以下几个方面：

（一）现行企业统计管理体制存在着弊端

我国实行“统一领导、分级负责”的统计管理体制，由于地方统计机构是地方政府的一个职能部门，要为地方政府服务。且地方综合统计部门主要干部的任免、人员编制的增减和经费的审批都是由地方政府决定的，导致地方统计工作的独立性差、统计数据的抗干扰能力弱。

（二）统计法本身不完善

在确保统计源头数据准确性方面，统计法只对加强统计基础工作做了原则性的规定，对违反法定义务应承担的责任却规定过少。有关公民、法人和其他组织在统计活动中的权利义务规定不具体，包括对统计调查对象资料保密制度不够严密，缺乏减轻统计调查对象负担的制度和统计信息共享制度。

（三）本位主义的驱动

企业经济效益的提高能给企业经营者带来额外的经济收益。由于本位主义的驱动，经营者自然有了粉饰统计信息的动机。同时，由于企业单位的统计人员都是由经营者直接聘任，并对其负责，所以难以保持其独立性，结果就导致许多统计信息失真。

（四）原始记录不准确

原始记录登记人员虚报、瞎报、瞒报、漏报；企业中人员调换频繁，新员工错报、误报较频繁；填报的数据没有人进行核对。

解决企业统计工作中数据失真的对策

针对以上的问题，遏制和消除统计信息失真，应从以下几个方面入手：

（一）建立与市场经济相适应的企业统计指标体系

建立一套既能反映企业的市场状况，又能反映企业的发展方向；既能反映企业的经营环境，又能反映企业的内部经济运转机制；既能反映企业的生产经营成果，又能反映企业社会效益的统计指标体系，用这套指标来指导、考核企业的经营状况。

（二）加大统计执法力度

独立行使统计职权，确保统计数据不受干预，保障统计机构和统计人员独立行使统计职权；强化统计监督，建立统计数据质量定期评估和考核制度，减少统计工作各环节可能出现的统计失真现象；提高企业领导和统计人员知法守法的水平。

（三）建立科学的政绩评价体系和评价机制

建立科学的政绩评价体系，对干部的选拔和任用既要突出领导干部工作实绩，又要考查领导干部工作作风、思想政治素质、工作能力等，从而形成一个有机的综合考核评价体系，淡化统计指标在考核中的作用，为实事求是统计创造良好的环境和氛围。

（四）提高统计人员的综合素质

加强思想政治教育，提高统计人员的政治素质，广泛深入地开展坚持实事求是，反对弄虚作假的职业道德教育，坚决抵制和反对各种虚报瞒报、以权扰数、以数谋私违法行为；加强业务技术教育，提高统计人员的业务素质，实行先培训后上岗和持证上岗制度，不断提高统计人员的专业素养，使具有的专业知识水平与所负责的统计工作相适应；固定企业统计人员，企业设置专职综合统计岗位，保证统计岗位的稳定性。

（作者单位：郑州铁路局客货运输统计所）

我国企业数据质量问题分析篇7

企业统计数据失真是指企业上报的统计数据对社会经济现象的现状不能做出客观、真实的反映。在我国, 企业统计工作是我国政府统计工作的基础, 企业统计部门是我国统计机构的重要组成部分。但是, 由于企业统计受到企业内部和外部环境的双重影响, 使得企业统计数据普遍失真。企业职工为了提高自己的收入所得, 会故意虚报产量, 瞒报对自己不利的数据, 导致数据失真;企业领导人为了自身的利益、单位的声誉, 虚报、瞒报、伪造、篡改统计资料的现象时有发生, 导致数据失真。2013年, 国家统计局曾曝光重庆永川的统计人员先评估审核企业统计数据, 修改完成后再上报的案例, 2012年11月, 重庆市永川区要求政府职能部门先审核企业统计数据, 再向统计机构报送;同期, 山西省河津市政府统计人员要求企业按特定统计数据上网报送统计报表, 造成河津市的十几家公司存在统计数据严重的虚报现象。

二、企业统计指标体系和方法不健全

目前, 企业统计人员报送统计报表的任务过重, 我国统计调查项目主要包括三部分, 分别是由国家统计局制定的统计调查项目、由地方统计局制定的统计调查项目和各职能部门制定的统计调查项目。当前, 我国国家级统计调查项目共有30个, 地方统计调查项目共有35个, 各职能部门统计调查项目340多项。各级统计机构根据地方政府的需要, 在国家级统计调查项目的基础上, 还增加许多报表, 无形中使企业的负担更重。

根据规定, 对统计报表的表号、统计报表的制定机关、统计报表的备案文号不明确的、或者已经超过统计调查表有效期限的, 县级以上人民政府统计机构有权停止有关统计调查活动。然而在实际调查中, 经常有企事业单位统计人员反应非法调查问卷问题。根据规定, 统计调查项目之间应当指标明确, 不能重复调查。但是, 统计报表中经常出现相同指标重复调查的现象, 有些指标之间还存在相互矛盾等问题。繁重的统计报表工作, 使企业和基层统计机构的统计工作人员只能疲于应付, 没有多余的精力和时间做好收集统计原始凭证, 登记统计台账等统计基础工作。

三、企业统计工作不受领导重视

企业领导普遍不重视统计工作, 认为统计工作就是简单收集统计数据, 然后把数据填入统计报表中, 最后上报到政府统计部门就是企业统计工作的全部, 不改变企业管理者对企业统计工作的偏见, 将造成企业统计人员得不到领导和各部门的支持, 从而很难开展统计工作, 企业管理者应认识到:企业统计工作是通过收集与企业经营生产相关的数据, 提取当中有用的信息加以分析, 为企业未来经营决策提供咨询建议, 并能够监测管理者所做决策的执行情况。企业管理者能够通过企业统计数据, 了解企业经济运行状况, 各经济、财务指标之间的数量关系, 并且可以获得企业生产经营结果的具体数据, 从而总结企业发展的规律, 对未来经营方向进行预测。

四、企业统计台账和原始记录不健全

统计原始记录是企业统计人员按照一定方式记录企业生产经营活动。企业统计工作的原始记录是企业统计数据的源头, 是企业生产经营活动的原始记载, 企业统计人员应定期收集企业各项生产经营活动的原始记录, 作为企业统计数据核算的基础和企业统计报表的来源, 统计原始记录还是企业财务核算的依据。

统计台账是企业统计人员把企业的原始记录汇总, 按统计指标的要求, 将每月的统计数据分指标的登记在账册中。统计台账可以将分散在企业各个部门的原始记录加以汇总登记, 是一种系统管理统计数据资料的方式, 统计台账可将企业统计人员整理原始记录资料的工作分配到各个月份完成, 同时还可以满足企业决策者日常经营管理的需要, 至每年年末, 企业统计人员可将统计台账中的各月数据进行汇总, 根据汇总数据填报企业统计报表, 保证企业上报的统计数据质量。

五、企业统计人员素质参差不齐

随着经济体制改革的不断深入, 企业基层统计人员流动性越来越高, 统计资料纷繁复杂, 统计知识体系更新较快, 这就要求统计人员在产品经济向商品经济过渡的时期, 要有商品化观念与竞争意识。但是, 目前中国企业统计队伍与社会主义市场经济要求还存在很大的差距。企业管理人员普遍认为统计只是简单的收集数据, 不需要拥有任何专业知识和专业技能, 这就造成企业统计人员的统计专业基础知识较差, 知识面不宽, 只是上级部门的报表员, 缺乏运用科学理论和现代化服务手段全面分析企业经营活动的能力。有些企业统计人员没有直接参加过生产经营的实践活动, 实践经验太少, 一般对传统模式下的统计资料收集、整理、分析、调查的工作程序还能适应, 但对现代企业经营策略、经营管理方面的知识相对薄弱, 对现代信息处理反应迟缓, 对企业经营机制转换缺乏强烈的市场竞争意识, 因此在企业统计工作实践中, 很难充分发挥统计工作的咨询职能。同时, 企业统计人员地位低下, 使得企业统计人员流动性高, 变更频繁, 使企业统计陷入了一个恶性循环。还有些企业统计人员, 不能严格依法开展统计工作, 法制观念淡薄, 存在一些统计违法行为, 为了逃避税收以及自身的经济利益, 上报的统计数据和实际差距较大, 出现了瞒报、迟报、拒报和虚报等现象。

摘要：当前, 企业统计工作的外部环境有了较大变化, 各种新经济组织的出现, 加剧了企业之间的竞争, 随着市场经济体制的不断完善, 新成立的私营企业、个体工商户的数量急剧增加, 使统计调查单位的数量也随之快速增长。但是, 这些企业往往存在不重视统计工作的问题, 对统计工作配合程度低, 支持率不高, 难以提供真实、准确的统计数据和资料, 篡改统计数据的现象时有发生, 难以保证上报的统计数据质量。

关键词：企业统计,数据质量

参考文献

[1]王庆丰, 党耀国, 王利敏.基于因子和聚类分析的县域经济发展研究—以河南省18个县市为例[J].数理统计与管理, 2009, 28 (5) .

大数据研究:现状、问题及趋势篇8

(一) 概念研究

早在1980年代, 阿尔文·托夫勒就提出过“大数据”的概念, 直到2009年才成为炙手可热的话题。大数据是一个抽象概念, 各领域对其定义各不相同。麦肯锡最早提出“大数据”时代已经到来。《著云台》的分析师团队将大数据定义为公司创造的大量非结构化和半结构化数据。中国人民大学的孟小峰院长从数据量角度认为100PB以上的数据则是大数据;2013年有相关学者认为大数据的概念准确的讲应该是指大数据技术, 指对海量数据的、新的、低成本的处理技术。总之, 目前对于大数据尚未有一个公认定义, 应基于大数据的特征来理解。

2012年3月Teradata公司张锦沧从四个维度来解释大数据的概念——三个V和一个C。三个V是指数据量大、数据种类多和数据增长速度快, 一个C指处理、升级或利用大数据的分析手段比处理结构化数据要复杂的多。同年10月国际数据公司IDC补充到大数据还具有价值性 (Value) , 其价值往往呈现出稀疏性。随后不久IBM公司又增加了真实性 (Veracity) 这一重要特征。

(二) 技术支持

对于大数据的搜集、整理、分析及应用都需要有相应的技术来实现与支撑。从技术起源来看, 相关学者认为最初大数据技术是指需要处理的信息量过大, 已超出一般电脑在处理数据时所能使用的内存量, 工程师们必须改进处理数据的工具, 这就导致新的处理技术的诞生。Google (2006) 自行研发了一系列云计算技术和工具来支撑其内部各种大数据的应用。基于此平台, EMC、Facebook、Oracle、VMware和Microsoft、亚马逊等又开发了诸如GFS、Map Reduce以及Big Insights产品的数据计算、数据收集等服务。英特尔 (2012) 随后开发了Hadoop分布式挖掘工具, 其本质是一个用于分析大数据集的机制, 不一定位于数据存储中, 可以扩展到无数个节点, 处理所有活动和相关数据存储的协调。2013年9月3日, 惠普在京推出了名为HAVEn的大数据分析平台, 此平台整合了多项惠普技术与Hadoop行业的解决方案。同日, 华为也发布了其大数据平台Fusion Insight, 能帮助企业通过数据挖掘发现全新价值点和企业商机。但目前相比而言业界主流的大数据平台产品还是Hadoop。下图为Intel公司的Hadoop开源分布式数据处理平台:

二、大数据的研究领域

(一) 金融行业

大数据时代到来, 首先引起全球高度关注的行业之一就是金融界。2011年麦肯锡全球研究所针对美国各行业应用大数据潜在价值提升做的一个评估结果中就提出未来金融界将在大数据技术中获得极大的价值提升。丁震表明中信银行选择了EMC提供的大数据分析方案, 发卡量2008年达到500万张, 2010年翻了一倍, 实现了实时商业智能, 同时也大大提升了营销水平。包括国金证券研究所、国泰君安证券研究所在内的多家卖方研究机构在对大数据进行深入调研后, 认为这或将是全新的投资主线。

刘启滨在探讨金融业的大数据管理时发现该行业存在大数据安全存储和有效应用的重要难题, 金融行业大集中将导致大数据激增。金融业业务种类和产品日渐丰富, 导致存储的数据类型更多, 数据容量暴增, 存储要求更高。从金融管理目标出发, 因为大数据容量极大, 保存就非常重要, 因此需要整合各种数据源, 建立集中的中央数据系统, 形成大数据规模, 创新管理方式和工具, 有效利用大数据本身的特点, 将NAS、SAN方式的存储管理逐步深入到金融行业的数据存储领域。同时他表示大数据正在从根本上改变着金融业业务模式, 可以分析客户交易数据, 建立一段时间的回溯模型, 并以此为基础消除客户的欺诈行为。

(二) 电商行业

在大数据时代, 电商系统的访问量在爆长, 大数据量必然成为电商系统面对的最大挑战, 其产生的数据无疑还会继续更新, 且只增不减。而对于电商用户, 除了功能以外, 电商系统网站的访问速度能否持续提供高质量、高稳定性的服务等都是影响用户使用感觉的重要因素。因此, 高珍、谢玉婧认为应对服务器和客户端的实现做相应的优化。他们主要针对数据库中大数据量处理的实现和数据库设计、数据库查询优化、算法优化以及高效的利用索引方面做了阐述。王雍认为在当今数据为王的时代, 电商具有大数据数据营销的天然基因和优势, 阿里巴巴就率先开启了大数据营销时代。同时珂兰钻石也意识到了大数据营销的重要性, 通过数据分析追踪用户网上的浏览轨迹, 从而帮助其更准确、更有效的投放广告。

三、大数据面临的问题

(一) IT技术架构无法满足大数据的技术需求

根据Scholar Space, 大数据的处理流程可分为:数据生成、存储、分析及应用。

存储方面, 企业的数据动则TB级的爆长, 对数据库的存储功能构成了挑战, 而半结构化和非结构化数据的大量涌现更加剧了这种挑战。因此, 大数据时代, 数据库技术必须不断进行演进, 才能支持更多的应用, 创造更大的价值。

分析处理方面, 大数据量给传统的分析技术带来了巨大的冲击与挑战。传统的数据仓库系统、BI、链路挖掘等应用对数据处理的时间要求仅以小时或天为单位, 但蔡汉辉表示在大数据时代, 要处理的数据量增长速度快、容量大, 而业务需求和竞争压力对数据处理的实时性、有效性又提出了更高要求, 传统的常规技术手段根本难以应付。

(二) 传统措施无法应对当前隐私安全问题

大数据时代数据的快速变化显然给隐私保护带来了新的挑战。孟小峰等人认为单个地点的信息可能不会暴露用户的隐私, 但如果将某人的很多行为从不同的独立地点聚集在一起, 他的隐私就很可能会暴露。邬贺铨指出可以利用海量数据, 不去追求个人隐私, 而是了解整个群体的趋势。但如果仅仅为了保护隐私就将所有数据隐藏, 那数据的价值将无法体现, 因此大数据时代的隐私性主要体现在不暴露用户敏感信息的前提下进行有效的数据挖掘。基于此分析, Agrawal R、Srikant R提出保护隐私的数据挖掘 (privacy preserving datamining) 这一概念。然而, 现有隐私保护技术主要基于静态数据集, 大数据环境下实现对动态数据的利用和隐私保护将更具挑战。

四、大数据发展趋势

(一) 技术发展方向

大数据存储技术最初是关系型数据库, 由于其规范的设计、友好的查询语言、高效的数据处理在线事务的能力, 长时间占据了市场主导地位。然而, 其严格的设计定式、为保证强一致性而放弃性能、可扩展性差等问题在大数据分析中被逐渐暴露。随之而来, No SQL数据存储模型以及Google提出的Bigtable开始风行。

大数据分析技术是以Google提出的Map Reduce技术框架来处理大规模并发的批量事务。利用文件系统存放非结构化数据, 不仅没有丢失性能, 而且还赢得了可拓展性。随后又不断出现了Map Reduce+GFS框架以及Hadoop。2013年惠普和华为分别推出了HAVEn与Fusion Insight大数据分析平台。毫无疑问, 这种态势将会持续下去, 在未来还会继续出现新的技术和工具, 如下一代数据仓库、Hadoop分发等。

(二) 市场发展趋势

就规模来看, 大数据市场潜力巨大。贝叶思咨询表示2012年大数据服务形成的市场规模达到近百亿美元, 到2020年该规模有望突破l000亿美元。

由于大数据市场还不成熟, 规模尚小的大数据专营公司才刚刚发力。然而, 就大数据市场而言, 最具冲击力的创新会来自于众多的专营公司, 虽然他们目前所占的份额并不大。有报告预测, 未来几年, 随着产品、服务支持以及销售渠道的逐步成熟, 大数据专营公司将会迎来快速增长期, 大数据市场将会迎来一个重要的并购时期, 而这些专营公司将会成为被并购的对象。IDC (2012) 预测未来几年Hadoop将趋于商业化, 也会有重量级的Hadoop商业化版本发布。针对大数据的一体化设备市场将迅速增长, 大数据还将创造出新的细分市场。

五、结论

大数据时代已经来临, 人们正被数据洪流所包围, 正确利用大数据给人们的生活带来了极大的便利, 但同时也有很多挑战需要去解决与克服。本文通过大量的文献搜集, 对大数据进行了全面分析, 然而经过分析发现:

1、大数据的开发与利用已在金融界广泛展开, 并产生了巨大的社会价值和产业空间, 然而对产生海量信息的新兴产业移动支付的相关研究却几乎没有, 因此有必要对此进行深入研究。

2、大数据的应用在电商网络零售还不成熟, 要想给消费者提供更高级更精细化更个性化的服务, 就必须进一步细致分析客户行为, 才能给商家提供更加有针对性的解决方案。

3、各领域虽然意识到大数据蕴含的商业价值并展开其应用, 但几乎没有对其价值回报进行评估。所以有必要将大数据在应用中的经济效益进行评估, 以权衡它的商业价值。

摘要：“大数据”是继“物联网”和“云计算”后IT界最炙手可热的新词。本文对大数据概念及其所涉及的技术进行了评述, 并阐述了大数据在金融和电商行业的研究现状, 在此基础上分析了目前大数据在发展研究过程中存在的突出问题, 针对这些问题提出了大数据未来的发展趋势。

煤矿监控数据集成问题的探讨篇9

近年来, 随着国家对煤炭行业装备的不断投入和改进, 煤矿企业基本建立了各种较为完善的煤矿生产监控系统, 基本实现了煤矿生产过程的全面监测和自动化控制, 实现了对现场环境参数和设备状态等数据的采集和处理。但采集的大量的监测数据都沉睡在各个生产系统的主机中, 未能发挥数据的应有作用, 而即使有系统对其数据作了一定的分析和利用, 但也只局限于其系统内部, 无法针对全矿的各种数据进行综合分析和利用。因此, 建立开放且一致的数据共享平台显得尤为重要, 而监控数据的集成则是该平台的基础和必要条件。本文将就煤矿监控数据集成中数据集成协议、数据集成方式、数据压缩和数据弥补等问题进行探讨并提出相应的解决思路。

1数据集成概述

煤矿监控数据集成是将煤矿现有在用的各个监控系统的数据通过一定的技术途径集成到一个共享平台 (即煤矿监控数据中心) 中, 将原本分散于各子系统的数据按照标准的数据集成协议经转换、采集、处理、存储等多个环节, 最后统一集中存储于公共的基础数据库, 从而将一个个数据孤岛整合成一个煤矿监控数据中心[1,2], 如图1所示。

2数据集成有关问题

2.1 统一、标准的数据集成协议

由于各监控子系统由不同的厂家设计、研发, 采用的技术和数据格式不尽相同。显然, 针对不同的系统、不同的厂家开发和设计相应的数据采集程序的方案较为复杂, 工作量太大, 因此, 必须提出数据采集的标准协议, 通过让各监控子系统按标准协议提供数据, 数据采集程序才能按照统一的格式采集各系统数据[3,4]。

协议的制定需要考虑以下几个方面的问题:

(1) 协议的适用性

协议内容应覆盖不同系统各种类型的业务数据, 确保各系统的所有数据都能集成进来, 比如按模拟量、状态量等分类定义数据描述信息等。

目前, 市场上采用的协议主要来源于原来安全监测系统的联网协议, 由于当初协议的制定只限于安全监测系统, 存在一定的缺陷和遗漏。比如上面提到的适用性问题, 原来安全监测系统中开关量只有开停2种状态, 而现在多需要支持故障状态, 变成了3种状态, 这样, 原有的协议就无法满足要求。事实上, 通过对煤矿大多数系统的研究和分析, 3种状态也不能满足要求, 为了使协议适应更广泛的系统, 协议中将开关量修改为状态量, 可以支持多种状态的描述。

(2) 协议的一致性

虽然监控子系统多样, 但采用的数据接入协议应一致, 这既简化了子系统厂家按协议提供数据, 又便于煤矿监控数据中心的数据接入。

(3) 断点续传特性

由于集成的数据来自不同的应用主机, 受应用主机稳定性、网络连接可靠性等因素的影响, 数据采集可能存在中断现象。为保证数据的连续、可靠和准确, 协议应支持断点续传特性, 确保在应用主机或网络连接恢复后, 中断期间的数据仍然能够传输至煤矿监控数据中心。

目前, 多数协议未考虑到断点续传问题, 一旦发生网络故障、采集程序故障等问题, 就会丢失数据, 影响数据的完整性。

随着应用的发展, 数据集成协议也许还会出现不适用的地方, 需要在实际项目应用过程不断改进和完善, 为数据的有效集成打下坚实的基础。

2.2 数据的集成方式

对不同的监控子系统所提供的数据集成方式也有所不同, 目前常用的数据接入方式主要为文本文件方式和OPC方式。

(1) 文本文件方式

各监控子系统根据约定的数据集成标准协议, 生成相应的文本文件, 集成方读取和解析文本文件, 将数据采集到煤矿监控数据中心。

文本文件方式的优点在于协议容易理解, 各监控子系统厂家容易编写出相应的数据转换程序, 生成的文本文件可以直接阅读, 便于问题的排除和区分。而其缺点主要是由于通过磁盘文件来交换数据, 数据的传输效率较差。

(2) OPC方式

OPC协议是开放的工业标准协议, 用于不同系统间的数据交换, WinCC、Intouch、IFix等主流工控厂商的组态软件都提供了标准的OPC数据访问接口。 OPC是基于微软DCOM技术构建, 数据传输效率较高, 响应速度快, 但由于DCOM的缺陷, 针对OPCServer端的安全配置较为繁琐, 跨防火墙访问也存在问题。为解决这些问题, 也可以采用一些第三方产品, 比如MatrikonOPC Tunneller、OPCDataHub等, 可以实现跨防火墙访问、DCOM零配置等[5], 如图2所示。

(3) OPC UA方式

OPC UA, 即OPC统一架构, 支持开发的Web服务标准, 跨越Windows、Linux等不同的系统平台, 同时OPC UA将现存的20多个分立的OPC规范予以整合, 建立了统一的规范架构。这一架构定义了由OPC UA底层服务、DA (数据访问) 、A&E (预警和事件) 、HDA (历史数据查询) 、CMDs (复杂数据) 等OPC信息模型, IEC、ISA、EDDL等标准规范以及供应商信息构成的4层模型等, 建立起跨越控制、ERP、CRM、PLM等不同层结构的标准信息接口。OPC UA不但解决了传统基于DCOM技术的弊病, 同时还保留了较高的数据传输效率, 是一种比较理想的数据集成方式[6], 如图3所示。

2.3 数据的压缩

随着煤矿生产监测系统的不断完善和增多, 产生的监测数据也越来越庞大, 如果没有高效的数据压缩技术, 建立煤矿监控数据中心将比较困难。由于生产过程实时数据都是秒级甚至毫秒级数据, 如果采用传统的直接采集存储方案, 将会占用大量的存储空间, 大大增加存储成本并极大地影响系统处理效率。生产过程的原始测量数据中包含大量的冗余和不相关信息, 在保留过程特征信号的基础上剔除冗余和不相关信息, 就可以实现数据压缩。数据压缩的本质是数据变换, 它是在压缩比和信号保真度或逼近误差之间寻求一种折衷的方法。过程数据压缩方法基本分为3种, 即分段线性方法、矢量量化方法及信号变换法。而分段线性方法又包括矩形波串法、向后斜率法、SDT (Swing Door Trending, 旋转门) 法及PLOT法。

由于过程数据大多是缓慢变化的数据, 采用分段线性化的方法可以很好地表示历史数据的变化趋势, 在工业过程中应用最多的是SDT方法, 它的突出优点就是算法简单、执行速度快。国外知名的实时数据库PI以及部分组态软件厂家iFix等都基于该算法来进行数据的压缩处理[7,8]。

2.4 数据的弥补机制

在数据集成的过程中, 可能存在各种原因引起数据丢失情况, 比如现场传感器故障、监控子系统主机故障等, 为了给数据分析提供完整的数据, 需要考虑数据的弥补机制[9]。

弥补的途径和方法如下:

(1) 通过前后关联传感器的数据以及数据之间的关联模型, 推算出相应的缺失值。比如工作面瓦斯, 可以根据上隅角或回风流瓦斯之间的关联模型来进行推算, 而该数学模型可以通过正常情况下一段时间内的历史数据, 分析和建立两者之间的数学关系, 为数据的弥补提供依据。

(2) 通过传感器过去的值以及相关设备的运行状态, 推算出相应的缺失值。

根据缺失数据时间段的设备运行状态以及其它相关参数, 在该数据历史数据中寻找类似的现场状况下的数据。

比如工作面瓦斯浓度, 其影响因素主要有采煤机的开停、风速等, 那么类似环境下的历史数据则可以弥补缺失的瓦斯浓度数据。

(3) 如果是数据集成环节的问题, 可以通过数据库、断点续传等方式获取缺失的数据。

3结语

煤矿监控数据集成是煤矿监控数据中心所有数据的来源, 是煤矿监控数据中心的基础功能。通过对数据集成有关问题的分析, 在统一数据集成协议的基础上, 以文本文件、OPC等多种方式, 可以方便、可靠地采集来自各个系统的数据, 再经过简单高效的数据压缩算法, 在保证数据准确的前提下, 大大减小了数据的存储容量, 提高了系统运行效率。对于数据集成过程中可能存在的数据丢失问题, 针对不同的原因, 采取相应的数据弥补措施, 提高了数据的完整性。在数据采集到数据中心后, 下一步需要针对这些数据作综合利用, 充分挖掘数据的内在价值, 为煤矿的安全生产和高效经营提供决策依据。

摘要：监控数据的集成是煤矿进行数据综合利用的必要前提。文章探讨了煤矿监控数据集成中的数据集成协议、数据集成方式、数据压缩和数据弥补等问题, 并提出了相应的解决思路。

关键词：煤矿,监控系统,监控数据,数据集成,集成协议,数据压缩,数据弥补

参考文献

[1]王付坤.矿井综合信息集成系统的设计[J].工矿自动化, 2011 (8) :104-106.

[2]熊萍, 余忠林.基于Web的矿山企业异构数据库集成系统研究[J].工矿自动化, 2005 (6) :9-11.

[3]韩晓冰, 田丰.数字化矿山中异构数据集成研究[J].煤炭科学技术, 2009 (3) :87-88.

[4]吴义祥.煤矿综合自动化系统的研究[J].工矿自动化, 2010 (9) :152-154.

[5]王勇, 宁祎.OPC Server在KJ95N型煤矿综合监控系统中的应用[J].工矿自动化, 2010 (8) :105-106.

[6]苏延召, 李艾华.基于OPC UA的自动化系统集成技术研究[J].测控技术, 2011 (3) :68-71.

[7]拓广忠, 慕群.实时数据库原理及其压缩技术分析[J].华北电力技术, 2004 (6) :19-22.

[8]华钢, 朱二莉, 闫军华.煤矿安全监控系统历史数据存储压缩算法研究[J].工矿自动化, 2005 (4) :8-10.

浅谈统计数据质量问题篇10

(1)统计数据失真。统计制度不够完善是造成统计数据失真的内在因素,表现在:统计部门内部各专业在统计方法、指标涵义、口径上还存在一定程度上的不统一;专业间统计方法改革不同步;统计范围、口径的理论值与实际值出入有时还比较大;统计与财会在核算周期上还存在一些差异,并且在统计数据质量管理上,各级统计管理部门在统计执法过程中力度不够,对统计过程缺少制约与监督,对统计数据缺乏校验与复查的有力措施。

(2)设计时需求不明确,缺乏远见。数据库与文件管理系统的重要区别之一在于不仅存放数据,而且存放数据之间的相关性。相关性不仅表现在数据依存的时间、地点、类型和名称等原始属性上,还会在数据的转移过程中产生再生的相关性。搜集数据阶段使用的方法不正确,应用需求不明确等都会影响数据完整性和准确性。

(3)数据处理手段发展不平衡。数据处理手段出现从基层的手工操作到省、国家一级政府统计数据处理的高度信息化。就地域而言,占全国70%以上的地方统计数据处理是手工操作或半手工操作,速度慢、效率底,可靠性差,这与统计的及时性要求不相符合。统计所反映的当前经济现象的真实性难以确定。

(4)质量管理监督措施不够健全。由于多数检索系统没有进入实际应用阶段,数据质量的控制和监督往往被人们忽视。绝大多数单位在数据准备、录入阶段缺乏审核等质量控制、监督措施,著录标引的检查,一般采取自己审核或互相审核的方法。缺少科学的统计数据质量评估和监控,造成统计数据不同层次脱离实际的偏差,给决策带来极大的不便。

(5)统计人员队伍素质不高。基层统计工作薄弱,统计手段落后;统计人员素质比较低,统计人员变动频繁,统计队伍不稳定都影响了统计数据质量。

在目前我国统计数据质量管理中,以单项数据质量管理为主,缺乏综合的、全面的质量管理体系;对数据质量内涵的理解相对来说仍较为狭隘,在实践中主要围绕着数据准确性进行评估,对数据质量的其他方面重视不够;在评估过程中,没有让社会公众和用户充分参与进来,评估机制缺乏必要的透明和有效性,未能取得社会各界对数据资料的充分理解和认可;对于多种经济成分的数据质量评估方法不够明澈;缺乏明确的数据质量管理要求和目标。

从数据质量管理的角度来看,我国统计数据质量管理存在诸多问题的原因在于:

(1)统计数据质量理论及其控制技术与政府统计实践脱节。各种统计数据质量控制技术在我国的实际统计工作中的研究和应用不多,对于经常性统计数据质量控制,实际上还主要是采用事后的分析评估和挤水分的方法,而事前的分类预防控制不多,建立误差模型进行分析的也不多,所应用的仅有的一些事后质量控制技术和统计数据质量管理的组织活动没有实现很好的结合,虽然指定了主要统计数据质量的评估方法,但具体方法的应用、由哪些部门负责以及这些部门的质量责任、职权和义务并不明确。

(2)统计数据质量管理中的全面质量管理并不全面。全程性上,只重视调查环节,不重视统计设计环节对数据需求的研究,从而影响数据相关性、及时性的提高;全域性上,所实行并取得很大成功的统计数据全面质量管理的措施及经验,主要集中于几个专项的普查,应用范围较窄;全员性上,只重视统计系统内部的人员控制,而对统计系统外部的,占统计工作人员2/3的基层统计人员却无从控制。

(3)缺乏明确的质量管理目标和统一的质量管理规范。对统计数据质量管理缺乏明确的质量方针和质量目标,缺乏相对统一的统计数据质量管理标准和规范,导致了统计数据质量的混乱。

(4)控制措施与事后评估结果及发现的问题没有很好结合。统计是一项循环往复的过程,因此每一次新的修订统计设计都应反映出上一次数据质量评估的结论以及质量改进的要求。但是从公布实施的统计调查制度上看,事先的控制措施,如填表要求中的平衡关系,逻辑审核关系用于质量控制的设计内容较少。

多年来,国家统计局一直把统计数据放在首要地位,通过不断努力与实践,摸索出一套方法,即一靠科技,二靠法制,对统计数据实行全面质量管理。在此,结合专家学者对统计数据质量管理的研究,笔者就提高统计数据质量管理的对策,提出一些自己的看法。

(1)搞好统计调查方法的改革是提高统计数据质量的前提。国家统计局在《国家统计制度的总体方案》中提出了我国统计调查方法改革的长远目标,即“建立以必要的周期性普查为基础,以经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方案体系”指明了抽样调查作为新统计调查体系的主题,精简全面统计报表。要提高统计数据质量,必须推广抽样调查方法的应用,它避免了对总体单位的逐一调查和较多的中间环节,在较大程度上减少了各方面对统计数据在调查过程中的干扰,因而使得调查的数据较符合客观实际。它具有事先计算及控制抽样平均误差和便于对样本指标进行检查,避免调查工作中间环节的弄虚作假的特点。可以大大提高统计数据的准确性和及时性。

(2)强化统计基础工作是提高统计数据质量的保证。首先要搞好统计调查表的设计。基层综合统计部门应根据上级部门和本单位生产经营管理的需要,会同会计等部门统一设计内部套表,在设计中应体现新的国民经济核算体系,各指标之间应相互联系,相互配套,统计指标的涵义、范围、计算口径应一致。统计表的设计,统计分类标准和各种编码应当统一,以适应计算机整理、汇总、分析的需要。新的统计报表的采用,可以克服基层统计工作中存在的杂乱、重复、矛盾等弊端,也有利于报表的规范化、系统化,更有利于统计数据的准确性。其次,实现原始记录、统计台账的标准化。我们知道,原始记录是业务核算、会计核算、统计核算的共同基础,只有这样才能使三种核算结果相互衔接,口径一致,而要保证核算数字的准确性,要求核算的数字来源,都有真实的原始记录为依据。从原始记录开始一直到整理、场内报表及三种核算,数字来源通过逐级加工,都是有据可查的。只有这样核算,数字的准确性才有确切的保证。

(3)加强统计法制法规建设是提高统计数据质量的法律保障。在统计工作中,主观随意性是影响统计数据质量的重要因素。领导者的法制观念和对统计数据质量的重视程度以及统计人员的综合素质,对统计数据质量有着直接的影响。只有具有强烈的事业心和责任感,具有高度的统计法制观念,具有基本的工艺技术知识和统计技能的统计人员,才具有做好统计工作的前提和基础。因此,要加强统计法制建设,健全统计法规,防止某些领导和统计人员对统计数据弄虚作假,要确定统计犯罪的界限,作出良性的具体规定,以强化统计法规的法律效力和约束力。应通过典型案件的查处和暴光宣传《统计法》,引起全社会的关注,提高社会公众的法制观念和执法自觉性,使《统计法》真正成为提高统计数据质量的法律保障。

(4)提高统计人员的业务素质是提高统计数据质量的关键所在。统计数据质量与统计人员的业务素质和队伍稳定有直接的关系,统计人员是提高统计信息最基础、最原始数据的源泉,因此,为了提高统计人员的业务素质,必须搞好他们的上岗和在岗培训,要实行“统计员资格”考试制度,达到合格标准并取得上岗合格证方可上岗。要提高统计人员的统计分析能力,掌握多种使用统计分析方法,例如聚类分析法、判别分析法、回归分析法、相关分析法、主成分分析法等。其次还要提高统计人员对现代统计分析软件的应用能力做到“一专多能”。依靠科技手段快速提供高质量的统计数据。企业还应按规模大小、统计业务的难易程度,配备有一定统计职称的综合统计人员,以提高统计工作质量,保证统计数据的准确性。

(5)用科学的统计分析方法对数据质量评估是提高统计数据质量的方法保证。首先,可运用抽样调查法推断总量指标的准确性,它是对全面报表、普查、重点调查的基层统计数据或汇总统计数据进行可靠性检验或误差判断的科学方法。其次,运用回归分析法检测统计数据的可信度。例如,在对汇总数据的评价中,可利用回归分析,发现矛盾,提高数据的可靠性,并可用计算机建立模型,对各类数据纵横比较,以确定其质量。另外,还可用主次因素排列分析图、因果分析图来分析各种统计数据质量。在多种经济成分的统计数据中,要寻求一种能够多因素同时考虑的方法,不能只局限与一些单一因素的评估方法。例如运用模糊评价法等。要加快成立相对独立的专门从事统计数据质量评估的社会终结组织结构,确保统计数据评估的独立性和公正性。

(6)加大新的统计技术的应用是提高统计数据质量的必要途径。计算机技术不仅可以实现数据处理高速化、数据传输网络化、数据贮存资源化,从而降低统计数据在人工处理、传输、贮存等环节上的技术性误差和逻辑性差错,而且有利于从机制上形成强有力的统计质量管理体系,维护统计数据管理相对独立性并有效地遏止随意虚报、瞒报以及统计数据质量的其他腐败行为。

总之,提高统计数据质量是统计工作的永恒主题,要在明确什么是统计数据质量的基础上,抓住影响统计数据质量的关键,采取切实有效措施,最大限度地保证提高数据的质量,确保统计三大职能的发挥。

摘要：提高统计数据质量是统计工作的永恒主题,文中分析了我国统计数据质量上存在的问题与原因,进而提出提高统计数据质量管理的对策。

数据问题篇11

“你注意到没有，每个人的手机都变成采集器了。”这位数学专家很清楚阿里巴巴等商业公司的大数据发展异常红火。手机拥有者刚显示出对某个商品表示兴趣，30秒钟之内精确的广告就会投放过来。

李根国所在的超级计算中心一直为高精尖的科研项目提供模拟和运算的平台。2014年，上海大数据中心将在超级计算中心挂牌。李根国介绍说，政府主导的大数据将会有广泛的用途。除了人口管理外，还有空间管理，绘制城市地图，建立导航系统。上海市成立了一个和航天局合作的北斗应用有限公司，注册资金两个亿，推动北斗应用落地。在相应的信息系统里，有了传感信息后，救护车、公交车走到哪里了，管理者看得清清楚楚。此外，用大数据搜集经济运行的数据也改变着传统的政府统计。从抽样调查抽取几个样本到大数据的全样本，管理系更强，更准确。

像上淘宝一样挂号看病

何萍所在的上海申康医院发展中心，就是大数据用于公共服务的典型范例。

“我们的医疗预约平台每天产生的数据是P级。”申康医疗事业部的高级工程师、医联中心主任何萍说。1P相当于20万部5G大小的高清电影。

据何萍观察，老百姓通常是一大早看病，但往往是早上出门，真正看上病已是下午，挂号排队太慢了。有时没看上，一天就要跑几家医院。而现在，挂号可以仅需一部手机。

何萍所在的申康团队指导开发的上海三级医院预约平台上有上海所有区县的38家医院的专家信息，精确到哪个科、哪天排班都清楚可查。市民可以直接预约感兴趣的专家，预约精确到一个小时，不用过分排队。每次挂号信息的变动就会进入HIS（医院信息系统）信息里，预约成功短信知会。医保卡一刷实时互通。

市民在联网的任何一家医院看病，医生都可以在数据库中调出住院小结和处方等患者信息，医院之间并无壁垒，信息联通包括影像互认。比如病人在某家医院做过CT，在另一家医院看病时，片子和报告会详细地显示出来。如果医生判断病情并无特别需要再做检查，比如CT显示在一个月内，他可以直接以这份非本医院的报告作为诊断依据，免去病人再受辐射之苦。

“医疗专家是紧缺资源。有时候老百姓只认大牌的专家，其他的都不知道。这就是医疗信息不对称造成的，也是通过平台可以改善的。”何萍说。他们参考淘宝的做法，为预约的市民推荐“你同样喜欢”。在有号的情况下，市民可以同步选择同类医疗专家。看完病还可以打星和评价。比方病人都想看血液专家吴孟超，但他90多岁的人了，一周就来一次，何萍他们就会推荐吴孟超的学生和师弟师妹，也都是很好的专家，患者满意，医院也实现了分流。

最大的突破还是在管理机制上

李根国认为，政府主导的大数据服务将更侧重对社会管理提供公共服务。在他看来，大数据未来发展面临的壁垒，更多来自于技术之外。他发现，一个人的基础人口数据有五十几个字段，包含年龄、性别、社保，户籍等信息。各主管单位各自掌握，往往并不共享，一个人的信息在一处更改后，在另一处不能同步更改，就会造成很多麻烦。而基层街道、区县需要弄清楚自己小区内的户籍人口，流动人口以进行管理，但却无法从掌握数据的上级部门获得相关数据。

在医疗系统工作多年的何萍觉得，最大的突破还是在管理机制上。

医疗领域多年来有着固有的思维，医院各有所属互不相认，这曾经是“搬不动的大山”。上海市基于电子信息档案的卫生系统工程，是国内首例采用美国HIS标准来运行的信息平台。这个项目在2006年启动，2008年23家市级医院联通起来，2010年卫生部和总后勤部所属的10家医院也加入进来，紧接着连接着的是4家郊区医院和属于宋庆龄基金会的医院，形成了现在38家的规模。

从社区医院一层层打通到一二三级医院，数据不能有断档。打破信息的壁垒，也对医院的管理规范提出了更高的要求。排班涉及科室、病房、门诊、查房，合理协调好以后需要提前一个月上传平台。预约精确到一个小时，牵一发动全身。一旦要变更，要把短消息及时推送出去。

“大数据在带来我们产业发展的时候，怎么防止不法分子利用？系统安全是第一位的。包括运行的物理安全，和信息安全。”李根国说。

而为公共服务时，管理上的疏忽有时会带来安全隐患。

接受采访前一天，何萍就接到一个患者的投诉电话：他的乙肝病人身份在社区医院看小毛病时显示在系统上，病人既尴尬又愤怒。实际上，系统早有规定：为了避免歧视，对于传染病的一些数据共享要求是有严格保护的，只有在问诊相关病症时才会有所显示。但在一二三级联动过程中，数据推到基层，区里没有管理好。

“上层设计好了，技术才有支撑。”何萍感慨说。这个本科硕士都攻读信息工程的标准工科女，博士选择了管理学。

大数据是台综合大戏

2003年，从测绘专业毕业的毛炜青在一线工作了一段时间以后，3天内开发完成了一个基于服务的带有GIS分析功能的地名处理软件工具，在民防办信息中心的服务器上运行，这个基于地理位置的系统为当时社会管理者提供了整个上海市的流动与常驻人口的信息地图。

“地理信息本来就是综合的。”这位上海市测绘员基础信息地理中心的总工程师、国家注册测绘师对中国青年报记者说。在测绘一线工作时，他需要对测绘地的地质、水文甚至建筑、文化都有所了解才能做到精确。而如今，他越来越多地需要与其他政府部门合作，将地理信息与人口等信息相连。据他介绍，随着一个个CBD的兴起，现在的行业新热点是获取楼内的位置信息，用数据再造一座虚拟的热闹大楼，方便火灾监控等一系列的社会管理。

他的团队并不需要如阿里巴巴等商业公司一样，24小时在线为涌进来的数据准备着，他们所做的工作主要是利用超强的计算能力，汇集和加工数据。首先，从网络上搜集的和政府提供的数据。通过技术和人工的手段来甄别：哪些有用，哪些是垃圾；接着，对汇集的数据以应用的不同进行分类，打上标签，用特定的关键字就能查到。

何萍团队近期的工作是与银联的合作。从2010年起，上海许多医院开始推行各自的充值卡，用于院内消费。和银联合作后，一张卡可以在所有医院使用，既方便患者看病，又减轻窗口工作量。卡片轻松一划完成交易，需要涉及银行之间、医院之间划拨与结算。

“我们自己做一套结算体系，既费精力，又不专业，这需要行业间的融合。”何萍说。巧的是，在不久前的一次科研性奖项的竞争中，这两家是对手。

数据中心空调设计问题解析篇12

一、数据中心空调系统现状

数据中心的环境设计要考虑诸多因素。IT设备大多运行在高能耗的条件下, 此外室温、湿度以及和空气流通等环境因素都对设备的稳定运行和使用周期有着较大的影响。

数据中心机房设备的空调系统设计要优先考虑下列特征:设备的稳定可靠性。水冷或者风冷设备能长期稳定运行, 提供机房设备适宜的温湿度环境;功能灵活性。空调系统在建造时, 应考虑整个机房空间的合理布局;节能环保性。空调系统能运行在较低的能耗状态, 实现高效低能耗的节能环境调控方式。

由于数据中心机房典型的发热功率大而散热去湿能力弱的工作特征, 并且处理大量数据量的机房设备对周围环境的变化十分敏感。因此, 有必要提出合理的节能优化改造方案, 安全稳定的前提下最大限度降低能耗, 制定恒温调节设备以及制冷通风散热系统的最佳节能方案。

二、现阶段的空调系统设计主要面临下述问题

2.1不合理的机房设备配置

不合理的机房设备配置, 是现阶段的空调系统设计的一个主要问题。数据中心部分机房内部安装和设计空调时, 对整体的布局规划欠缺统一的考虑, 缺乏对硬件设备工作温湿度的认知, 严重浪费大量的能源。这些空间布局的不合理, 将直接或间接的导致室内热量的损失, 降低空调的实际使用性能。由于数据中心的机房配置方面不合理, 使得部分空调设备的恒温和去湿功能相互间难以协调配合, 譬如在空调系统冷风散热时, 常常因为空气中水分子冷凝带来了除湿的问题, 这就进一步影响了机房环境湿度, 导致空调系统既要通过送冷风实现降温去湿, 还有同时保持环境温度而加湿, 矛盾的工作状态加重了整个系统的能源开销。

2.2数据中心机房气流组织

数据中心机房气流组织, 目前的相关设计还不够科学、合理。数据中心机房空调系统的搭建要考虑到IT设备对散热性能的要求, 合理布局室内空间, 方便气体流通散发热量。在一些机房的气流组织上, 存在下述问题:由于机房天花板高度设计不当, 在机柜设备的上方存在热空气短路现象;此外, 由于在数据中心地板下部署的水冷装置不利于空气流通, 造成热量阻塞, 部分机房由于空间高度有限, 不能建造高位置的排风通道, 空调设备排风散热效率远远低于预期效果。这些空调设计的问题, 如果不能得到科学、有效的解决, 将会对空调系统的整体性能造成严重的影响。

2.3机柜设备布局

数据中心的空调系统设计中, 对于机柜设备布局方面的设计还存在一些问题, 不够科学、合理。由于部分机柜的面板是左右流通式, 会形成热通道到冷通道的连接, 造成不利影响;机架之间距离紧凑并且采用了前后顺序排列的位置布局, 那么就会使得设备之间相互吸收排放的热量, 形成冷热空气短路, 降低散热排风能效;此外由于数据中心机房内设备、缆线多, 造成整个机房内部空气不流通。

另一方面, 搭建数据中心的空调系统与其他环境相同, 都需要考虑容量大小的问题。保证并维持机房内部的温湿度在一个较小的范围内具有不小的难度。而如果环境的空调容量控制得不得当, 也同样会给冷却散热加重负担。过高或者过低的容量都将造成温湿度变化波动范围过大, 影响设备的正常运转。

三、数据中心空调系统节能方案

针对上一章节中提出的当前数据中心环境中空调系统设计需要考虑的问题, 本节将在遵循能够保证正常的温湿度环境指标的前提下, 兼顾设备运行的安全性和稳定性, 实现最大化地能耗降低。

3.1优化空调水冷和风冷模式

优化空调水冷和风冷模式, 是数据中心空调系统节能设计的一个重要举措。在设计改造方案时, 可以合理提高机房内部相对温湿度标准, 进而通过高的水冷温度实现制冷效能的提升。可以针对不同的环境条件选择合适的供冷模型。对于小型机房可以使用风冷分离的直接蒸发式空调系统。对于室外温度变化的场景, 可以部署集中水冷系统, 在低室外温度下, 可以实现机房内高温度气流无偿制冷的效果。在高室外温度下, 可以通过设备倒换, 切用制冷系统。此外, 还可以分离温度和湿度调控, 进一步实现不增加除湿难度的冷却能效。目前相关的技术主要有机械制冷和蒸发冷却的方法。前者涉及低压缩比的制冷设备, 后者的部署收环境因素限制, 常常应用在气候干燥的环境条件中。

3.2优化机房气流组织

优化机房气流组织, 也是数据中心空调系统节能设计的一个重要方面。需要结合数据中心机房环境的搭建, 慎重考虑空调冷却系统的排风方式。有效的排风方式能加速数据中心环境内气体流通、加速散热过程, 同时能避免局部过热的现象, 平均数据中心的环境温度。

设计上可以选择上送风和下送风两种方式。前者冷风将机房机柜上方的热量携带走, 送至室内下部, 实现散热制冷的效果;后者的主要方法是合理抬升地板高度至一理想位置, 在地板下构造架空区域, 空调冷风通过架空层送往机房内部, 并最终通过机房顶部空间散发热量, 实现循环制冷的效果。回送冷风的方式可以结合数据中心实际施工情况选择开放式或者管道式以及相互间融合的方法。

3.3合理的机架设备布局

合理的机架设备布局, 对于节能设计具有重要意义。数据中心内放置着高密度的机房设备, 需要优化摆放布局、选择空调系统和设备的合理安装位置。在布局上应该避免传统的所有机柜朝向同一面放置的情形, 可以优先考虑邻近的机柜之间相向摆放或者背向摆放的方法。这样的布局中, 机架之间的冷热通道能合理分离冷热气体, 有效地避免了散发热量被其他设备再次吸收的情况, 大大提高了散热效果, 进而节省了空调系统制冷散热的能耗。此外, 还可以在空调系统的热通道设计上采用物理上的软隔绝方法, 进而避免了冷通道和行人通道遭到散热排风的不利影响, 保证了散热系统的工作效率。

总之, 本文主要面向数据中心空调系统节能设计的问题, 分析了现有机房空调系统在布局、气流组织等方面的不合理因素, 并结合实际施工改造, 提出了设备节能、气流组织优化和自然冷源合理利等方法, 改造数据中心空调系统设计方案, 以期实现高效节能的制冷散热效果, 进而提升经济效益和社会效益。

参考文献

[1]ASHRAE TC9.9.美国采暖制冷与空调工程师学会数据中心系列丛书1~7[M].杨国荣, 胡仰耆, 沈添鸿, 等, 译.北京:中国建筑工业出版社, 2010.

[2]GB50174-2008电子信息系统机房设计规范[S].

[3]周航.电信机房空调送风方式的选择与设计[J].制冷与空调, 2009 (6) :67-71

[4]何钟琪, 黄霞.上海地区数据中心空调系统节能措施探讨[J].暖通空调, 2011.41 (8) :3-6

[5]蒋雅靖, 刘刚.数据机房不同下送风方式的模拟分析及对比[J].建筑节能, 2011, 39 (1) :18-20

[6]中国有色工程设计研究总院.采暖通风与空气调节设计规范[M].北京:中国计划出版社, 2004.

【数据问题】推荐阅读：

数据问题

数据问题篇1

1. 审核数据量大。

2. 目录数据表格式与数据库文件格式匹配问题。

3. 电子文件关联项重复。

1. 操作简易。

2. 准确性高。

3. 效率较高。

1. 提高智能化程度。

2. 提高校验精细度。

数据问题篇2

SSD的数据安全问题篇3

数据问题篇4

校舍数据录入常见问题篇5

企业统计中数据失真问题研究篇6

我国企业数据质量问题分析篇7

大数据研究:现状、问题及趋势篇8

煤矿监控数据集成问题的探讨篇9

浅谈统计数据质量问题篇10

数据问题篇11

数据中心空调设计问题解析篇12

本站热搜

相关推荐

数据问题

数据问题 篇1

1. 审核数据量大。

2. 目录数据表格式与数据库文件格式匹配问题。

3. 电子文件关联项重复。

1. 操作简易。

2. 准确性高。

3. 效率较高。

1. 提高智能化程度。

2. 提高校验精细度。

数据问题 篇2

SSD的数据安全问题 篇3

数据问题 篇4

校舍数据录入常见问题 篇5

企业统计中数据失真问题研究 篇6

我国企业数据质量问题分析 篇7

大数据研究:现状、问题及趋势 篇8

煤矿监控数据集成问题的探讨 篇9

浅谈统计数据质量问题 篇10

数据问题 篇11

数据中心空调设计问题解析 篇12

本站热搜

相关推荐

数据问题篇1

数据问题篇2

SSD的数据安全问题篇3

数据问题篇4

校舍数据录入常见问题篇5

企业统计中数据失真问题研究篇6

我国企业数据质量问题分析篇7

大数据研究:现状、问题及趋势篇8

煤矿监控数据集成问题的探讨篇9

浅谈统计数据质量问题篇10

数据问题篇11

数据中心空调设计问题解析篇12