数据标识

2024-10-17

数据标识（通用5篇）

数据标识篇1

大数据[1]一定是人类进入DT时代的关键技术, 也将是人类实现人工智能的关键技术。自大数据概念[1]提出以来, 大数据的重要性和大数据的开发与使用已经得到各国政府、各界人士的高度重视[2,3]。大数据研究也方兴未艾、如火如荼地开展起来。如何开发好和利用好大数据是摆在所有人面前的一个非常急迫和现实的问题, 笔者在医科院信息所工作中有一些思考, 也发表过一些论文阐述自己的观点, 其中《互联网医学的未来:数据医学》指出的是医学大数据应用的未来及方向, 《大数据及其应用前景研究》论述的是大数据的二元概念及更适合的应用方向;笔者认为大数据是个二元概念, 一个是大量的数据, 一个是大数据技术, 文中除了特别强调外, 写到的大数据都是包含以上二元概念。

1大数据开发应用需要一项新技术

目前大数据应用还处在启蒙和探索阶段, 能够成功落地的项目不多。大数据是一种以数据为资源的高科技, 数据在大数据中的地位相当重要, 其一, 拥有资源数据本身就是不容易做到的事情;其二, 拥有资源数据还要有使用数据的想法、数据目标和数据技术。能够拥有以上所述中的一点已经很难了, 大数据项目落地则需要拥有以上两点, 这可能也是大数据项目目前落地少的原因。需要第一点大数据资源数据的各单位有其各自的解决办法, 这里不讨论获得数据的方法, 只谈谈第二点中大数据准确应用的一些方法。

大数据是人类发展的第五个阶段, 第一个阶段:农耕时代;第二个阶段:工业时代;第三个阶段:电汽时代;第四个阶段:IT时代;第五个阶段:DT时代;第六个阶段:AI时代-人工智能。梳理一下人类发展的进程可以看出, 人类的发展是由人力的简单粗放开始, 逐渐发展为机器代替体力, 精细的电汽文明逐渐代替简单粗放工作, 解放了人类的双手, 随后计算机的发展代替了人脑部分功能, 人类进入了IT时代。简单看以上人类发展进程:人类科技的发展是由简单粗放到精细准确, 由机器代替人工的进程。进入DT时代的大数据技术应该是更精确、更高级的技术, 数字是最精准的表达方式, 数字集合出来的数据也应该是最精准的表达方式, 事实上不是这样简单。

由大量数字或是数据进行运算, 可以得到精确结果的方法是统计学, 应该叫做大统计比较好, 不是大数据。

2大数据精准使用需要“数据标识”

2.1“数据标识”的原理和方法

人类科技发展是向着更精准、更智能化的方向发展, DT时代的大数据是可以满足人类更精准和更智能化的需求。前面提到目前大数据落地项目少, 尤其能够产生价值的项目少, 归纳为不能很好地使用大数据是相当重要的原因, 大数据是数据在模型中准确应用的科学技术。好的模型制作相当重要, 但数据的理解也非常重要。理解好大数据中的数据才能很好地使用数据, 才能做好大数据。在《大数据及其应用前景研究》中笔者写到过数据的理解是每个人的知识水平决定的。理解好大数据的数据还要掌握如何使用数据的技术, 这种使用数据的技术是需要把数据精准地放入大数据模型上在计算机中运行, 输入精准数据才能有精准运算结果, 做到数据精准使用必须学会“数据标识”。

“数据标识”是笔者在做医信天下医学大数据医院排行榜的思考和心得, 这里同大家分享和探讨。“数据标识”的方法是笔者在中国医学科学院医学信息所做医学数据库工作方法的延伸。查阅资料没有查到有关如何做好“数据标识”的文献。先介绍一下初期医学数据库建设的方法, 这样可能有助于更好地理解“数据标识”原理、概念、依据和使用方法。

人类社会发展产生了大量文献, 同样医学也产生了大量文献。在没有广泛使用计算机搜索以前, 如何让学者快速查到需要的文献, 需要对每一篇文章进行文献标引[4], 标引方法是人工给每篇文章加上医学主题词, 现在每篇论文由作者写好关键词, 医学上叫做主题词。论文属性除了作者、题目、作品时间、作者单位不能改变之外, 按照主题词查找更加重要, 主题词是相同专业、甚至相同疾病、相同药物的精准查找。所以文献的标引在医学数据库建设中非常重要, 也是文献精准查找的重要方法。再来看看医学数据库, 按照文章作者、作者单位、题目、作品时间、发布媒体、关键词、被引、摘要等构成, 这些构成要素组成一个模型, 数据库中有大量的论文、题目、关键词、作者等, 所以说数据库结构是模型结构, 内容是大数据, 精准使用好数据库方法是关键词, 也就是前面提到的文献标引, 用在使用好大数据上就需要做好大数据的“数据标识”。

2.2“数据标识”是精准营销成功的关键

“数据标识”需要对标识目标数据有深入理解。以大数据精准营销解决方案为例, 大数据精准营销是顾客的心理行为轨迹需求和商品属性碰撞产生的购买行为, 如何做到精准营销[5], 首先需要不断标识顾客行为轨迹, 年龄、性别、职业、消费能力、旅居地、饮食爱好、饮食时间....等等, 在即将进入餐饮时间向该顾客推荐餐馆, 餐馆数据标识为菜系、特点、名菜、点评、环境等, 按照餐馆标识和预判顾客行为轨迹, 把数据标识中共性按照概率大的部分结合地理位置逐渐推荐给顾客。餐馆、商品、衣服的大数据精准营销方法一致。精准营销的准确性关键取决于预判顾客行为的数据标识的准确性和商品属性的数据标识的共鸣。

大数据研究刚刚开始, 精准的大数据应用必须要有精准的数据标识。目前在精准营销领域使用比较频繁的词是给客户画像, 画像方法让人感觉是一种模糊的, 猜测性比较大的技术。描述一个商品属性时习惯使用标签标识商品。精准营销是人的行为轨迹碰撞到商品中相同属性数据产生的购买, 数据标识的准确性决定了精准营销的准确。人的行为轨迹数据也是未来人工智能解决方案中非常重要的数据, 精确的数据需要准确地标识数据。商品营销也是网络大数据解决方案的一部分, 商品的准确描述和精准数据标识, 将会决定商品营销的成功与否。

2.3医学大数据的“数据标识”更容易实现

作为医生, 医学大数据的开发和使用一直是笔者研究的课题, 医学大数据的精准应用可以预判人体健康并进行疾病预防[6]。相对于人类行为数据, 医学大数据的数据标识相对容易, 医学大数据应用成功可能会早于人类行为数据的应用, 理由有以下3条。

(1) 医学大数据是关于人类物理实体的大数据, 人体是一个相对固定物理实体, 数据边界清晰, 数据外延有限。

(2) 医学大数据表达的是人体生理活动和健康指标, 这些数据的内涵只有医生能够理解, 非医学专业人士不能很好地理解医学大数据的内涵, 非医学专业人士很难准确分析医学大数据, 也很难标识医学数据, 这是医学数据的专业性和数据围墙阻挡了非医学专业人士对医学大数据的研究。

(3) 医学大数据中医学数据标识需要医生的参与, 目前能够做数据标识的医生需要培养, 笔者正在做这个方面的工作, 笔者是第一个提出建立互联网医学标准的学者, 互联网医学标准中有一部分工作是做数据标识。

3结语

做好大数据应用需要各方努力, 探索方法落地项目。“数据标识”技术的核心是用数据来标识数据, 让计算机可以分辨不同环境下产生的外表相同的数据中包含的不同信息, 真正做到大数据的精准应用。大数据是人类活动中生产出来的重要资源, 反映的是人类生活活动和人类生理健康状态, 因此大数据也是研究人的技术, 研究好大数据, 人工智能就离人类很近了。

参考文献

[1]徐立水, 辛敏.大数据及其应用前景研究[J].企业科技与发展, 2016 (6) :21-23.

[2]王忠.美国推动大数据技术发展的战略价值及启示[J].中国发展观察, 2012 (6) :44-46.

[3]国发〔2015〕50号, 国务院关于印发促进大数据发展行动纲要的通知[Z].2015.

[4]黎盛荣.什么是文献标引学[J].图书情报论坛, 1997 (1) :2-5.

[5]刘征宇.精准营销方法研究[J].上海交通大学学报, 2007 (S1) :143-146.

[6]徐立水, 辛敏.互联网医学的未来:数据医学[J].科技创新与应用, 2016 (15) :82.

数据中心标识管理篇2

1.1 项目主要内容及关键技术

数据中心建设是当前热点, 其建设跨越多个专业, 从建筑、消防、给排水、暖通、配电、新风等建筑建设部分, 到布线、数据、交换等信息化建设部分, 以及到后期的运维管理等完整全生命周期内各个阶段。本次研究是在设计和建设运营阶段, 对数据中心内部众多的设备、管路、线路按照一定标准设置不同的标识, 以及不同标识对维护、管路人员带来的心理影响。关键技术是研究国内相关标识的强制性和推荐性标准, 最终形成设计院或用户内部数据中心标识管理文档标准。

1.2 技术创新点

针对数据中心设计和运营阶段, 独创性地提出综合标识管理标准, 结合企业UI设计, 形成独立体系。以理论分析为主, 在理论分析的基础上, 结合其他行业相关标准, 分析不同标识、不同标准之间的冲突, 最终得出最优标识系统。

2 标识管理基本要求

随着信息化的高速发展, 作为支持信息化应用的核心物理平台, 数据中心的建设越来越得到用户的重视。特别是一些对信息化需求较大的用户, 如政务机关、金融行业、大型企业等, 在投入大量资金采用先进的设备、技术建设数据中心的同时, 已不仅仅满足于对数据信息的存储、整合、网络传输等基本结构的高标准要求, 更加重视数据中心的维护, 以更好发挥其高性能优势。

机房的标识管理是信息系统标准化建设的一个重要环节, 标识管理要从实际应用出发, 参考国际、国内或者行业标准的要求, 解决在机房什么位置上、用什么样材料和颜色标签的问题, 最终的目的是提高运维水平和管理层次, 推广企业的UI形象。

2.1 标识管理各阶段要求

1) 标识管理的初级阶段

只解决有和没有的问题, 不考虑材料和方式。常用材料包括纸加透明胶条、扣取纸等, 一般采用手写的方式, 使用寿命和标签的成本一样低。初级阶段, 开始对整个信息系统的局部制作标签, 标签材料以合成纸为主, 初步要求具有防水功能, 采用标签打印机进行打印, 材料和形式都比较单一, 多为长条状的粘贴标签。

2) 标识管理的中级阶段

按照GB 50312-2007《综合布线系统工程验收规范》, 要求标签具有唯一性、形式具有统一性, 标签书写应清晰、端正, 标签的材质要有耐磨、防水功能。这对于一个庞大的综合布线系统来说, 要求得比较宽泛, 对标签没有量化的要求。

3) 标识管理的高级阶段

(1) 标识管理不仅仅是标识单独的产品, 而是一套标识管理系统, 管理系统包括“标”和“识”两部分。标识管理系统的设计要与企业形象推广相结合, 根据国际上EIA/TIA606 《商业及建筑物电信基础结构的管理标准》、UL969 和Ro HS的要求进行设计。

(2) 标识管理系统的“标”的含义为:统一颜色、统一标签形式、统一打印方式和编码规则, 并根据不同的标注位置来选择最适合的材料。标识管理系统的“识”即标识系统的管理, 最原始的方式是中英文和数字结合的方式, 为了更方便管理可以通过可视化机房的资源管理软件, 结合一维码、二维码和智能识别终端, 实现标识管理系统“账”、“物”、“卡”有机地结合起来, 方便资产管理和日常运维工作。

2.2 标识组成及分类

数据中心各个组成部分, 如图1 所示。

根据数据中心标识对象不同, 可分为设备类、管线类以及安全指示类几部分, 具体分类如下。

1) 设备类

消防设备、配电设备、电源设备、空调设备、给排水设备、综合布线设备、智能化设备、新风排烟设备等部分。

2) 管线类

消防水管线、消防气体管线、消防控制管线、低压配电管线、高压配电管线、信号类管线、走线架、支架等部分。

3) 安全指示类

安全指示、疏散指示、机房标识、区域标识等部分。

根据标识悬挂方式不同, 可以分为粘贴式和悬挂式。

粘贴式标识是较传统的标识, 应用广泛。符合标准的粘贴式标识应该满足如下条件:在标准数据中心环境下, 字迹清晰、明确, 粘贴牢固;抗水、抗油、抗化学品擦拭, 标签工作年限在室内可达10 ~ 15 年 (除人为破坏外) 。同时, 根据实际应用的经验, 还要求标识材质尽可能柔软, 可以更好贴合设备的烤漆不平滑表面;标识粘胶层可移除性强, 标识本身应为整体结构, 如遇更换标识的情况可以整体移除, 不留残迹污染设备表面。

悬挂式标识是补充类别, 多用于不适合粘贴的环境, 如服务器等无粘贴表面的设备、较粗线缆等。符合标准的悬挂式标识应该满足如下条件:字迹清晰、明确、耐撕扯;抗水、抗油、抗化学品擦拭, 标签工作年限在室内可达10 ~ 15 年。

2.3 标识设计基本原则

2.3.1 需满足行业相关标准要求

目前, 消防系统、电力系统、工业管道等已有较为详细的规范, 规定了各个不同设备、管路的标识要求。因此, 在设计数据中心标识时候, 必须满足这些规范要求, 不得和这些规范冲突。这些规定范围外的设备、管线可按照企业内部标准进行标识。

2.3.2 需满足唯一性原则

对各个设备编号需满足唯一性原则, 否则, 无法在记录、查找故障、沟通交流时确定对象。在目前大型数据中心, 有多栋建筑, 每栋建筑有多层, 不同建筑不同楼层内各个功能分区也类似, 这就要求必须将相关信息都包含在内, 从而满足唯一性要求。

2.3.3 需满足便于查看原则

标识对象很多, 体积和位置差别也很大。如有的冷却塔, 高达10 多米;有的配线架, 只有1U高度 (44.45mm) 。对象性质不同, 观察距离不同, 这也要求标识颜色、字体、色环等不同因素, 必须能够便于让维护人员查看, 否则, 标识就不起作用。

2.3.4 简洁原则

很多场所标识系统面积有限, 且信息量大。因此, 需要在有限面积上, 尽可能地包括必要的信息, 因而编码必须要简洁, 一般采用字母+ 数字的方式进行编码。

3 标识管理具体要求

3.1 材质要求

标识应打印, 应保持清晰、完整。字迹清晰、明确, 粘贴牢固;抗水、抗油、抗化学品擦拭, 标签工作年限在室内可达10 ~ 15 年。

标识能达到环保Ro HS指令要求。

标识能满足环境的要求, 比如潮湿、高温、紫外线等环境因素。应该具有与所标识的设施相同或更长的使用寿命。通常选择聚酯、乙烯基或聚烯烃等材料。

有触电可能的场所应使用绝缘材料。

标识应无孔洞和影响使用的任何疵病。

3.2 安装要求

应根据标识对象不同使用不同的安装方式:对于设备类标识, 应在设备相关部位粘贴安装;对于管路、线缆标识, 应直接将标识印刷标明在管路和线缆上;对于安全指示等标识, 可粘贴在表面, 如不能粘贴则需悬挂安装, 安装高度一般不小于2m。

3.3 安放位置要求

1) 设备位置:位于设备表面左上方或右上方。

2) 管路位置:标识的场所应该包括所有管道的起点、终点、交叉点、转弯处、阀门和穿墙孔两侧等的管道上和其他需要标识的部位。如图2 所示。

3) 疏散指示位置: 疏散走道的疏散指示标志灯具, 宜设置在走道及转角处地面1.0m以下墙面、柱上或地面上, 且间距不应大于20m ;安全出口标志灯宜安装在疏散门口的上方。如图3 所示。

3.4 标识形状

根据标识作用不同, 参考消防设备标识, 可将数据中心内的标识分为指示、警告和指令类3 类。

1) 指示类标识是提示设备名称或者指示方位, 采用方形标识, 或长方形标识。如图4 所示。

2) 警告类标识是警告相关人员需注意, 采用三角形标识。如图5 所示。

3) 指令类是指示操作人员必须做或者禁止做的内容, 采用圆形标识。如图6 所示。

3.5 字体尺寸

对于数据中心类各个设备来讲, 观察具体距离不同, 所需要尺寸不同。

参照消防设备指示要求, 各个不同类型设备所需要字体尺寸的大小如图5 所示 (D为观察距离) 。

对于观察距离, 根据数据中心特殊性, 暂定观察距离如表1 所示。

管路部分需采用颜色和色环来表示, 如图6所示。

2 个标识之间的距离不大于10m。

3.6 底纹要求

红色传递禁止、停止、危险或提示消防设备、设施的信息。

蓝色传递必须遵守规定的指令性信息。

黄色传递注意、警告的信息。

绿色传递安全的提示性信息。

使用对比色要求如表2所示。

3.7 安全指示类标识

对于疏散类指示标识, 可参照国家相关标准。

1) 定位

包括建筑、楼层、房间类别以及相同房间顺序号。定位需满足唯一性要求。编号以字母和数字组合而成。每个功能分区之间采用“-”分隔。

2) 房间编码

房间编码原则:各个功能分区中文名称见国家标准GB50174。对于常规功能分区, 采用拼音首字母2 位标识;对于大家熟悉的功能房间, 如UPS间等采用英文编码方式, 英文编码为3 位 (见表3) 。

3) 区域划分

在设备区域地面划分安全区域, 如图7、图8 所示。

3.8 管线类标识

管线类标识要求见表4。

对于保温涂沥青的防腐管道, 均不涂色。

线缆:编号应包括起点、终点、端口号等要素。在综合布线系统中, 配线架区域空间有限, 往往不能将全部信息显示在标识上。可以采用RFID或条形码的方式对设备进行编码编号, 在需要详细信息的时候可以采用手持设备进行读写, 这样可以兼顾显示面积和信息量, 这样既能方便维护, 又能全面显示信息。

3.9 设备类标识

设备类标识包括消防设备、配电设备、电源设备、空调设备、给排水设备、综合布线设备、智能化设备、新风排烟设备等部分。

设备类编号一般规则为:定位-字母-编号。

1) 定位

包括建筑、房间、楼层以及相同房间顺序号。定位详见指示类要求。如设备位置不唯一, 则前缀需加以定位;如唯一位置, 则不需要。如冷却塔全部设置在屋顶, 大家一般对此没有歧义, 则不需要加定位, 只需要加设备顺序号即可。对于定位, 需要区分大小, 对于建筑, 它参考的是园区内的建筑数量。对楼层, 对应的是建筑;对于机房, 对应的是楼层;对于机柜, 对应的是机房;对于配线架设备, 对应的是机柜。即需要前一级准确定位才能确定本设备的唯一定位。

2) 设备字母定义 (见表5)

3) 编号

对于数量比较少的设备, 如油机、冷水机组、冷却塔等采用顺序编号。

对于数量较多的设备, 如机柜采用行列的方式。一般来讲, 行要比列要多一些。因此, 列采用字母编号, 行采用数字编号。如B20, 标识B列第20 号机柜。机柜编号顺序是将头柜视为0 号柜的顺序编号。如图9 所示。

4 市场前景

当前数据中心市场巨大, 尤其是大型数据中心, 对设计单位和施工单位要求更高。在当前技术基本成熟, 模式基本固定的情况下, 更多的建设单位已经逐步从重建设转为重运营的模式。运营效率的高低将会长时间影响数据中心的收益。

在设计院争取项目时, 已经利用了数据中心标识管理这个体系。在客户尤其是政企客户看来更具有吸引力。因为, 每个政企客户建设数据中心不是专门运营的, 而是为企业内部更好的服务, 会有很多同行单位和下属单位前来学习和观摩。使用数据中心标识管理, 除了提升管理效率外, 还能在很大程度上和企业标识联系一起, 从而在整体上达到一个比较好的显示和宣传效果, 这些正是目前数据中心建设所欠缺的。在某省会城市市政府级别数据中心已经初步使用了此体系, 正准备在一个新建3000 机架数据中心内实施。在另外一个海关金关工程二期项目——某省级海关实施的机房改造项目, 客户也表示出浓厚的兴趣, 在原先机房已有的UI标识下, 重新统一编码替换。此项目正在实施中。

5 结束语

数据标识篇3

随着计算机与互联网的不断发展, 信息隐藏技术日益受到人们的重视, 已成为信息安全技术的一个重要方面。信息隐藏的目的就是使第三方攻击者感觉不到敏感数据的传输, 发现不了敏感数据的位置。信息隐藏技术克服了数据加密技术的一些缺点, 它不需要专门机构管理, 实现的系统开销不大, 第三方不能发现敏感数据的传输, 因而无法破坏敏感数据。TCP/IP协议是TCP/IP协议簇中使用最频繁的两个协议。本文提出了一种基于TCP和IP协议的网络数据报数字标识方案, 分析其基本原理和相关的算法, 提出数据报标识的实验模型, 并分析相关实验数据。

1 应用背景

在TCP和IP协议中, 冗余量不多, 从基于TCP和IP协议的隐蔽信道中秘密数据传输速率很小, 因此将TCP和IP协议中的冗余量用作秘密数据传输的实际意义不大。在通信网络中常常需要实时取得某个或某些网络数据报的属性, 以便对网络数据报进行监视或控制。网络数据报的属性包括发送端主机的基本信息、来自某个文件的基本信息等。要完全表达一个网络数据报的属性需要的信息不多, 因此可以在TCP和IP协议的冗余位置写入网络数据报的属性信息。网络数据报的属性信息可称为网络数据报数字标识, 它是唯一标记一组网络数据报的数字序列号, 这一组网络数据报可以是来自一个文件、一组文件, 甚至可以来至一台主机或一个网络。网络数据报数字标识有如下特点:

(1) 唯一性

标记一组网络数据报的数字标识应该是唯一的, 一旦被使用后就不得与其它数字序列发生碰撞, 以免在检测时发生误检。

(2) 高安全性

一组网络数据报一旦嵌入了数字标识后, 这组网络数据报的数字标识不能全部被更改。因此必须保证嵌入网络数据报中的数字标识对第三方来说应该是“看不见”的。

(3) 易检测性

在网络数据报中嵌入数字标识的目的就是为了能在Internet中通过数字标识快速找到一些特殊的网络数据报。因此要能快速的检测出网络数据报的数字标识[1]。

2 相关字段分析

当前基于TCP/IP协议的信息隐藏方法, 比较可靠的方法有基于IP标识字段的信息隐藏、基于TCP序列号字段的信息隐藏、基于IP生存时间字段的信息隐藏和基于TCP选项字段的信息隐藏。这几种方法各有各的优点, 可以取长补短, 结合几种方法使用。根据网络数据报数字标识的特点, 我们选择在IP标识字段、TCP序列号字段和IP生存时间字段隐藏数字标识。

IP标识字段为16比特, 选用前10比特作为嵌入部分数字标识的空间。嵌入数字标识后的IP标识字段结构如图1所示。低6位的变化范围为0到63, 因此标识一组网络数据报时发送端封装的前64个数据报携带了数字标识。

IP生存时间字段为8比特, 选用前3比特作为嵌入部分数字标识的空间。嵌入数字标识后的IP生存时间字段结构如图2所示。低5位的变化范围为0到31, 因此网络数据报最多可以经过31跳而不丢包。

TCP序列号字段为32比特, 选用前16比特作为嵌入部分数字标识的空间。嵌入数字标识后的TCP序列号字段结构如图3所示。以太网数据报大小不大于1500字节, 而低16位字节变化范围可以从0到65535, 因此标识一组网络数据报时发送端封装的数据报最少前43个携带了数字标识。如果把以太网数据报大小控制在1000字节以内, 那么前65个数据报携带了数字标识。

把一个网络数据报的数字标识分段后嵌入IP标识字段、IP生存时间字段和TCP序列号字段中, 那么数字标识的长度可以达到29比特, 如果把以太网数据报大小控制在1000字节以内, 那么一组网络数据报的前64个包携带了数字标识, 且所有数据报最大可以经过31跳。

3 网络数据报数字标识方案实现

NDIS中间层过滤驱动介于协议层驱动和微端口驱动之间, 因为是在协议层驱动以下, 所以可以拦截所有的网络封包。由于其特殊的位置, 使得它既能与上层协议驱动进行通信又能与下层微端口驱动程序通信。

通过NDIS中间过滤驱动层实现在网络数据报中嵌入数字标识。在协议驱动层截获数据报, 在NDIS中间过滤驱动层分析数据报后重新组包, 通过网卡发送到网络上。在一台主机上, 并不是发送所有文件都要嵌入数字标识, 因此在发送文件时要区分哪些文件在发送前要嵌入数字标识, 哪些不嵌入数字标识而按正常的数据报发送。网络驱动层在封包时并不知道哪些数据包该嵌入数字标识哪些不用嵌入数字标识, 因此在把一组数据包发送到网络上之前需要一种机制判断这组数据包是否来自某敏感文件。

我们利用虚拟代理服务器机制扫描要发送的数据报。发送端和虚拟代理服务端保持实时通信, 发送端定时把机器上的敏感文件列表发送到虚拟代理服务端, 虚拟代理服务端立即更新来自发送端的敏感文件列表, 虚拟代理服务端就可以根据敏感文件列表判断数据报的类型。当发送端要给接收端发送文件时, 发送端首先将数据发送到虚拟代理服务端检测。虚拟代理服务端对数据进行扫描, 查找包含文件名的数据报中的文件名是否在敏感文件列表中。如果存在于敏感文件列表中, 则通知发送端此组数据报需要需要嵌入数字标识后再发送出去;如果在敏感文件列表中找不到, 则通知发送端此组数据报不需要嵌入数据包就可以发送出去。

对网络数据报的数字标识检测过程比较简单, 在网络的某个节点并接上检测装置, 实时监听、捕获和扫描经过此节点的所有数据报。若发现某个数据报中存在数字标识, 则做相应处理, 处理手段包括向监控中心报告、切断正在通信的连接、阻止继续传送等;若数据报中没有数字标识存在, 则放行, 不做任何处理。

4 实验结果分析

在IP标识字段、IP生存时间字段和TCP序列号字段中嵌入数字标识的好处是很难被第三方发现, 因为在一般数据报中, 这三个字段的值可以取在其变化范围内的任何一个值, 且每一个取值都是系统随机生成之后在使用过程中逐渐递增或递减的。来自一个文件的一组网络数据报中有几十个数据报嵌入了数字标识, 即使在传输过程中部分数据报丢失或者被改变, 只要还存在一个以上的嵌入了数字标识的网络数据报, 并不会影响对此组数据报数字标识的检测。

图7为本次实验的测试环境, 分4条线进行测试, 每条线上都有一个网络数据报数字标识检测器。1线为从教育网主机A发送数据到教育网主机B, 检测器1并在线路中间;2线为从公网主机C发送数据到公网主机D, 检测器2并在线路中间;3线为从教育网主机B发送数据到公网主机C, 检测器3并在线路中间;4线为从公网主机D发送数据到教育网主机A, 检测器4并在线路中间。表1为测试结果。

5 结束语

本文分析基于TCP和IP协议的信息隐藏在网络数据报标识中的应用。网络数据报数字标识是一串唯一标识一组数据报的序列号。数字标识的特点表现在唯一性、高安全性和易检测性上。从其特点考虑, 选用在IP标识字段、IP生存时间字段和TCP序列号字段中隐藏网络数据报数字标识。不仅分析设计了数字标识的嵌入和检测算法, 而且还设计了用虚拟代理服务器区分该嵌入数字标识的数据报和不该嵌入数字标识的数据报, 同时分析了该方法的实验结果。但是由于暂时还没有考虑到更为复杂的网络环境, 要使它应用于产品开发还需要继续研究与完善。

参考文献

[1]唐作吟, 杨宗凯, 谭运猛, 何建华等.Internet协议中信息隐藏技术的研究[J].计算机应用研究, 2003 (8) :14-17.

[2]刘朝晖, 孙星明.基于TCP/IP协议的信息隐藏新方法[J].计算机技术与自动化, 2004 (3) :109-112.

数据标识篇4

然而, 综合布线本身是庞大而系统的工程, 不同的部分都需要有相应的标识来体现, 从而达到不同的目的。换而言之, 标识管理渗透于综合布线工作的每个细节, 并且承接前期施工, 后继之应用等绝大部分工作。当然, 这之中所涉及的标签都应按照《商用建筑电信技术设施管理标准》进行应用, 材料通过UL969认证以达到相对时间的永久标识之能效;同时, 为保证用户工作环境的环保程度, 材料应符合RoHS指令要求。

我们目前所谈及的标识标签大多应用于成熟机房中, 或是老机房整改时重新整理布线对线缆、网络设备等信息的重新标识。其实, 完全规范而系统的标识工作是从新建机房布线施工时开始的, 由于这部分工作和大多数用户所接触的日常行为较少, 所以很少被关注。但是, 在整个标识系统中, 如果这部分欠缺, 当遇到一些大型的整改、排查等工作开展时, 就会体现出信息链断裂, 信息跟踪不流畅等弊端。

完整的标识工作系统包括:施工标识、永久链路标识、日常维护标识及视觉性标识。

1 施工标识

施工标识是指综合布线工程单位在施工中所用的标识。这类标识在任何布线工程中都会应用到。规范的标识体系中, 这类标识只是工程人员施工标记用标识, 并不能当作永久性标识使用。

在标识不规范的用户当中, 很多用户所使用的标识都是工程单位施工时所留下的。更有甚者, 一些用户没有自己系统的标识分类及信息命名规则, 其标识系统完全建立于工程单位的施工习惯。这样的标识信息量小, 甚至是只有几个字符的代号, 从整个空间及时间的角度衡量, 根本不足以将复杂的布线路由架构描述清楚。另外, 在缺乏标识系统的情况下, 标签成本一般不在布线预算之中, 布线工程单位为了节约成本, 所用来标识的标签都尽可能的简而化之, 再加上工程人员文化素质的参差不齐, 所用标识只能保证施工的顺利进行, 许多标签不等施工结束便纷纷脱落或字迹模糊, 更谈不上标识标准中要求的持久性。更何况, 大型数据中心的工程施工都是由几家工程单位共同承担, 得到的效果更是五花八门。

在施工中, 主要是线缆走向的安置, 我们建议使用覆盖保护膜临时标签, 这类标签的贴合性、可移除性、字迹稳固性便于线缆在槽道的穿插, 并保证字迹不受摩擦的影响;同时, 这类标签是通过专用书写笔来书写, 不需要打印, 恰好满足工程灵活性的要求, 并考虑到工程人员文化素质参差不齐、操作性差的特点。

2 永久链路标识

永久链路标识如图1所示, 是指墙壁中、地板下等永久链路所用标识。数据中心一旦竣工投入使用, 这类标识很少会被用户接触到, 所以常常不会引起注意。但是, 这类标识反而是整个标识系统中对材料要求更高的一部分。

在布线系统中, 永久链路基本属于“一次性链路”, 一般不会被变动, 是整个数据中心正常运行的基本保证。随之, 作为整个标识系统的根基, 永久链路标识也被要求拥有同样的特性, 即真正的“永久性”。我们建议使用绑扎式标签, 这类标签面积小, 通过尼龙扎带固定于线缆, 适用于高密度的永久线槽;可打印, 保证字迹的永久性;材料特殊, 在符合所有布线标签标识标准的同时, 还要拥有一定的阻燃性, 当有火情发生时, 不产生着火点。

3 日常维护标识

日常维护标识根据不同的应用, 包括设备标识、机架机柜标识、线缆标识、端口标识等, 一些特殊的行业也会有一些其他的扩展应用, 如运营商的板卡标识等。

日常维护标识是用户工作中接触最多, 使用率最高的标识, 也是整个标识系统中信息量最大、最难规范的标识体系。如今, 绝大多数的用户关于“标识标签专业化”的议题更多的是建立在这一类标识上。然而, 这类标识不但对标签本身有材质及形式的要求, 还要求用户有完整而稳定的信息命名规则, 这样才能更好的起到标识的作用, 而不是形式主义的样子工程。当然, 在标识体系尚不健全的今天, 很多用户没有相关经验来编制合理完整的命名规则, 这就需要我们标识工程人员根据经验并结合用户的具体情况, 来给客户提出合理的建议, 以帮助用户更好的发挥标识标签的强大管理功能, 如图2所示。

4 视觉性标识

视觉性标识是标识标签应用的延伸, 其种类可以根据客户的需要和想法无限放大扩展, 由最早的警示贴标、区域划分到现在的一些架、牌、框等, 无不渗透着标识的具体应用。通过标识应用的扩展, 数据中心不再是简单的数据流通存储的场所, 其功能性更强, 整体性更完善, 也更利于用户的日常工作的进行, 如图3所示。

数据标识篇5

建设以组织机构代码为标识的“法人基础数据库”是国家四大战略性、基础性数据库建设的重要配套工程。建设目标是将分散在不同政府部门业务系统中的法人基础信息进行有机整合, 实现跨部门、跨系统的数据交换和协同办公;建立权威、完整、准确、动态的法人基础信息数据库, 从而避免各部门重复建设, 实现信息共享, 为电子政务、电子商务建设提供基础信息资源。

设计原则

1. 唯一性原则

法人数据库涉及到多个部门, 为了保持各部门数据的完整性、一致性和权威性, 引用唯一的组织机构代码信息作为各个数据的唯一性约束条件。

2. 多属性原则

以组织机构代码数据为标识主体, 其他政府部门管理信息作为附属扩展 (比如工商、税务、银行等) , 从而实现了不同部门的信息联动, 并有效实现数据的一致性。

3.有效性原则

法人数据库就是将各个部门的数据进行有效组织和管理。在进行法人数据库设计过程中对数据的有效性的处理是设计法人数据库的关键环节。本系统通过设计数据有效性规则保障法人数据有效性。规则采用属性域规则、关系规则和连接规则。

4.适应性原则

法人数据库涉及到多个部门, 各部门需维护其所辖的数据及使用其他部门所辖的数据。本系统的设计通过数据的同步、采集、发布手段适应不同系统的接入与使用。

5.合规性原则

不同的部门使用和维护法人数据库中不同域的内容。为了确保系统数据使用、操作的安全性, 本系统以我国《电子签名法》为依据, 采用数字证书技术, 实现了电子签名、安全保密、行为追溯和访问控制等功能, 保证了系统符合国家相关法律的规范和安全规范。

系统实现方案

1.数据结构设计

按照国家标准规定法人数据基础信息数据元分为法人单位基本信息、法人单位扩展信息两大类。法人单位基础信息数据元分类模型见图1:

随着网络应用的发展, 仅以组织机构代码作为法人数据的唯一标识已经不能满足需要。因此, 我们根据国家标准, 引入数字证书, 作为网络交往中的身份标示, 本文设计法人数据库模型如下:

(1) 法人单位基本信息

法人单位基本信息是指与法人单位自身密切相关的信息, 以组织机构代码为核心, 包括机构名称、机构类型、机构住所、法定代表人姓名、经营或业务范围、注册或开办资金金额、注册或开办资金币种、成立日期、注册或登记机构名称、注册或登记号等。

(2) 法人单位扩展信息

法人单位扩展信息是指除法人基本信息外, 部门间共享需求较为普遍的法人单位信息, 按照数据来源部门划分, 分为组织机构代码信息 (来自质量技术监督部门) 、注册或登记信息 (来自工商行政管理部门、机构编制部门、民政部门等法人单位登记机关) 、税务信息 (来自税务部门) 。

根据法人单位基础信息的特征, 把法人单位基础信息划分为7个对象类:法人单位、组织机构代码证、法定代表人、数字证书、年检、营业执照吊销、税务登记。

系统采用分层的思想构建, 分为系统表示层、应用服务层、系统基础层, 并逐步建立价格信息服务的标准管理体系和信息安全体系。

(1) 用户

整个系统的用户主要有以下两类:政府相关部门 (如:质检、工商、税务、民政、银行等) 和社会公众。

(2) 系统基础层

平台的软硬件支撑环境包括网络及数据库管理系统、网络数据安全系统。

(3) 应用服务层

为社会公众和政府相关机构提供法人数据库服务, 包括:数据抽取、决策支持、系统管理、安全控制等服务功能。

(4) 系统表示层

通过数据定制和访问控制, 为不同的用户展现需要的法人数据库服务。

(5) 数字证书

完善法人数据库系统的安全体系:通过使用数字证书, 做到法人数据在传输、存储、阅读等环节的安全, 达到数据的保密性、真实性、完整性及行为的不可抵赖性。

系统基本功能设计

1.数据同步子系统

数据同步是每个部门所辖数据与法人数据同步的过程。在同步操作中, 使用身份证书验证每个部门身份, 使用证书属性来确定操作内容、权限等, 采用加密证书保证在互联网中数据交换的完整, 数据将实时地、自动地、同步地更新法人单位基本信息数据库的内容, 数字证书的应用确保推数据操作的真实性、完整性、保障数据信息同步的可靠性。

2.数据采集子系统

数据采集是针对不具备完整信息系统的部门需要掌握法人数据的操作, 这些部门可以通过以下两种方式上报数据:

(1) 通过WEB表单填报;

(2) 将数据通过上传EXCEL表把数据传入质检部门;

通过服务器证书来确保数据生产部门的WEB表单的真实性;通过分析数据生产部门的证书属性来确定操作权限及范围。

3. 数据发布子系统

数据发布是根据国家信息发布的有关规定, 将法人单位基础信息按不同的级别对外发布。数据发布是对不同权限、不同等级的用户公布不同层面的信息内容。不同部门如工商、税务, 对发布的信息使用的范围是不同的。

信息发布后, 系统通过对用户角色和权限实现对信息的增加、删除、修改等操作。采用数字证书的二级属性, 在特定领域中定义身份、决策和权限。根据身份证书准确地辨别用户身份及权限, 分配其相应的功能页面, 用户对所有信息的操作均使用签名证书和加密证书, 确保了数据交换过程的完整性及行为的不可抵赖性。

4. 数据管理子系统

数据管理是整个系统安全的核心, 法人单位基础信息数据管理主要有两大功能, 分别是:数据管理、日志管理。各数据生产部门对其数据要求系统在操作中体现严肃的法律责任, 其中采用签名证书达到操作行为的不可抵赖性及身份的真实性, 采用加密证书达到数据完整和保密性。通过剥离组织机构代码管理中心现存的沉淀失效数据, 使法人单位基础信息数据库中法人信息具有有效性、实用性、可靠性。

5. 数据安全审计子系统

根据电子签名法, 对所有签名都提供了时间戳、CRL验证功能, 使得对法人数据的更新等操作的历史记录有了法律依据, 法人数据安全审计系统包括两部分:内容审计和操作审计。

法人数据内容审计:内容审计系统能够对部分或者全部数据源所产生的数据进行分析, 如对数据进行追溯, 同时可以提供丰富的报表, 便于分析决策。

法人数据操作审计:记录系统工作日志, 对系统工作历史和现状进行即时监察和审计, 可记录用户登录时间、登录地点、进行什么操作等内容, 日志记录能向系统管理员提供有关危害安全的侵害或系统活动的详细审计, 这些日志用于评估、审查系统的运行状况环境和各种操作。

通过建设以组织机构代码为统一标识的标准统一、信息完善、安全可靠的法人单位基础信息库, 实现信息资源共享, 避免重复建设, 从而实现:提高政府和行业部门的业务管理能力、监控能力和对突发事件的快速响应能力;改进政府行政管理模式, 提高工作效率;提高政府对金融、税务、海关等领域的监管力度;推动政务公开, 为社会提供广泛、准确、动态的信息咨询服务。

【数据标识】推荐阅读：

标识管理10-17

英文标识01-16

标识技术05-15

标签标识05-31

患者标识06-24

标识安装08-01

标识保护08-19

标识识别08-20

平台标识08-28

标识制度09-07

>> 查看更多相关文档