主数据平台

2025-01-03

主数据平台(共8篇)

主数据平台 篇1

一、物资分类标准落地

物资分类标准中明确的定义了类别编码、类别名称、分类说明、基本单位、属性名称、属性说明以及具体的元属性名称及其规则要求。MDM平台功能需求分析设计时, 需要综合考虑物资分类标准在物资分类层级、类别定义、属性设置等方面的可能情况, 设计一套灵活可调的分类属性管理功能。

物资分类为三层架构, 包括大类、中类、小类。属性模板在小类进行明确定义, 对每个小类明确定义可用的基本单位, 对每个元属性都采用“五段式” (即将值分为前置符号、元属性值、后置符号、计量单位、连接符五段) 进行细致规范管理。

在MDM平台中把物资分类标准作为一类数据来管理, 配置物资分类模型用于实现物资分类标准落地, 主要如下:

1) 物资分类模型中明确规定了大类、中类、小类的编码规则, 启用五段式, 并使用物资术语来规范管理属性和元属性编码及名称;2) 由于每个小类都有物资名称和基本单位, 所以明确规定了物资名称和基本单位的编码和名称的书写, 便于后续统计、分析使用;3) 配置物资分类的创建和变更流程, 分配专家权限;4) 保留每个物资分类属性变更的历史变更记录;5) 提供变更内容和变更预览功能, 方便用户查看;6) 每个元属性可以设置独立的值库, 独立的校验规则。

用户在申请物资分类时输入类别编码、类别名称、分类说明及分类下的属性、元属性。明确属性下包括哪些元属性, 属性是否启用标准;元属性是否必须填前置符号、后置符号、计量单位、连接符、元属性的长度, 元属性的值的取值方式, 可选的值内容, 特殊校验规则等, 相关专家进行线上审核, 审核通过后该物资分类生效。

二、物料主数据引用物资分类标准

在MDM平台中, 物料主数据的整体组成包括两部分, 一部分是与物资分类相关的, 一部分是通用的与分类无法的信息, 比如物料类型、产品组、运输组、状态等信息。物料主数据引用了物资分类标准, 主要是规范了与分类相关的属性, 物资分类审核通过后即时作用到物料主数据。在申请、审核、查询物料主数据时, 可以明确地看到其所属物资分类的说明或定义, 避免因为理解差异选错分类的情况。

在申请物料时选择分类后可以看到该分类下所有的属性、元属性及其对应的说明, 帮助用户理解, 在对应的物资分类标准中定义的规则同时作用到物料主数据的申请校验中。确保通过审核的物料主数据是符合物资分类标准的。申请的物料中有新的属性值时, 通过审核后, 可以自动加入到对应的元属性值库。

物资分类变更生效时, 已经通过审核的物料主数据不受影响, 但是新申请的或者已经在审核流程中的物料需要根据新的物资分类标准进行填写, 查询物料主数据时可以明确看到其是根据哪个版本的物资分类标准进行填写的。物资分类物理删除时, 需确保其没有下级类和物料主数据存在。

物料主数据审核通过后会分发到集团的主要信息系统中, 例如SAP, 然后应用于采购、销售、生产等多个业务环节。

物资分类标准通过MDM平台落地, 真正的规范了物料主数据的收集填写, 而物料主数据的管理也进一步推动了物资分类的进一步规范发展。MDM平台满足了现有的物资分类标准的落地要求, 但是物资分类标准化是一个循序渐进的过程, 随着集采等相关工作的开展, 一些新的需求也会产生, 例如与品牌有高度相关性的分类管理, 按类定制不同的唯一性规则, 属性的关联管理等等。如何高效、灵活的实现需求, 保障平台功能的高可用性是需要持续考虑的。

摘要:目前大部分企业中集团管控主数据的量级, 以物料主数据为最, 主数据用于跨业务、跨系统和跨部门共享, 物料的使用更是贯穿多个业务环节, 包括计划、设计、采购、生产、财务结算等, 其质量的好坏直接影响到业务的开展和领导决策, 重要性不言而喻。物资分类标准化是一个循序渐进的过程, 本文主要阐述主数据管理平台如何通过灵活配置设计实现物资分类标准应用。

关键词:主数据管理平台,物资分类标准,物料

参考文献

[1]赵飞编著.基于全生命周期的主数据管理[M].清华大学出版社, 2015.

[2]刘辉.企业物资分类与采购策略的优化[J].物流工程与管理, 2009, 31 (1) :67-69.

[2]周瑞瑞, 周庚.中国海油物资分类标准再造的实践和思考[A]//中国石油石化企业信息技术论文集, 2014:339.

主数据平台 篇2

构报告,获得监管机构认可后方能开展本项业务。

理财产品包括:

(一)甲方根据乙方的委托,专门为乙方自身或客户设计投资方案,并进行投资运作的理财产品。

(二)甲方自主设计的,乙方根据客户需求并经甲方同意代销的理财产品。

(三)乙方自主设计或代理其他银行销售,由甲方提供资金清算、归集、收益分配等服务的理财产品。

(四)经甲、乙双方协商同意销售的其它理财产品。

三、适用范围

(一)理财产品认购、认购期内撤销、提前赎回申请、提前赎回申请到账、收益分配、到期兑付等业务;

(二)理财产品市场营销、风险提示、客户服务、人员培训等业务;

(三)理财产品对账、差错处理等业务;

(四)甲、乙双方协商确定的其他业务。

四、业务合作模式

乙方选择以下合作模式与甲方开展代理销售理财产品业务合作。双方合作模式包括:

(一)代理销售

1、系统销售。乙方在其业务前臵机开发接口,实现与甲方“银银平台”连接,并通过系统与甲方开展理财产品代销业务。

揭示条款、风险评估测试问卷等)均由甲方负责提供,乙方不得单方面更改。产品合同及其附件是不可分割的,与本协议共同构成乙方就代理销售甲方理财产品完整的合约关系。

贴牌销售模式下,甲方负责提供基础理财产品;乙方负责制作理财产品说明书和销售文本。乙方负责对终端客户的营销、管理和投诉解释工作。

机构理财模式下,甲方和乙方或乙方机构客户直接根据单项产品签订机构理财产品合同。

代理清算模式下,甲方和乙方就每项代理清算的产品签订代理清算产品合同,甲方负责提供参数配臵、资金划转及资金计算、收益分配服务。

六、合作方的权利和义务

(一)甲方的权利和义务

1、甲方享有如下权利:

(1)根据国家法律、法规及其他有关规定,委托乙方办理理财产品销售业务。

(2)甲方有权根据合作模式及本身实际情况自行设计产品和理财方案(包括基础资产、发行金额、投资期限等);

(3)甲方有权选择第三方作为理财产品的代理人,乙方并非甲方唯一的销售代理人。甲方在每期产品代销附属协议中说明给予乙方的最高销售额度。

(4)甲方有权根据合作模式就单项理财产品决定是否授权乙方代理销售以及给予乙方代理销售的额度,并有权调

和时间,给付乙方代理销售费用。

(6)甲方对乙方在业务办理过程中提供的投资人信息、交易数据、乙方商业机密等资料和信息负有保密义务。

(二)乙方的权利和义务

1、乙方享有如下权利:

(1)在本协议规定的范围内,确定乙方的销售策略、业务流程,办理理财产品销售业务。

(2)按照本协议规定的标准、方式和时间,取得理财产品代理销售费用。

(3)对因甲方故意或过失而给理财客户、乙方造成的损失,有权要求甲方承担相应责任。

(4)乙方有权自主选择本协议第四条列出的各种业务合作模式。

2、乙方负有如下义务:

(1)严格遵循国家法律、法规及其他有关规定和理财产品协议书及本协议的规定,办理理财产品销售业务。同时,应按照监管机构的业务规则、意见,制定客户评估、产品宣传和营销活动的合规性管理办法、建立客户投诉处理机制和理财业务人员管理办法,加强风险揭示,避免错误销售和不当销售。

(2)业务开办前乙方应开展市场调研和客户风险评估测试工作;业务开办时采取有效手段和方式,保障理财产品销售业务的正常、高效进行,并为投资人提供优质的客户服

清算账户有可用的、足额的、合法的理财认购资金,否则由此导致乙方理财客户和甲方的损失,由乙方承担赔偿责任。

(7)乙方有义务按照有关国家法律法规和监管规定,要求乙方客户提供真实、有效的身份证件,负责审查、核对乙方客户身份证件的真实性和有效性,并留底备查,并保证乙方客户购买理财产品交易的合法性、真实性和自愿性。若乙方违反国家法律法规在审查、核对乙方客户身份证件的真实性和有效性出现失误,应承担由此产生的全部责任并赔偿甲方损失;

七、业务资料的管理

(一)理财产品销售业务资料是指甲、乙双方在为投资人办理本协议规定的业务过程中形成的各类书面和电子形式的资料。包括但不限于:投资人的各类业务申请表单和相关证明资料、交易记录与确认数据、各类涉及理财产品的协议、合同等。

(二)投资人书面填写的各类业务申请表等书面资料,由乙方依相关法律、法规及乙方资料保管规定妥善保管。根据业务需要,甲方可以在乙方的协助和配合下,对上述资料进行核查。

(三)甲、乙双方在理财产品销售业务中产生的各类交易记录、投资人信息资料等电子资料,由双方依照法律、法规及其他有关规定,以电子数据形式保存,并做好数据备份和维护工作。

十、禁止行为

(一)甲方不得有如下行为:

1、提供不真实的理财产品运作信息和资料;

2、除非法律法规另有规定,未经乙方同意擅自向第三方透露投资人及乙方的应保密资料,包括投资人的详细资料和乙方的商业秘密,另有协议约定的除外;

3、有关法律法规、本协议及产品合同规定的其他禁止行为。

(二)乙方不得有如下行为:

1、对不合格的认购、撤销、赎回等业务申请不经应有审核予以接受,或对合格的业务申请不予接受;

2、未经甲方同意,擅自将代销业务向第三方转委托;

3、除非法律法规另有规定,未经甲方同意擅自向第三方透露代理理财产品业务资料和投资人及甲方的应保密资料;

4、有关法律法规、本协议及产品合同规定的其他禁止行为。

十一、违约责任

(一)资金划拨违约责任:

1、乙方未能在规定时间内把认购资金划至甲方指定账户,导致甲方延误业务申请处理,属乙方过错的,乙方承担全部责任,并赔偿甲方和投资人相关的损失。

2、甲方未能在规定时间内把收益分配资金、到期兑付

本协议任何一方因故意或过失违反本协议的约定,给投资人、另一方造成损失的,应承担相应的经济、法律责任。如属双方违约,由双方分别承担各自应负的责任,并共同赔偿投资人相关的损失。

(五)不可抗力责任:

因不可抗力不能履行协议的,甲、乙双方都不承担赔偿责任。

(六)免责条款:

因中国银行业监督管理委员会等监管机构的政策性因素,终止对本理财产品的发行,甲方将乙方当期所认购本金及募集期间的利息按理财产品说明书的规定返还给乙方,乙方负责将上述资金正确归还客户。甲方不负有任何责任。

十二、差错处理

(一)甲、乙双方应严格按照主协议及产品合同的要求,保证数据传输的安全、及时、准确,并采取有效措施,切实预防业务环节出现差错,对重点环节应进一步加强内部控制和风险预警。

(二)双方指定数据传输固定联系人,保证及时沟通联系,并相互配合对方执行差错处理。

(三)数据核对。理财产品通过系统代销时,甲方将清算后数据发送给乙方,同时发送数据核对文件,由乙方系统对数据进行核对。如一方在核对过程中发现差错,应尽快通知对方,配合查明原因,拿出差错处理方案,以保证数据和

定其他补充协议,其法律效力同本协议。

(二)协议的解除

1、发生下列情形时,甲方有权解除本协议:(1)乙方违反国家法律、法规,或严重违反本协议、产品合同,损害了投资人或甲方的利益,经提示仍然不能改正;

(2)监管部门变更代理人的资质标准,致使乙方不再具备销售资格。

2、发生下列情形时,乙方有权解除本协议:(1)甲方违反国家法律、法规,或严重违反本协议、产品合同,损害了投资人或乙方的利益,给乙方造成不良社会影响,经提示仍然不能改正;

(2)监管部门变更甲方发行理财产品的资质标准,致使甲方不再具备发行理财产品资格。

3、解除本协议的程序

(1)甲、乙任何一方需解除本协议时,应提前向另一方发出书面通知,并说明原因。

(2)按照规定在公开媒体上公告。

在解除本协议的过程中,双方应本着为投资人负责的原则,相互配合,作好交接工作。

(三)发生以下情形之一者,本协议将终止:

1、代销关系终止;

主数据平台 篇3

关键词:主数据平台,交叉审核,推送

为了进一步提升管理经营能力, 实现生产管理效率最大化, 生产运营流程最优化, 许多大型企业引进了ERP (Enterprise Resource Planning企业资源计划) 系统。它是集成了管理理念、业务流程、人财物资源、计算机软硬件于一体的企业资源管理系统。该系统贯彻统一的业务流程、包含企业各种基础业务数据、产生各种企业管理报表, 能够全面体现企业经营情况, 并且能够实现在统一技术平台上的信息共享。

ERP系统具有高度的集成性和拓展性, 由MM物料管理模块、PM设备管理模块、HR人力资源管理模块、PP生产管理模块、BW数据分析模块等组成。物资主数据是ERP系统运行的基础, 它独立于ERP系统, 统一为ERP系统中的MM物料管理模块、PM设备管理模块、PP生产管理模块等提供基础数据, 对采购、销售、设备等各个业务环节有重要的支撑作用。本文主要介绍了基于ECC IDES的主数据清理平台和基于Web模式的主数据管理平台, 分析了两种平台间的异同, 可以看出基于Web模式的主数据管理平台功能丰富, 可以更好地满足企业的需求。

1 系统构架不同

基于ECC IDES的主数据清理平台架构是:首先, 提报有需求的物资主数据, 然后, 依次进行一级、二级、三级审核, 审核通过的数据以E3标识存储在特定的区域, 待数据清理完成, 再统一将标识为E3的主数据发送到MDM赋码, 最后, 分发至ECC。

基于Web模式的主数据管理平台构架是:首先, 对有业务需求的物料在本平台提报数据, 然后, 依次进行一级、二级、三级审核, 审核通过后, 直接将该数据发送到MDM发布库赋码并自动分发到ECC。如图1所示。

在基于ECC IDES的主数据清理平台中, 物资主数据定期统一发送到MDM赋码, 再发布至ECC, 供ERP中的模块使用。已赋码数据的特征值用户无法直接进行修改, 只能由管理员从后台做修改。基于Web模块的主数据管理平台中, 新赋码的数据实时赋码, 并发布至ECC;已赋码数据特征值修改, 集采标识修改, 数据冻结或解冻状态修改, 用户可以随时在系统中直接启动申请修改流程, 审批通过后, 新的状态, 在业务模块中同步更新。可以方便地满足用户数据修改的需求, 而且操作简单, 数据实时发布, 为业务顺利进行提供了条件, 同时缩短了流程周期, 提高了工作效率。

2 安装方式不同

基于ECC IDES的主数据清理平台需要在用户的本地电脑上安装ECC的客户端, 并设置对应的服务器地址后, 才可以使用账号和密码登录系统。该平台要求本地电脑具有一定的存储空间, 工作效率和本地电脑配置有直接关系, 要想高效率地工作, 对电脑硬件的配置要求较高。

基于Web模式的主数据管理平台基于浏览器, 用户不需要在本地电脑安装客户端, 不需要对电脑进行特殊设置, 只要打开浏览器录入服务器地址即可登录, 与上网操作相同。对客户端电脑存储空间几乎没有要求, 对电脑硬件配置要求低, 系统运行速度快。任意一台连接到网络的电脑都可以随时随地登录系统, 方便快捷, 易用性强, 成本低, 效率高。

3 审核方式不同

基于ECC IDES的主数据清理平台是被动式审核, 就是所有提报的物资主数据都处于待审状态。各级审核人员在统一的审核画面里, 通过设置条件, 搜索要审核的数据, 进行审核;如果不设置任何条件, 则可以审核系统中所有待审数据。这样的模式存在两个弊端:

A.待审物料会被锁定:当一个人进入审核画面, 则锁定了所有的物料, 其他审核人员不允许审核, 也无法审核。

B.在审核界面, 审核人员可以根据提报人的账号筛选出需要审核的数据。好处是不会锁定所有待审的物料, 弊端是目前只有这样一个方法筛选。当提报人员很多, 或者是管理上需要按照提报人员对应部门进行审核时, 数据清理平台功能无法实现。

基于Web模式的主数据管理平台是主动推送式审核, 并且实现了比较复杂的交叉审核功能, 介绍如下:

(1) 每个单位设置了不同的部门;每个单位的数据按照物理、财务和管理属性以及内容的专业性划分为多个类别;

(2) 每级审核人员均可以通过配置, 审核一个到多个部门的不同类别下的数据。

(3) 物资主数据提报后, 根据配置, 将待审数据主动推送给对应的审核人。

(4) 如两个审核人审核的数据重叠, 则先审核的人审核完毕后, 另一个人不用再审。

主动推送的审核方式, 是当用户提报新数据, 启动审批流程以后, 通过一定的技术标准或协议, 系统自动将数据传送到审核人员的待办事项中, 审核人员不需要设置条件搜索的审核方式。主动推送不仅节约了审核人员手动搜索数据的时间, 提高了工作效率, 而且可以有效防止待审数据被锁定, 同时避免漏审, 误审的现象出现。

在企业实际运行中, 有专门人员从规范性和专业性等方面对数据进行审核, 审核范围的划分尤为重要。对于专业性强的数据, 可以根据数据内容的专业性划分, 即技术人员根据自己擅长的方向选择适合的数据类型进行专业性审核;对于类别多, 数据量少, 审核人员少的企业, 可以根据提报人员所处的部门选择需要审核的数据;对于提报人员数量多, 提报数据数量大, 数据内容又具有一定专业性的企业, 需要同时考虑数据专业性和提报人员所处部门这两种因素来划分审核范围, 这种审核方式称为交叉审核, 审核人员可以选择某些特定部门提报得某个方面的数据进行审核, 从而提高数据质量。基于Web模式的主数据管理平台, 具备这三种审核方式, 可以满足企业各种各样的需求。

4 平台功能不同

基于ECC IDES的主数据清理平台具备基本的功能, 主要有物资主数据提报、审核、查询功能, 可以满足企业基本需求。

基于Web模式的主数据管理平台功能丰富多样, 满足了现实中复杂的需求。按照用户使用目的不同平台功能分为申请、审核、查询、考核和其他五大类。

申请功能主要有:新增数据提报、标准变更申请、通用码申请、已赋码数据修改、集采标识修改、数据冻结与解冻。用户应按照数据模板, 将业务数据正确录入或批量导入主数据管理平台中, 以提高数据的规范性;对于录入错误或与实际货物不符的特征值, 可提出修改申请, 优化数据, 确保物码一致, 增加了系统的可维护性, 为数据统计分析奠定了良好的基础。

审核功能:数据校验、长描述查重、活跃字段查重、相似度查重、委托审核、批量审核、单项审核、技术审核、规范性审核、加急审核、误驳回标识等。数据需求人员, 在系统中提报数据以后, 通过数据校验, 检查数据中符号使用的规范性和特征值录入的完整性, 提高数据准确性;通过活跃字段查重和相似度查重, 降低数据重码率, 确保数据唯一性, 提高数据质量。对于急需编码的数据, 可以加急审核, 对于有事没在的审核人员, 可以设置委托审核, 系统的这些功能充分考虑了现实情况, 更加人性化;进入审核环节后, 依次进行技术审核、规范性审核和专家综合审核, 专业人员从不同角度对数据层层把关, 确保数据质量。

查询功能:基础数据查询、报表查询、权限查询、数据流程状态查询、数据在业务中的使用情况查询、数据修改历史查询、数据发布查询、数据分发查询、分类体系查询、审核权限查询等。通过查询功能, 实时跟踪数据状态和使用情况, 使流程透明化, 清晰化。系统中已赋码数据可随时查询和使用, 实现信息共享。

考核功能:通过率、使用率、及时率等。通过平台中的考核功能, 从正确性 (通过率) 、及时性、使用情况三个方面加强管理, 缩短流程时间, 提高工作效率。

其他功能:数据暂存、标准的统一发布和管理、待办事项提醒、用户基本信息维护等, 对于主数据管理中的新要求, 在平台制度规范公开栏里定期公布, 让用户及时了解最新制度, 实现信息共享。用户设置待办事项提醒, 在第一时间了解工作任务, 及时处理数据, 缩短流程周期, 提高工作效率。

5 结论

SAPERP主数据管理 篇4

一、确保主数据的准确性

SAP ERP基础数据主要包括系统用户、财务、部门及人员、薪资、物料、生产、设备、客户和供应商主数据等。各数据的准确性是系统有效运行的基础。薪资和财务主数据, 对数据准确性的要求显而易见。物料、生产、客户、供应商主数据的关键字段, 同样直接影响系统内外业务是否能顺利进行, 甚至会影响财务统计。

二、确保主数据维护的及时性和严谨性

主数据维护的特点是自身的及时性和严谨性。销售部门经常在下订单时提出新增或修改需求, 下订单和发货几乎是同时进行, 对系统维护人员来讲, 时间很紧急;类似的数据还有供应商主数据、成品主数据等。这种情况下, 要想保证数据的维护效率, 只能先维护必输入的、基本的主数据字段, 满足用户需求, 让用户的系统业务先运行起来。然后, 主数据人员再收集、录入次要的、非必填的字段。总的原则是, 时间再紧迫, 也要确保数据的准确性和严谨性。数据错误不仅影响业务或财务工作, 还会引起用户对系统准确性、严谨性的怀疑, 这对任何信息系统来讲, 后果都是致命的。

三、主数据维护和管理过程中必须关注的几方面内容

主数据维护和管理, 除了要求主数据维护人员按用户提供的数据模板, 正确录入或导入ERP系统以外, 还要要求其关注以下几方面的内容。只有切实关注到了这些内容, 才能真正做好主数据维护和管理。

1. 关注系统内业务流程及其功能改变

因为ERP主数据的关键字段是与系统业务流程和功能相关的, 体现了系统设计的要求, 所以必须关注系统内业务流程设计及其功能变化。以笔者所在单位的成品主数据的生产版本为例, 成品正常生产和中试生产, 所需的生产版本编码不同, 需分别编码。数据维护人员只有理解正常生产和中试的内涵, 了解生产版本的编码原则, 才能根据生产性质正确维护成品的生产版本主数据。

在系统运行过程中, 系统功能会被优化或改进。这时, 通常会对主数据的维护提出新要求。主数据维护人员须关注这些变化, 确保主数据随时更改。因此, 从管理上应该增加这样的要求:在系统设计、配置发生变化时, 各模块程序维护和开发人员要及时和主数据维护人员沟通, 而主数据人员一定要将这些转化为主数据具体维护要求。

2. 关注系统外业务流程调整及人员调整

企业机构和部门职能的调整、企业政策变化等, 都可能引起系统外业务流程的变化或主数据收集人员的岗位变化。主数据人员必须关注这方面的信息, 及时调整主数据维护流程或者对新员工进行相应的培训, 保证数据维护效率和质量, 防止出现系统内外业务混乱和造成不可逆的错误动态业务数据。如部门数据收集人员的出差与归期, 是否有替代人员代职, 都应该是主数据维护人员关注的。

3. 关注主数据发布, 建立主数据发布制度, 确保主数据与各项系统外业务的衔接

主数据维护完成后, 并不意味着主数据维护流程已经结束。如系统内新增了材料主数据, 有了新的物料号和编码, 除设计人员与采购人员知道外, 还应在主数据维护流程中增加主数据信息发布这一环节, 明确主数据发布的时间、地点、发布的部门、发布范围、如何发布等, 并建立企业主数据发布制度。经过了这样的调整, 业务部门对新增主数据的用途不再有疑惑, 而且可以及时地做出业务反应。

4. 关注数据工作标准的建立和动态维护, 确保数据组每个成员的数据维护质量

主数据维护是随着模块功能要求、系统外流程要求、维护方法的变化而变化的, 是动态的业务。为此, 建立了《SAP ERP主数据维护指南》, 它是一套动态的、共享的工作标准, 起到了保证数据质量的重要作用。该工作标准的形成和共享过程是这样的:数据主管编制《SAP ERP主数据维护指南》, 并将该指南在数据组内共享。数据组里的人员在工作中谁先遇到变化, 谁就可以去改指南, 并将新改的内容发送给数据主管。主管审核通过后, 转发数据组全体人员, 指南就能及时的更新, 又实现了信息共享。

四、做好主数据维护知识和技能培训, 提高主数据维护水平

SAP ERP对主数据维护人员的要求比较高, 要求数据维护人员不仅要懂ERP, 会维护数据, 还要会纠错, 会导入导出数据, 会用EXCEL表格处理大量数据。

1. 加强主数据纠偏方法的收集和培训, 提高纠偏效率

有这样一个实例, 有人员把100多条主数据的评估类搞错了, 由于这批主数据已发生了实际业务, 不能进行修改, 只能新建主数据。这次数据纠错付出了4人/天的代价。事情过后, 找到了修改评估的办法, 并且测试成功, 为今后出现此类数据问题提供了纠错方案。有了这些宝贵的纠错方法和技巧, 会大大提高主数据纠错效率。所以, 这些纠错知识的积累和培训很重要。

2. 加强主数据批导程序和主数据报表开发知识的培训

主数据维护重要的一项技能就是数据批导入。常用的批导程序通常是在上线初期就由开发人员准备好的。可是日常维护过程中, 时常会有新的批导入任务, 不可能只等待开发人员来处理。所以主数据维护人员应该能够熟练地掌握制作CATT和LSMW批导程序。另外, 平时检查主数据质量或者批量导出主数据, 需要展现相关主数据的所有字段, 这时开发报表程序或QUERY报表是最有利的工具。

3. 加强EXCEL数据处理技能培训

数据人员经常面对上千、万条的数据, 经常需要EX-CEL辅助进行大量数据整理。掌握了EXCEL使用技能, 会大大提高数据整理的质量和效率。

有了以上这些技能, 主数据维护人员就可以从容面对维护工作, 优质高效地完成各项任务。

摘要:总结青岛卷烟厂几年来的SAP ERP主数据管理经验, 论述SAP应用企业如何做好ERP主数据管理。

主数据平台 篇5

一是数据缺乏完整性和一致性, 重复数据多;二是数据标准不统一, 共享过程中不知以谁为“主”。

为解决上述现象, 实现数据在整个企业范围内保持一致性、完整性和正确性, 就需要进行主数据管理。也就是从企业的多个业务系统中整合核心的、需要共享的数据 (主数据) , 集中进行数据的清洗和丰富, 并且以服务的方式把统一的、完整的、准确的、具有权威性的主数据分发给全企业范围内需要使用这些数据的操作型应用和分析型应用, 包括各个业务系统、业务流程和决策支持系统等。

用友UAP的主数据管理系统负责主数据服务管理调度、数据读取转换存储以及和其他业务系统的数据交换。在实践经验中, 用友UAP发现很多企业由于分子公司较多, 并且使用的系统多样, 主数据系统和其它业务系统很难实现统一, 并且很难快速筛选出重要信息。

用友UAP主数据管理系统以服务的方式把统一的、完整的、准确的、具有权威性的主数据分发给全企业范围内需要使用这些数据的操作型应用和分析型应用。完全实现具备集成、共享、数据质量、数据治理等关键要素, 将分散的主数据统一集中管理。

比如某金融机构, 面临这样的问题:基础数据不统一, 系统与系统之间数据无法共享, 大量数据重复录入。另外, 针对不同角色人员, 他们希望拥有可定制的自助服务页面, 使信息获取准确、及时。用友UAP根据此客户的系统现状和需求, 将用户数据、单位数据、部门数据、岗位数据、职务数据、人员数据、客户档案数据等都纳入主数据管理。这些数据需要通过主数据管理平台进行统一的管理, 以避免这些同类型数据在各个系统中的重复录入;同时, 用友UAP在该企业服务规范中, 为每种主数据制定相关的数据管理服务, 这些服务对所有应用系统开放。企业内的所有系统均可以通过这些服务获取主数据, 并参与主数据的管理。

面对企业内部异构的系统, 如何从不同系统中快速获取对自己有价值的数据, 成为一大问题。针对于此, 用友UAP采用数据推送的方式。数据源端系统可以发布数据, 同时对该数据感兴趣的系统可以订阅并接收源端系统发出的数据然后对数据进行处理。

首先, 数据发布方通过ESB提供的服务接口将数据放入ESB中, ESB得到数据后, 将其写入消息队列中。然后, 异构系统通过ESB提供的服务订阅感兴趣的数据, ESB在收到数据后通知异构系统有新数据到达。之后, 异构系统通过ESB提供的服务主动访问ESB去取数据, ESB得到取数据请求后, 访问消息队列取出数据。最后ESB将数据返回系统。

炼化设备主数据功能模型初探 篇6

什么是主数据?常说的主数据是指在整个企业范围内各个系统 (操作、事务型系统以及分析型系统) 间要共享的数据, 比如与客户、供应商、产品相关的数据, 更广泛意义的主数据是同一系统或不同系统需要重复利用、共享、互相关联的基础数据, 是企业内能够跨业务重复使用的高价值数据, 存在于多个异构或同构的系统中。主数据通常需要在整个企业范围内保持一致性、完整性、可控性, 为了实现这一目标, 就需要进行主数据管理。主数据管理旨在简化数据共享, 并通过将软件技术与数据管理相结合, 为企业中的每个人提供一致的关键数据, 作为主数据的信息会因行业和组织的不同而有所不同, 也会伴随企业信息化深度和广度的增加而不断扩展。

主数据管理在很早之前就一直存在, 随着信息化技术的应用、业务发展以及监管的需要, 企业对主数据管理的认识有了显著变化。主数据逐渐受到业界的关注和重视, 企业纷纷尝试利用主数据管理解决他们在整个企业范围内进行跨业务、跨地域时遇到的各种挑战和问题。

目前, IBM、SAP、Informatica、oracle等公司的主数据管理技术主要集中在对已有主数据的整合和管理层面, 这与欧美企业信息化程度高又不想放弃现有的数据积累, 同时重新建设信息系统会给企业的经营带来无法接受的损害等有关。而国内普遍信息化程度较低, 就算已经建立了主数据管理系统, 由于企业对数据标准化认识和重视程度不够, 数据维护质量不高, 依旧使企业的主数据管理处于较低水平。

二、炼化设备主数据现状分析

设备是炼化板块的核心资产之一, 与设备相关的信息系统较多。由于各个信息系统核心关注点不同, 建设时采用技术手段不同, 不可避免地导致一些问题的产生。

1. 前期的设备信息化工作重点在于各信息系统建设, 其数据建设及数据标准化均依托于各应用项目, 没有作为独立的部分组织推进。

2. 集团缺乏清晰的数据架构规划, 导致部分数据源不统一, 存在重复采集录入。

3. 设备主数据质量从完整性、准确性都存在一定问题, 并缺乏度量手段。

4. 缺乏独立于应用系统的数据管理平台, 应纳入主数据管理的相关设备数据因标准化和通用程度等方面的不足而未纳入。

5. 数据管理或数据科学作为提升信息化水平, 提升投入产出比的作用未被充分认识。

6. 标准化工作投入不足, 基础性工作激励机制 (用户参与度) 不足, 缺乏国际化与行业领先的决策和决心,

因此, 明确设备管理的对象、范围和方法, 规范基础流程、建立设备管理基础数据库, 实现主数据管理, 落实管理责任, 是应用和发挥信息系统作用的关键。

三、主数据建设方法

虽然企业越来越重视主数据的价值, 但往往不知从何入手, 如何实施。为保证企业主数据建设项目能够有条不紊地顺利实施, 建议企业根据规划方法论, 分阶段、分步骤开展工作。

Informatica MDM产品解决方案把主数据生命周期划分为9个阶段。

1. 访问:了解主数据的来源、现状, 实现不同数据源和应用程序的数据集成方案, 这是主数据获取的入口。

2. 发现:探查数据内容、结构和异常, 分析数据的优势和劣势, 一个关键目标就是明确指出数据错误和问题。

3. 建模:建立正确、灵活的MDM业务及数据模型, 可以有效面对未来的变化和挑战, 模型是项目走向成功的一个重要里程碑。

4. 清洗:对于各系统数据出现不一致的定义及使用方式时, 需要解决错误和矛盾之处, 创建正确、完整的主数据。

5. 识别:快速匹配, 准确识别重复数据并预防重复发生。

6. 解决:合并重复数据, 创建可信的唯一真实版本。

7. 关联:实现与合作伙伴系统、第三方软件、外部产品的广泛数据连接。

8. 治理:创建、使用、管理和监控主数据, 保证可对数据问题进行跟踪, 同时保证长期满足数据质量预期。

9. 交付:以服务的方式把统一、完整、准确的主数据分发给企业范围内需要使用这些数据的业务系统、业务流程和决策支持系统。

这是一个循环往复的过程, 当有新的主数据出现或经过几大阶段治理后的主数据仍未达到质量要求时, 主数据管理都会进入下一轮循环。数据治理的过程贯穿于整个生命周期, 体现了主数据对于数据质量的管控作用。

四、炼化设备MDM功能模型

目前而言, 炼化设备的主要数据源为设备综合管理平台 (EIM) 并集成设备专业监、检测及可靠性/风险分析软件。目前通过接口与EIM交互的系统有:特种设备管理、大机组检测、RCM、RBI、巡点检、操作图;推进中的系统有:MES、腐蚀管理;与ERP的接口也在深化提升中。各项目为分散、分批建设实施, 非集中式部署, 相应缺乏集中统一的主数据等数据管理手段, 需要单独维护;业务数据缺乏全局的可靠性记录、分析管理手段。

在此现状下建立设备MDM的主要目的是提供一个强大的设备主数据管理平台, 可以将主数据编码标准和主数据管理标准流程固化在该平台上, 通过与数字化工厂系统以及EIM系统的集成, 实现将新建项目中竣工交付资料转化为设备运行维护阶段所需的数据信息, 并为EIM和其它设备管理相关系统提供一致性的设备主数据。另外, 还可提取企业现有EIM系统中的设备主数据, 通过对数据的校验和审计确保数据的完整、准确, 并得到及时更新。通过建立统一的设备主数据管理平台, 把主数据收集放在数据产生的源头, 并通过建立主数据维护的唯一入口, 提高基础数据质量, 为设备维修管理与可靠性管理奠定基础。

设备MDM模型要对单台设备建立一个唯一、标准、实时的设备应用数据视图, 将各业务系统中的数据进行抽取、整理和清洗后在MDM模型中建立主数据统一视图, 实现业务元数据和技术元数据的定义, 主要包含数据实体、数据项、关联关系、数据字典、完整性规则、属性、类型等并在ESB发布;提供可视化如报表的主数据展示方式以及分析功能, 对关键指标可以进行预警和提示。功能模型如图1所示。

五、建设效果及风险

主数据平台 篇7

海上平台或FPSO (浮式生产储油装置) 由于远离海岸, 从可靠性及经济性上考虑, 一般海上油 (气) 田开发工程, 都会在海上单独设置主电站。主电站是海上油 (气) 田工程的心脏, 它对整个工程的生产和生活等设施提供电力能源, 以保证海上油 (气) 田生产正常、连续、安全地进行。技术可靠、经济合理的主电站选型设计可以降低工程投资、减少能源消耗、节约操作成本, 提高油田开发的经济效益。

由于风能、太阳能、热电偶发电等新能源技术在海上的应用还不成熟甚至较少, 对于常规能源来说, 影响海上主电站配置和机组选型的主要因素有2个:主电站负荷情况、天然气 (油田伴生气) 或原油等燃料的可用性。本文将以具体项目为例, 分析这2个因素对主电站配置方案的影响。

1 分析主电站负荷工况, 合理配置主电站

1.1 工况条件

某项目为一气田开发项目, 项目开发将设1座中心平台, 平台主要负荷组成见表1。

电负荷组成显示, 气田开发期间, 平台各年份的生产、生活用电负荷较为平稳, 变化不大, 但压缩机驱动负荷随生产年份不同变化较大。表2列出了各年份压缩机驱动负荷需求。

1.2 设计难点

不同工况、不同年份、甚至不同季节下的电负荷大小和特点, 直接影响到主电站的总装机容量、机组台数配置、机组运行方式的调配以及备用系数的考虑等。在本案例中, 压缩机在最大年份的驱动负荷为1550kW, 而平台其它生产、生活用电负荷最大为1740kW, 2项负荷基本相当。因此, 压缩机的驱动方式将直接影响到平台主电站的配置方式。

由于本项目中压缩机采用往复式压缩机组, 压缩机既可由电机驱动, 也可由往复式天然气发动机组驱动。2种不同驱动方式下的主电站负荷见表3。

当主电站负荷确定后, 主电站设计容量应能满足平台最大负荷需求。而在确定机组的具体配置方式时, 则要考虑机组的技术成熟可靠性、机组运行的经济性、初期投资、燃料供应情况及机组维护、维修操作费用等等诸多因素。

1.3 节能、经济的主电站方案

本案例的复杂性在于, 压缩机的驱动方式不同, 机组投资有所不同;同时, 不同的驱动方式下, 主电站容量不同, 对主电站的投资也有影响。因此, 其经济性需要综合考虑。表4列出了压缩机在2种驱动方式下, 主电站与压缩机组投资的综合比较。

本案例最终配置方案为:在气田投产第4年, 配置3台天然气发动机驱动往复式压缩机。主电站由2台天然气发电机组+1台柴油发电机组组成, 柴油发电机组为备用机组。此配置方式的优势体现在以下几点:

(1) 节能设计。由于压缩机在气田开采后的第4年才需要配置, 压缩机采用天然气发动机驱动方式时, 在气田开采期内, 主电站负荷比较平稳, 机组负荷率可以维持在合理的区间范围内, 保证较高的主电站机组热效率。避免了当压缩机采用电驱动时, 主电站前期余量大, 机组运行在低负荷率下, 运行热效率低, 造成能源浪费的问题。

(2) 机组易于操作维护。为弥补天然气发电机组只能以天然气做为燃料, 燃料单一的不足, 确保主电站运行的可靠性, 除天然气发电机组外, 再设1台柴油发电机组, 作为主电站机组的备用机组。与往复式双燃料机组比较, 天然气发电机组及柴油发电机组的价格相对较低, 维护工作量小, 大修周期长, 易于操作管理。

(3) 经济优势。机组总投资最低, 经济效益较好。主电站机组与压缩机驱动机的机型一致, 机组运行的维护操作费用低, 经济性有较大优势。

2 合理利用能源, 增加经济效益

2.1 能源供应条件

某项目为一油田开发项目, 油田生产物流中含有一定规模的油田伴生气, 油田伴生气如不能作为燃料气利用, 就只能通过平台火炬燃烧掉。根据油田伴生气逐年产量、用电负荷及用热负荷的逐年分布情况, 得到的伴生气的供、需热量平衡图 (如图1) 。

油田伴生气可供热量低于平台总需要热量, 但在整个油田开采经济年限年份中, 远高于热站所需供热量;在经济年限的约一半时间内 (前7年) , 伴生气供热量高于主电站机组所需热量。按照常规设计, 虽有2种配置方案可供选择, 但却都存在缺陷:

(1) 主电站采用原油发电机组, 热站以油田伴生气为燃料。此方案下, 虽然油田伴生气的部分热量被利用, 但大部分热量仍然会白白浪费掉。而这部分浪费掉的热量, 以燃烧原油的方式来补偿———原油发电机组燃烧大量原油以获得所需的热能。这样, 出现了一边在燃用价值较高的能源, 减少了油田开发收益, 一边却又在浪费能源的情况。

(2) 主电站采用燃气透平发电机组 (后期以柴油为主要燃料) , 热站采用余热回收装置 (前期需补燃) 。虽然这个方案的油田伴生气利用率较前者高, 但即使不计前期补燃的燃料用量, 在油田开采后期 (约6年) , 将会至少有一台机组要以柴油为主要燃料, 柴油耗量约45吨/天。每年的燃料费用累计将会相当高, 并导致油田开采成本大大增加, 经济效益降低。

2.2 主电站方案的优势

本案例油田伴生气配产的特点是, 虽然与平台总的燃料需要量相比并不充足, 但仍具一定潜力。为充分利用油田伴生气, 主电站最终采用2台7680kW原油发电机组与3台3300kW天然气发电机组并网运行方案。其优势具体表现在:

(1) 燃料利用灵活、经济, 机组运行可靠。同时选择以天然气为主要燃料及以原油作为主要燃料的不同类型发电机组, 并将其组合在一起并网运行, 是增加燃料利用灵活性的有效方法。天然气发电机组与原油发电机组组合后, 实际是以原油发电机组作为备用机组, 巧妙地解决了备用燃料问题。这样, 不但主电站运行的可靠性得到保证, 也使天然气发电机组在技术、经济上的优势得以充分发挥。

(2) 最大限度减少现场的机组维护工作量。天然气发电机组本身的日常维护工作量小, 大修周期长, 便于现场实际操作管理, 运行费用低, 与原油发电机组同属于往复式机组, 这种机组组合方式对于机组日常维护管理的不利影响最低。

(3) 机组运行方式灵活。在考虑燃料气分配方式时, 较小规格的机组既能够充分利用油田伴生气, 又可以尽量避免机组负荷率的频繁变化, 减少配电系统设计难度, 并可根据油田投产后实际的产气量情况, 灵活、方便的配置主电站机组的实际运行方式, 方便现场操作管理。

(4) 经济效益显著。采用原油发电机组与天然气发电机组并网运行方式, 虽然与采用单一机型比较, 会使机组投资增加, 但由于充分利用了油田伴生气, 节约原油燃料费用约1亿2000万元, 节省的原油消耗价值通过增加的原油收益体现。经测算, 节约原油创造的经济效益, 使内部收益率提高了约0.8%, 为油田开发方案得以顺利通过做出了很大贡献。

3 结束语

主电站设计方案的研究论证, 在海上油 (气) 田开发工程设计前期阶段的诸多复杂研究工作中, 是其中非常重要的一项。在进行机组选型时, 需要分析研究包括机组的可靠性、运行经济性、初始投资费用、油田能源条件、各工况下用电负荷、单机功率和台数的选配、机组综合热效率的提高、机组的操作和维护难易程度以及维修费用、对生产和生活环境造成的影响等诸多因素。不同的项目条件, 所主要考虑的侧重点也有所不同。

作为工程设计人员, 应不断跟踪世界上先进技术的发展状况, 打破固有思维模式, 综合评定诸多因素之间的内在关系和利弊, 使得所选定方案在技术上既具有一定先进性又能符合现实的客观条件, 经济上能够合理的兼顾工程的初始投资费用和油气田的长远运营操作费用。

摘要:影响海上主电站设计的因素很多, 结合具体案例, 分别对主电站负荷工况对主电站选型的影响、项目能源条件对主电站选型的影响进行分析论证。

关键词:主电站,总用电负荷,油田伴生气,合理性,经济性

参考文献

[1]《海洋石油工程设计指南》编委会.《海洋石油工程设计指南》第2册.《海洋石油工程机械与设备设计》.

[2]陈希, 宫西成, 寇晓飞, 孙维.海洋石油平台主电站发电机组不断电并车调试方案研究与实践[J].中国海上油气, 2011, (02) .

数据变换对主成分提取的影响 篇8

运用主成分分析法分析问题的关键是求解主成分,其理论方法就是协方差矩阵。但协方差矩阵易受指标量纲和数量级的影响。一般的消除量纲的数据变换是用标准化的方法,但有时经过标准化后的数据对相应实例效果并不理想。这是因为对原始数据进行标准化处理,协方差矩阵变成相关系数矩阵,标准化处理虽然消除了量纲与数量级的影响,但同时也消除了各指标变异程度上的差异[1]。

原始数据中含有两方面的信息:(1)各指标变异程度的差异信息,此信息是由各指标的方差大小反映出的;(2)各指标间相互影响程度上的差异,体现在相关系数矩阵上。从标准化的数据出发提取的主成分,实际上只包含了各指标间相互影响这一部分信息;由于各指标的方差此时都是1,故消除了各指标变异程度上的差异。因此,采用标准化方法不能准确反映包含在原始数据中的全部信息,我们有必要探究其他的数据变换方法对主成分提取的影响。本文主要探究极差正规化和非线性变换方法对主成分提取的影响。

1极差正规化对主成分提取的影响

针对主成分分析法,标准化处理并非唯一的无量纲化方法。在许多文献中,所提及的使用主成分分析必须进行标准化处理的观点是片面的。为了改进原始数据的无量纲化,均值化方法、极差标准化、极差正规化方法等都是较好的选择。均值化方法可参考文献[2]。

所谓极差正规化方法,就是用各样品值与此样品中的最小值之差,再除以该样品的极差,用所得结果作为新的样本数据。

设有n个被评价的对象(样品),p个指标,原始数据为(xij)n×p,各指标均值为x¯j=i=1nxij/n,设

xij*=xij-min1in(xij)max1in(xij)-min1in(xij)(i=1,2,,n;j=1,2,…,p) (1)

式(1)中,x*ij表示原始数据采用极差正规化方法无量纲化后得到的新数据列,令R=max1in(xij)-min1in(xij)表示各样本的极差。并设新的数据x^ij的均值为x¯j*=i=1nxij*/n

极差正规化后,数据的协方差矩阵Σ=(βij)p×p的元素,如式(2)所示:

βij=l=1n(xli*-x¯i*)(xlj*-x¯j*)/(n-1)(2)

式(2)中,βij表示极差正规化后新数据列x*ij的协方差。

由式(2)极差正规化后,可以得出,如式(3)所示:

βij=l=1n(xli*-x¯i*)(xlj*-x¯j*)/(n-1)=l=1n(xli-x¯i)(xlj-x¯j)/(n-1)RiRj=νijRiRj(3)

式(3)中,νij=l=1n(xli-x¯i)(xlj-x¯j)/(n-1)表示原始数据xij的协方差。

特别地,当i=j时,可以得出式(4)和式(5)。

βij=νiiRiRi=(νiiRi)2 (4)

νii=l=1n(xli-x¯i)2/n (5)

因此,运用极差正规化方法,所得数据协方差矩阵的对角元素,是各指标的变异系数νii/Ri的二次方,反映了各指标变异程度的差异。

在极差正规化之前,反映各指标间相互影响程度的相关系数r′ij 的计算公式,如式(6)所示。

rij=νijνiiνjj (6)

在极差正规化之后,相关系数rij的计算公式发生了变化,如式(7)所示。

rij=βijβiiβjj (7)

将式(3)代入式(7)可以得出如式(8)所示。

rij=νijRiRj/νiiRiνjjRj=νijνiiνjj=rij(8)

通过以上的公式变换,可以说明极差正规化处理是不会改变各指标间的相关系数的,相关系数矩阵的全部信息,都可以如实地反映于对应的协方差矩阵。经过极差正规化处理的协方差矩阵,不仅去除了指标量纲与数量级之间的影响,而且包含着原始数据的全部信息。因此,应用主成分分析法做综合评价之前,可以首先运用极差正规化方法进行无量纲化处理。

2非线性变换对主成分提取的影响

一般说来,传统主成分分析方法存在两个方面的不足:(1) 如果指标间的相关性较小,那么每一个主成分承载的信息量就会随之变小,为了符合累计方差贡献率达到一定水平(一般为85%以上)的要求,就需要选择更多的主成分,这就造成了主成分分析降维作用的失效;(2) 作为一种“线性”降维技术,主成分分析只能处理线性问题:一方面,主成分是原始指标的线性组合,另一方面,标准化处理原始数据,会使协方差矩阵变成相关系数矩阵,相关系数矩阵只能反映指标间的“线性”相关程度。

然而,在许多实际问题的研究中,指标间不仅会存在线性关系,有时主成分与原始数据之间也同样会呈现出非线性关系。如果只是简单地进行线性处理,可能会对所研究的问题产生偏差。为了能够提高降维效果,一般需要对原始数据进行函数处理:首先,作出原始数据列xij的散点图。如果该散点图显现出某种曲线特征,如对数曲线特征,则可令γij=lnxij(其中,ln表示自然对数),再对γij进行主成分分析,经过处理的结果显然比“线性”分析所得结果更有说服力。那么,对传统主成分的“线性”分析进行改进,就显得至关重要。

关于非线性主成分分析法在相关文献[2,3]等都有提及。本文主要介绍“对数中心化”对主成分提取的影响。

“对数中心化”的非线性主成分分析方法的基本步骤,如下:

首先,设有p个指标的原始数据为(xij)n×p,

Step1:对原始数据作中心对数化变换如式(9)所示。

γij=lnxij-j=1plnxij/p (9)

式(10)中,i=1,2,…,n;j=1,2,…,p,γij表示原始数据进行对数中心化后所得到的新数据列。

Step2:计算对数中心化后的样本协方差矩阵Ω=(vij)p×p,如式(10)所示。

vij=l=1n(γli-γ¯i)(γlj-γ¯j)/(n-1) (10)

式(10)中,vij表示对数中心化后所得到的新数据列γij的协方差。γ¯i如式(11)所示。

γ¯i=l=1nγli/n (11)

Step3:从Ω出发求主成分,设λ1≥λ2≥…≥λp是Ω的p个特征根,ξ1,ξ2,…,ξp是对应的正规化特征向量,则第i个非线性主成分,如式(12)所示。

Yi=j=1pξijlnxij (12)

接下来的分析处理方式与传统的主成分分析一样。

通过以上的分析可以得出,“对数中心化”方法与传统方法相比,有两个显著的优点:(1)原始数据的对数中心化变换,可以将主成分表示为原始数据的非线性组合;(2)“对数中心化” 以样本的协方差矩阵作为出发点进行分析,不再是相关系数矩阵,从而丰富了所要反映的原始信息[4]。由于这两个优点,该种方法可以提高主成分分析降维的效果,即使用更少的主成分,反映更多的原始数据的信息。

3实例分析

为了研究2008年山东省各个城市经济发展差异性的主要原因,本文选取了以下九个反映山东省各城市经济发展因素的指标变量:地区生产总值(亿元)x1、人均地区生产总值(元)x2、第一产业总产值(亿元)x3、第二产业总产值(亿元)x4、第三产业总产值(亿元)x5、财政收入(万元)x6、批发和零售总额(元)x7、在岗职工平均工资(元)x8、人均纯收入(元)x9。数据来源参考文献[5],具体见表1。

我们以山东省17个城市的相应的经济指标为研究对象,先将原始数据分别用标准化方法、极差正规化方法和非线性方法处理,再进行主成分分析。用这三种方法得出的特征根、贡献率和累计贡献率的计算结果,见表2。

注:表中,λ表示特征根;ar表示贡献率;a(r)表示累计贡献率。

由表1的计算结果可以得出以下结论:

第一,若用标准化方法处理,要使累计贡献率达到80%以上,需要选取4个主成分。总共有9个变量,根据标准化的主成分分析法,要选取以上4个主成分,则降维效果差。

第二,若用极差正规化的主成分分析方法可得,前两个主成分包含的原始信息已近85%。其中第一主成分包含的信息58。01%比传统的方法第一主成分承载的信息44。65%高10%以上,由此可见,对原始数据进行极差正规化有一定的优越性,可用较少的主成分提取更多的原始信息,降维效果显著提高。

第三,在此实例中,样品指标间的线性关系比较明显,但非线性化(对数中心化)处理的结果仍然比传统方法要好,需要提取3个主成分,对此数据进行非线性变换后,降维效果也有所提高。

4结束语

本文首先讨论了标准化后的数据对原始数据信息的反映可能会产生丢失,引入了其他的数据变换方法,主要介绍了极差正规化方法和非线性的对数中心化方法。并通过实例验证得出:在主成分分析过程中,数据的处理变换对主成分提取有显著的影响,极差正规化的主成分分析方法和非线性对数中心化的主成分分析法都可以选取比标准化的主成分分析法较少的主成分,来反映样本数据所含的大部分信息。

摘要:首先介绍数据变换中极差正规化和非线性变换方法对主成分提取的影响。然后结合山东省2008年的具体经济实例,分别对用标准化、极差正规化和非线性变换方法所得的数据做主成分提取。最后通过比较可得后两种数据变换改进主成分分析的特征提取,比传统的标准化数据变换方法具有优越性。

关键词:主成分分析,极差正规化,对数中心化

参考文献

[1]王学民.应用多元分析(第三版).上海:上海财经大学出版社,2009

[2]叶双峰.关于主成分分析做综合评价的改进.数理统计与管理,2001;20(2):52—61

[3]陈述云,张崇甫.对多指标综合评价的主成分分析方法的改进.统计与研究,1995;(1):35—39

[4]王惠文.偏最小二乘回归方法及其应用.北京:国防工业出版社,1999

上一篇:国网信阳供电公司下一篇:文学策略