多维度模型(共8篇)
多维度模型 篇1
0 引言
建设智能化电力调度系统是建设统一坚强智能电网的关键环节, 是保障智能电网运行和发展的重要手段[1,2,3]。智能调度的关键技术之一是电网模型管理技术。电网模型管理遵循IEC 61970标准, 以公共信息模型 (CIM) 可扩展置标语言 (XML) 或CIM/E文件作为交换模型的方式, 以模型维护和生成、模型版本管理为主要内容, 实现跨区域、跨层次、跨应用的模型共享[4]。目前, 模型维护、模型拆分/合并技术发展已比较成熟[5,6,7,8,9], 主要集中于模型维护与模型建立, 而模型版本管理技术方面有待完善。
电网模型具有时间、空间、应用多维度特征:首先, 在生产环境中, 物理设备发生变更时模型需要进行相应的修改, 并在完成一系列校验后将合法的模型及其对应的数据库、画面、索引表等投入在线运行, 从而在时间维度上产生许多版本的电网模型;其次, 中国互联电网广域分布的特点决定了电网管理采用分层分布的管理模式, 各调度中心单独维护各自电网模型, 同时, 为了掌握整个电力系统运行状态, 需要由模型拼接生成全网模型, 拼接形成的全网模型作为模型版本管理的初始输入, 这样在空间维度上就有各地区电网模型及全网模型;最后, CIM是电网基础信息的特殊子集, 除此之外, 在调度中心内部, 不同的应用系统对模型的建模范围、包含的类及类属性需求不同, 建模的侧重点也不同, 在应用维度上会产生面向应用的个性化电网模型。
文献[10]提出了一种基于模型集和差异模型的电网模型多版本管理方法, 根据各应用模型与基础模型差异对基础模型、应用模型进行了统一管理;文献[11-12]提出了一种基于目录的方式实现模型时间、空间维度的多维管理, 版本信息维护复杂, 且非增量存储, 冗余信息多;文献[13]提出了一种基于逻辑版本树在时间、应用维度上管理电网模型的方法, 支持增量和全量存储, 但是该方法不能对各地区、全网模型进行统一存储与管理。
模型维护、模型拆分/合并、面向应用个性化模型定制技术需求使得各调控中心积累了大量不同版本的模型, 为模型的版本管理技术奠定了基础, 而现有模型全量高冗余、全库表机构化的存储方式与模型管理维度已经不能满足模型管理的需求。在此基础之上, 本文提出了一种基于分布式数据库的多维度电网模型一体化存储与管理机制。首先介绍了模型数据一体化存储与管理机制, 其次详细阐述了模型库表设计, 时间、空间、应用三维度上的管理, 增量存储等关键技术, 最后给出了该模型存储与管理方法在一省多地实施的应用案例, 并指出了其对满足新时期智能电网与用户需求的优势与实际效果。
1 方法概述
随着电网的互联, 不同区域之间的电网联系越来越紧密, 对大电网的控制由原有的独立调度模式转变为现有的协调调度模式。不同地区电网的协调需要各地区的模型作为基础, 因此, 对不同地区的电网模型进行管理成为电网协调控制的先决条件。
智能电网的迅速发展使得电网日新月异, 电网的快速变化使得电网模型也会变化较快, 因此, 把不同历史时刻模型及时存储下来并进行管理, 将有利于借助历史模型研究电网的发展, 这使得管理不同时间版本的电网模型成为重要需求。
电网调控系统的逐步发展完善使得调控应用越来越丰富, 另外, 不同应用之间的信息共享与交互变得越来越重要, 这使得不同应用维度的模型管理变成模型管理的重要方面。
图1是本文提出的多维度电网模型一体化存储与管理机制, 以CIM/E作为模型交换规范, 各时间、各地区、各应用的电网模型统一存储在基于版本化分布式存储方式的多维度模型版本库中。
在某个时刻, 当某地区发布某应用一个新的CIM/E格式的电网模型后, 全网模型会随之产生一个新的版本, 新版本的CIM/E将与当前版本的CIM/E进行比对生成结构化查询语言 (SQL) 增量, 之后分布式数据库执行SQL增量, 新版本CIM/E将在分布式数据库中只存储其相对于上一版本变化的数据。同时, 分布式数据库维护了地区、应用类型、版本等信息, 多维度模型管理机制基于此提供了按地区、按应用查询任意历史版本的电网模型接口, 并支持单表、地区、全网模型加载。
2 关键技术
2.1 版本化分布式数据库
随着海量数据存储技术的发展, 一种分布式、版本化、高可靠性、高性能、可伸缩的开源数据库HBase[14]广泛应用于互联网数据存储中, 文献[15]提出用HBase存储电网历史采样数据。HBase是Google BigTable[16]的开源实现, 以表的形式存储数据, 由行和列组成, 列划分为若干个列簇, 表的索引是行关键字、列关键字和时间戳, 每个值是一个不解释的字符数组。一个表可以想象成一个大的映射关系, 通过主键, 或者主键+时间戳, 可以定位一行数据。关键字、列关键字和时间戳的索引机制能够较好地满足各时间、各地区、各应用电网模型的管理要求。
另外, Hbase底层基于分布式文件系统Hdfs[17]存储, 每个文件都被切割成相同大小数据块进行存储, 数据库中数据的访问都是以数据块作为最小单位, 因此可以达到高度的并行, 能够满足电网模型数据的高速访问要求。另外, 为了保证数据的可靠性, 以数据块为单位备份, 备份数目可设置, 通常为3, 这样同样数据块在同一机架不同机器和不同机架上都会存储, 某一块数据被损坏, 可以由其他备份恢复。考虑到电网模型作为系统的最底层的基础数据, 其作用非常重要, 因此在系统设计中, 备份数目设置为3, 这样能够保障任意两台备用机器故障的情况下系统对模型的访问依然正常。
2.2 模型库表设计
2.2.1 元数据管理
分布式数据库HBase中每个值都是字符串形式, 无类型, 因此在分布式数据库中创建模型库表时, 需要维护模型表的数据类型。本文通过在分布式数据库中建立了一张模型库表的信息表tableInfo来实现, 如图2所示。
在tableInfo中, 主关键字RowKey为模型库表名+列名, 列簇一个, 名为Columns。列簇下的列标识了模型库表中各列的属性, 包括能否为空、数据类型、数据长度、是否为主键等关键信息。在分布式数据库中创建某模型库表时, 不但会在分布式数据库中增加一张表, 同时在tableInfo中会添加相应若干行描述表信息。
2.2.2 多维度版本信息管理
电网模型具有时间、空间、应用多维度特征, 多维度的模型管理不但能够针对各种不同的应用提供不同特点的模型, 而且能够根据模型的变化形成不同的模型版本, 同时统一维护各调度中心的模型, 要实现此种管理就必须同时对这三维度信息进行管理。本文通过存储于分布式数据库中的一张表VersionInfo来实现, VersionInfo记录了版本号、地区、应用对应关系, 见表1。
表中各列的说明如下。
1) RowKey:主键, 从0自增长。
2) Ts:时间戳, HBase自动生成。
3) CF:列簇, 一个。
4) verNo:版本号, 全局统一。
5) subTime:记录版本提交时间, 格式如20130516092200, 通常该时间由CIM/E解析获得。
6) area:记录了是哪个地区模型, 全网模型视为特殊地区, 标记为xxx_quan, 如fujian_quan, 代表的是福建的全网模型。
7) appName:记录了是哪个应用的模型, 如scada, public, pas等, 基础模型视为特殊应用模型。
8) verName:版本名。
9) descrip:版本描述信息。
10) delFlag:删除标志, 默认为FALSE, 表示版本未删除, 版本被删除时, 置为TRUE, 查询该版本信息时该版本将不再显示, 在数据库里并未被真正删除掉。
2.2.3 模型数据在分布式数据库表中存储
由于模型库的库表结构固定, 一般会预先在分布式数据库中建立一套模型库表, 基于标准SQL语句, 表映射如下。
1) 分布式数据库表名:域名.原表名。
2) 列簇:一个, 统一命名为Columns, 列簇下列名和建表语句中的列名一一对应。
现有电网模型数据有存储于CIM/E中的, 也有存储于商业库中的, 无论哪种存储方式, 在分布式数据库中映射原则都统一如下。
1) 主键 (RowKey) :自增长。
2) 时间戳 (Ts) :每次更新某表数据时, 统一打时间戳, 时间戳为当前时间或来源于CIM/E文件, 精确到秒, 格式如20130509160320。
3) 表数据:更新列簇下相应列数据。
图3展示了CIM/E格式电网模型数据在分布式数据库中的存储方式。
2.2.4 增量存储
不同版本模型的存储主要有全量与增量两种方式, 这两种方式的比较如表2所示。
原有的系统大多采用模型的全量存储方式, 为了做到模型的精细化管理, 也为了更好地做到模型的树状版本管理与可追溯管理, 从而做到谁维护谁负责, 使得模型质量的可控, 这里采用模型的增量存储方式。在传统商业数据库中, 因为系统的单机管理架构, 使得增量模型存储后对全量模型的访问能力大打折扣。采用分布式数据库之后, 由于其并行访问机制, 能够在达到模型更细粒度管理的同时, 保证模型全量与增量访问的效率。
在生产环境中, 一个地区某应用的模型, 经常需要进行修改, 在时间维度上会生成一系列版本, 如果每次对所有表进行存储, 必然会造成数据大量冗余。因此, 在提交新的版本时需要和旧版本进行比较, 比对增加了哪些记录、删除了哪些记录、或修改了哪些记录。
本文提出的方法中, 用SQL语句来描述这些变化, 之后对分布式数据库执行SQL增量, 并打统一时间戳, 新版本将以增量方式存储于分布式数据库之中, 同时, VersionInfo会维护版本提交时间和版本号的映射关系。由于新版本只存储了相比上一个版本变化的记录, 数据的冗余度大大降低。
2.3 模型的时间、空间、应用三维版本管理
2.3.1 时间维度
HBase提供了一个特殊的列Ts进行数据版本的管理。本文提出的方法中正是利用Ts实现了时间维度上电网模型版本的管理。在进行新版本的入库操作时, 给新版本的增量数据打上统一的时间戳, 并由另一张表VersionInfo维护版本提交时间和版本号的映射关系。同时, 在分布式数据库中提供按版本提交时间或版本号查询版本的接口, 支持对任一历史时刻电网模型的下载、发布、计算和其他服务。
通过时间维度进行电网模型可追溯管理过程中, 先访问VersionInfo, 查询版本号对应的提交时间, 然后基于版本提交时间对分布式数据库中对应的模型库表的时间戳列进行数据扫描, 与版本提交时间最近的数据即为所查询版本的模型数据。图4展示了电网模型在时间维度上的管理方式。图中:v1, v2, v11为版本号。
2.3.2 空间维度
长期以来, 电力系统各级调度中心对电网模型的维护是分散的。本文提出的方法中, 各地区和全网模型统一存储于分布式数据库中。一个版本的模型数据包含各个地区的所有数据, 而全网模型为各地区模型的“并集”。模型的空间维度管理要求支持对不同地区和全网模型的访问, 如前面在模型库表映射中所述, 原模型库表映射到分布式数据库后, 在表名前加了地区信息, 此信息可以用于空间维度模型管理, 另外, VersionInfo中也有地区信息的记录, 也可以用于空间维度管理。当访问某个地区模型时, 扫描VersionInfo的area列, 即可获得该地区的模型。图5展示了电网模型在空间维度上的管理方式。
2.3.3 应用维度
在同一调度中心各应用系统之间, 对电网模型的需求各不相同, 建模侧重点也不相同, 如能量管理系统强调的是电网模型拓扑的正确和设备参数的完备;调度管理信息系统关注电网模型设备对象的建立以及资产设备的完整;计划模型则要求能够反映未来的时间段内模型的变化情况。由于侧重点不同, 在过去相当长的时间内, 各个应用系统需要的私有模型是在通用信息模型的基础上各自独立维护的, 随着电网运行管理的一体化, 应用之间协调交互的增多使得模型原有的管理方式无法较好地满足其交互与共享要求, 因此, 需要提供统一的模型维护和管理机制, 为各应用系统提供符合其需求的各类模型。
分布式数据库多维度模型版本信息管理表VersionInfo中列appName记录了模型属于哪个应用的私有或公共模型, 通过标识位来区分, 形成不同的版本分支, 不同应用模型的私有信息进行增量存储, 具有较高的兼容性来应对不同应用的模型信息协调交互, 能够支持模型版本的应用维度追溯。以此来实现应用维度的模型版本统一管理。
2.4 模型多维版本管理应用
不同维度模型版本管理的原因、方法与应用如表3所示。
在时间维度上, 基于不同时间的模型版本管理, 可以支撑电网时序仿真、断面管理、态势感知等应用场景, 使得用户能够更好地了解电网的变化, 认识其规律, 保障电网的安全运行。在空间维度上, 基于不同地区的模型版本管理, 可以支撑联合反事故演习、电网的协调调度等应用场景, 使得相邻不同地区电网、上下级电网以及其他关联电网用户能够较好地进行电网的协调调度, 这能够很好地克服电网责任边界的协调问题。在应用维度上, 基于不同应用的模型版本管理, 可以支撑电网规划运行一体化、一体化运营监控等应用场景, 一方面能够为不同应用对模型的个性化私有信息存储访问提供支撑, 另一方面还能够为不同应用之间的信息交互与协调提供统一管理平台, 这为不同应用的一体化交互提供了信息支撑。
3 应用案例
本文提出的多维度电网模型一体化存储与管理技术已成功应用于“福建电网一体化互备支撑技术研究与开发”项目中, 该项目基于云计算技术在厦门云中心建立福建省调、福州地调、莆田地调备用, 是一种多主一备的备用方式, 项目中福建、福州、莆田地区模型及全网模型统一存储于本文所设计分布式数据库表中。通过此系统, 可以获得某个地区、某个应用、任一历史版本的电网模型, 并能用CIM/E格式文件导出, 实现时间维度、空间维度、应用维度三维管理, 且导出时间在1min以内, 能够较好地为各地区调度自动化备用系统提供统一的模型服务支撑。按照原有系统的方式需要维护不同地区、不同应用的多套模型, 借助多维度模型管理系统, 只需要对一套全模型进行统一维护, 然后抽取、生成、分发不同地区不同应用的模型供各地区各应用使用, 还能对不同时间的版本进行追溯与服务。另外, 由于是增量存储, 100个历史版本的福州模型在分布式数据库中所占空间约为原来的1/10, 这里备份数目为3。
4 结语
本文提出了一种基于分布式数据库的多维度电网模型一体化存储与管理方法。该方法不但可以实现电网模型在时间维度上的可追溯管理, 而且在空间上实现了各地区和全网模型一体化存储, 此外, 在应用维度上支持个性化电网模型存储与管理。该方法能有效解决电网模型“孤岛”问题, 并支持未来大电网模型存储, 未来可以与云计算技术进一步结合, 建立电网“模型云”, 支持电网模型的发布与订阅, 电网模型以服务的方式提供, 用户可以按需获取。
摘要:智能调度要求完整、一致、准确、及时、可靠的电网模型数据支持。文中提出了一种多维度电网模型一体化存储与管理方法, 以满足“横向集成、纵向贯通”和调度中心基于全电网模型的分析、计算以及智能调度等新型业务需要。该方法基于版本化分布式数据库建立了一体化存储与管理机制, 将不同历史版本、不同地区、不同应用CIM/E格式电网模型数据统一存储于分布式数据库中。文中所提出的方法不但可以在时间维度上进行电网模型可追溯管理、在空间维度上实现各地区与全网模型统一存储, 而且可以满足公共信息模型和私有应用模型存储与管理需求, 此外, 电网模型在分布式数据库中以增量方式存储, 大大减少了冗余数据。
关键词:可追溯管理,分布式数据库,增量存储,版本化
多维度模型 篇2
关键词:多维分析;项目管控;支撑
中图分类号:TP311.52
通信运营商为应对4G牌照的发放,所开展的各类网络、运维建设项目数量不断增加,对项目建设质量、精度及进度的也提出了越来越高的要求。由于运营商自身的特点导致项目建设任务非常繁重,建设内容也比较繁多,建设时间又非常紧迫;另一方面,运营商的管理特征又导致项目管理的生命周期全过程被分拆在了多个职能管理部门内进行实际的管理和操作。这两个因素相互作用,使得企业的项目管理过程变的错综复杂。因此,有必要通过构建基于多维分析数据模型和方法的项目管控支撑系统,为各级管理者提供了统一的项目数据分析工具,提高项目建设、协同效率,降低内部管理成本,为企业取得在4G时代的网络运维项目建设方面的领跑优势提供有力支撑。
1 系统构建背景
1.1 4G时代的到来给项目建设管理带来新的挑战
随着4G牌照的发放时间不断临近,对通信运营商而言,投资项目的领域也由原来的第二代、第三代移动通信技术,即将发展到第二代、第三代、第四代同时建设的时期,三网同时建设的规模和数量也突破了历史的新高。项目建设的成效将最终影响运营商市场竞争的运营基础,所以如何管理好这些建设项目,是一个严峻的课题。
1.2 原有的项目管理支撑手段亟需完善
以笔者所熟悉的某省级通信运营商为例,公司全省范围内每年的各类建设项目数量超过1000个,这些项目的都在每年数据占据大量存储空间,但各类信息间难以交互分析,相关部门对这些项目数据的使用的角度和纬度也各有差异,管理层基于项目数据的讨论变得复杂。这些大量的数据,难以追溯历史,宏观分析,长期历史分析难度大;面对海量数据的分析工作变得复杂而且不准确。投资项目管理缺乏完整有效的KPI指标体系,无法及时了解项目投资效果对投资决策缺乏有效的分析依据,并缺乏科学精确的预测工具。
2 系统构建思路
2.1 多维分析和数据建模系统总体架构
项目管控支撑系统整体架构体系的构建,是基于多维分析理论,结合项目建设管理的需求,设计了项目管理分析的技术体系。在系统多维分析中一共设有4个多维模型:投资模型,进度模型,成效模型,管控模型。如图1.1所示,系统整体架构体系由数据源分析,数据存储架构,数据应用,ETL(Extract-Transform-Load的缩写,即数据仓库中抽取、转换、装载的过程)四部分组成。
由原始数据加工而来的关键指标体系、报表图表、多维分析、专题分析等应用能将数据转换为决策者可接受的信息;提供“维度”和“度量”分析方式,为决策者提供了多角度、多层次、高效率的数据探查方式,由决策者的思维带领数据的获取,可任意组合分析角度和分析目标;对关键绩效指标进行分析跟踪,监控关键业务指标的历史变化趋势,为决策者提供统一的视图;提供专题分析能力,将信息以尽可能多的形式展现出来,使决策者通过直观的表现方式迅速获得信息。
2.2 系统多维分析应用功能设计
(1)数理统计,包括汇总、平均值、最大最小值、方差、计数,TOP分析等数理统计功能和方法。管理者可以按照各种方式汇总某个月的入库数据。求数据集合的最大最小和平均值。
(2)多维分析,包括上下钻取、透明钻取、旋转、分页、层钻、跨维钻取等功能。例如从月上钻取到季度的数据,或者从月下钻取到日的数据。如从机构钻取到产品的跨维度钻取。用户可以把维度进行分页进行分析。可以任意旋转维度在表格中的行列位置。
(3)图形分析,为管理者提供多种图形方式进行数据的展现,如饼图、直方图、线图、立体图、多维图等。让各级管理者可以很直观的感受到数据所带来的信息。管理者还可以在图形中做进一步的钻取分析,挖掘其中的信息。
2.3 建立项目数据实时跟踪对比与精确控制
针对各类网络、运维建设项目分散,需要各个部门协同工作,各个项目复杂、流动性大、涉及的关联环节较多,不可控风险多,企业集中管理难度大等业务特点,项目管控系统通过采用多系统数据交互多层开放结构体系,可实现对工程项目进行远程控制和管理,提高项目施工的综合配套管理能力,加强对成本、进度、质量等的控制能力,可以有效的解决项目协同分散作业与集中管理的矛盾。
通过与相关业务系统的信息交互,以及智能分析管理软件,获取实时的项目数据,并通过各级管理人员很容易的从系统上获得项目投资、建设完成情况,并与投资计划进行对比,与集团下达的KPI指标进行跟踪对比,可以使管理层直观的看到项目整体的执行进度,可以更好对整体投资完成的额度进行精确控制。
2.4 建立多维度项目视图及预警管理
按照不同维度对项目进行统计分析并形成项目视图。分析维度包括:分别从项目投资分析、项目进度分析、项目执行分析、项目成效分析四个维度分析项目状态(处于项目建设前、项目建设中、项目建设后环节)。
按照项目预警情况分析。分析维度包括:分别从项目环节、部门维度分析项目预警情况。由项目经理根据项目需求,依照流程和职责分解任务并输入至项目管控系统。超出执行时限的则实现分层分级预警。预警级别可设为:项目普通预警、项目初急预警、项目中急预警、项目高急预警、项目危急预警。
3 系统成效预估
3.1 提高项目计划和进度的管控能力
通过多维分析技术对项目建设管理流程的梳理,并通过IT系统将这些方法和工具进行固化,积累项目建设过程的各种数据和资源,例如设定企业定额的费用模板、项目模板、供应商以及各种类型方案、合同的编制模板,便于下个工程项目建设的直接调用和借鉴。各级管理人员可以形成统一的管理思路和视角,使得整个管理链形成合力。
3.2 提升管理水平节约运营成本
通过分析体系的构建,以往分散的多维度的数据的能够清晰地,实时通过统一的视图进行展示.通过项目管控支撑系统,可以实现项目建设管理的跨部门、跨专业的多级协同,更加合理的组织配套、材料、施工、采购的协调,从而可以节约大量项目建设运营、管理成本。
3.3 实现项目数据增值和经验沉淀
通过自动分析当前工程数据产生智能反馈,实现数据增值和经验沉淀。集中、沉淀项目建设过程的大量数据,通过系统对数据的挖掘和分析,为运营商管理层的战略提供定量的、深度的、有力可靠的参考依据。
3.4 高效可靠的项目决策辅助工具
通过IT平台的支撑,围绕项目建设的物流、资金流、信息流的整合,建立一套项目建设投资的分析体系,为项目投资建设和进度管控提供支撑,为企业投资决策分析提供了保证,从而为运营商管理层提供高效可靠的决策辅助工具。
4 结束语
本文通过在即将来临的4G时代的背景下,通信运营商在项目建设管理面临的新问题进行了针对性分析,提出了通过以采用专业的多维分析套件和成熟的数据建模方法构建项目管控支撑系统,为各级管理者提供了统一的项目数据分析工具,从而提升运营商的项目管控能力和决策辅助能力的思路。并对系统构建后的成效进行了预估分析,具有一定的研究和实际应用价值。
参考文献:
[1]李红育,李绍伟.关于计算机信息系统集成项目管理[J].办公自动化,2010(12).
多维度模型 篇3
随着对等网络技术的不断发展,分布式计算、电子商务、文件共享、即时通信等得到了广泛的应用。对等用户之间直接形成互联,双方对等,共享资源。P2P已经成为Internet应用的热点。
P2P网络结构虽然具有动态性和方便性,却存在严重的安全问题。如某些欺骗节点会提供虚假的文件或不公平的推荐。如何在P2P网络中建立有效的信任机制,已成为P2P技术研究中的一个重要课题。
1 相关工作
当前的信任模型主要分为集中式和分布式。集中式采用一个中心节点收集各种信任因素,计算并管理各个节点的信任值,而分布式由节点自己来收集信任因素并计算信任值。主要的信任模型有以下几种:
(1) 基于PKI的信任模型[1] 这类模型一般适用于基于超级节点的对等网络。系统中存在少数被称为LeaderPeer的节点,LeaderPeer负责监督整个网络运营状况,定期向网络发出通告通知不可信任节点。这类系统引入CA和LeaderPeer,如eBay[2],Amazon[3]等通常具有中心依赖性、可靠性差、可扩展性差、单点失效等问题。
(2) 局部信任模型 这类系统中,节点一般采取有限广播的方式来询问其它有限数量的节点来获取待访问节点的信任度。如PeerTrust[4],其所获得的信任度往往是局部和片面的。
(3) 数据签名[5] 这类模型追求数据的可信度而不是节点的可信度,节点在完成交易后会对通过其真实性认证的数据进行签名。如Kazaa,这类系统只适合数据文件共享的应用环境,同时无法防范集体欺诈行为。
(4) 全局信任模型 这类模型通过邻居节点满意度的迭代来计算全局的节点可信度。如EigenRep[6],这类系统计算开销大,难以解决收敛性问题,且可能出现悖论。
现有信任模型往往忽略了节点的多面性,对信任度刻画比较单一,单粒度难以准确反映节点的实际性能,用户对节点的评价带有很大的主观性,且对节点提供良好服务的能力与进行推荐的能力未作区分。针对这些问题,提出一种基于反馈的多维信任模型MTM,用信任向量来刻画节点信任值,用推荐信任来表征节点的推荐能力,交易结束时结合期望信任度和信任评估向量计算交易满意度,根据满意度进行信任反馈,从而以多粒度刻画节点信任属性,减小信任评价的主观性,也促使节点在提供良好服务的同时提供公平的推荐,从而有效解决P2P系统中的信任问题,提高交易成功率。
2 基于反馈的多维信任模型
2.1 信任的定义
假设文件共享应用中,A和B均从C处下载了一首名为X的电影,A给出的交易评价为1,即对交易满意,而B却给出了-1的交易评价,即对交易结果不满意,为什么相同的服务却得到了不同的评价呢?原来A给出交易评价1的原因是C提供的电影x很清晰,质量很好;而B给出-1的原因则是从C处下载电影花费了较多的时间。由此发现了两个问题,一个是C提供的服务如何更好地刻画?一个是如何减少A、B评价的主观性?这两个问题可以这样解决:对于第一个问题,只要C告诉别的节点他提供的电影质量很好但是上传速度较慢;而对于第二个问题,A在搜索文件时,附加一个要求就是电影质量必须较好,而B只需要附加一个下载速度快的要求,即在获取服务之前节点要有一个对服务的期望。
基于上述思想,我们引入了信任向量和期望信任的概念,使用信任向量的每一维来刻画节点的每一个信任属性,交易结束后用户结合期望信任和信任评估向量对交易的满意度进行计算,根据满意度进行相应的反馈。
定义1 信任向量Tij(T1,T2,…,Tn) Tij表示在节点i看来,节点j的信任度。Tk为信任属性,表示节点i对j的在属性k上的信任度,其中Tk为一实数,且Tk∈(0,1),Tk值越大,表示节点在属性k上对j的信任度越高。网络中节点的性能在不同方面各有差异,如对同一节点提供的同一文件从清晰度、下载速度和文件大小等不同角度出发得到的结果就可能有所差异。因此,单一粒度很难对节点进行公平的评价,通过多维向量来刻画节点的信任关系更合理。
定义2 期望信任Te 每一维的取值Tei在0与1之间,Tei为0表示不关注i属性,Tei非0表示对i属性的期望程度。
定义3 直接信任Dt 节点根据自己的直接交互经验来获得其它节点的信任度。Dt是一个n维向量。
定义4 推荐信任Rt 用于表征节点提供推荐的能力,所有节点都关联着一个推荐信任,Rt∈(0,1),值越大,表明节点的推荐能力越强,推荐可信度也就越高。
定义5 间接信任It 节点借助其它节点的推荐来获得某个节点的信任度。It也是一个n维向量。显然,节点的信任向量应该是其直接信任度和间接信任度的综合。
定义6 反馈信任Ft 当节点i和j完成一次交易后,i根据交易结果的满意度对j的信任度进行反馈。反馈的结果是j的信任度增加或减少。
以文件共享系统为例,假设用一个3维向量(Rt,FileQuality,DownloadSpeed)表示信任度,其中,Rt表示推荐信任值,FileQuality表示共享文件的质量,DownloadSpeed表示节点下载速度(下述例子都采用此种结构)。如节点i中关于j的一个信任向量Tij(0.8,0.6,0.7),表示在i看来,节点j的Rt属性信任值为0.8,FileQuality属性信任值为0.6,DownloadSpeed属性的信任值为0.7。
2.2 直接信任和推荐信任的计算
当i和j进行交易前,i首先通过自己和j的交易历史来计算i对j的直接信任向量Dtij(T1ij,T2ij…Tnij),算法如下:
其中,Tmij表示j信任属性Tm的信任值(在i看来)。smij表示对于属性m来说i和j成功交易的次数,fmij表示对于属性m来说i和j失败交易的次数。由于网络中节点在不同方面的能力并不相同,因此很有必要对多个主要属性计算信任值。例如,节点i追求高的文件质量,如果节点j的FileQuality属性信任值较高,则i优先选择与节点j进行交互,也许此时节点j的下载速度并不快。
对于推荐信任,用如下公式求解:
这时Rtij表示j的推荐信任(在i看来),stij表示在i的所有交易历史中j提供满意推荐的次数,ftij表示在i的所有交易历史中j提供不满意推荐的次数。ρ代表惩罚因子,ρ>1,即对进行不正确推荐的节点进行惩罚。例如:ρ=2。
2.3 间接信任的计算
当节点i准备交易时,i可以请求别的节点进行推荐,将推荐值综合起来可以得到某个节点j的间接信任。当节点刚加入网络时,由于自己没有与其它节点的交易经验,所以无法得到某个节点的直接信任Dtij,请求推荐就成了获取节点信任信息的唯一方法。
式中前一部分是节点i的熟人的推荐总和,Wt为熟人推荐权重,S是进行推荐的熟人集合,Rtil是第l个熟人的推荐信任,当Rtil小于极限值ε时,忽略其推荐,Dtlj是第l个熟人对j的直接信任;后一部分为陌生人的推荐总和,G是进行推荐的陌生人集合,由于节点i没有G中节点的历史信息,所以采用算术求平均的方法。其中,Wt+Ws=1,通常Wt>Ws,即节点更倾向于相信自己信赖的节点。
2.4 信任值的合成
Tij=α×Dtij+β×Itij
节点j的信任度由i的直接信任和间接信任两部分组成,α是赋予i的直接信任的权重,β是赋予间接信任的权重。其中,α+β=1,通常α>β,即节点更倾向于自己的直接经验。例如:α=0.6,β=0.4。
2.5 反馈信任的计算及信任的更新
在i进行交易前,i对此次交易有一个期望值,称之为期望信任向量Te(Te1,Te2,…,Ten),期望信任Te每一维的取值Tel∈[0,1],Tel为0表示i不关注l属性,Tel值非0表示节点i对节点的l属性的期望程度,
设定一个阈值δ,当ts大于δ时,认为交易结果符合i的期望,即交易成功,反之,当ts小于δ时,认为交易结果不符合i的期望,即交易失败。同时i对Dtij(T1ij,T2ij,…,Tnij)进行更新,ti更新的算法如下:
假设i和j进行交易前,i还请求别的节点进行了推荐,则i还要对推荐者进行推荐信任的更新。设推荐者集合为ψ,任取一个推荐节点P∈ψ,P推荐其对j的直接信任为Dtpj(T1pj,T2pj,…,Tnpj),这里采用余弦相似度函数来计算得到Tf和Dtpj的相似度,算式为:
其中sim(Tf,Dtpj)∈[0,1],越接近1,表示P的推荐与信任评价向量越相似,即i和P具有相近的嗜好。
根据相似度计算结果对P的推荐信任采用下述算法进行更新:
其中的μ为一设定的极限值,当计算得到相似度值大于μ时,认为P进行了正确的推荐,例如:μ=0.6。
3 实验仿真及结果
为了验证MTM的有效性,我们构造了P2P文件共享交互环境。实验规模包括1000个节点,信任向量用3维(Rt,FileQuality,DownloadSpeed)表示,交易开始前,节点首先发出文件请求消息,含有此文件的节点进行响应(响应节点可能有多个),节点选择信任度最高的节点进行文件下载,其中α=β=0.5(公式4),ε=0.2,交易成功的唯一标准是ts>δ,设δ=0.5,Te=(1/3,1/3,1/3)。下载完成后,对交易节点和参与推荐节点进行反馈。文件总数为2000个,所有文件随机分布,且同一份文件至少被5个节点同时拥有,节点的分布符合幂规律。节点包括可靠节点和欺骗节点,可靠节点为其它节点提供诚实可信的文件下载服务并提供公平的评价,欺骗节点以80%的概率提供虚假文件,同时进行虚假评价。设每个节点平均完成100次交易,每次交易目标为从其不曾拥有的文件中随机选择一个并试图进行下载。交易的成功使得该用户拥有该文件,失败的交易不会增加该用户拥有的文件数。实验中,假定文件共享网络是理想的,所有节点都是积极的,即任意用户可以找到相应文件及声称为该文件拥有者的所有节点。
首先对比了不同规模(0-50%)的欺骗节点对不同模型下交易成功率的影响,结果如图1所示。从图中可以看出,随着欺骗节点比例的增加,MTM的下载成功率仍然能维持在一个较高水平,即使欺骗节点达到50%,其下载成功率仍然在80%以上,EigenRep在欺骗节点比例达到20%以上时,下载成功率下降较快,而没有引入信任模型的P2P系统其下载成功率随欺骗节点比例增加迅速下降,在欺骗节点比例为50%时,其成功率只有40%多。由此可见,该信任模型有效地提高了系统的下载成功率。
对不公平评价问题,任意选择了一个该类节点,初始推荐信任为0.5,综合信任值是0.5,该节点进行恶意评价。在惩罚因子取值为3时,实验结果如图2所示,随着推荐次数的增多,其推荐信任急剧降低,同时综合信任也有所下降,迫使其进行客观公平的评价。
4 结 语
在P2P系统中,节点在不同方面所表现出的能力是不同的,而且其提供服务的能力和提供推荐的能力也是有差别的。基于反馈的多维信任模型MTM,用信任向量来刻画节点信任值,用推荐信任来表征节点的推荐能力,交易结束时结合期望信任度和信任评估向量计算交易满意度,根据满意度进行信任反馈,以多粒度刻画节点的信任属性,减小信任评价的主观性,能促使节点在提供良好服务的同时提供公平的推荐,有效解决P2P系统中的信任问题,提高交易成功率。仿真实验表明该模型是有效的。
摘要:针对现有信任模型中信任度刻画单一,用户评价主观性强,对节点推荐能力表征不准确等问题,提出一种基于反馈的多维信任模型MTM。用信任向量来刻画节点信任值,用推荐信任来表征节点的推荐能力,根据交易满意度进行信任反馈,从而以多粒度刻画节点信任属性,减小信任评价的主观性,促使节点在提供良好服务的同时提供公平的推荐。仿真实验表明,MTM能有效提高交易成功率,增加系统可用性。
关键词:对等网络,信任模型,多维,反馈
参考文献
[1]孙鹏,黄鑫,庄雷.认证技术在P2P网络中的应用研究[J].计算机应用与软件,2005,22(6):115-118.
[2]Resnick P,Zeckhauser R.Trust among strangers in Internet transactions:Empirical analysis of eBay's reputation system[G]//Michael R Baye.The Economics of the Internet and E-Commerce,Volume 11 of Advancesin Applied Microeconomics.Amsterdam:Elsevier Science,2002,127-157.
[3]Violina P Rindova,Suresh Kotha.Building reputation on the Internet:Lessons from amazon.com and its competitors.2006-03-27.
[4]Xiong L,Liu L.A reputation-based trust model for peer-to-peer E-com-merce communities[C]//IEEE Conf on E-Commerce(CEC’03),Ne-wport Beach,California,USA,2003.
[5]Duffield N,Goyal P,Greenberg A.A Performance Oriented Service In-terface for Virtual Private Networks[M].Internet Draft,1998.
多维度模型 篇4
事实上, 众筹是一新兴的服务, 它的创新体现在它是一种系统的服务创新。上个世纪80年代学者们开始了服务创新的相关研究[1,2], Barras提出了逆向产品生命周期模型, 并成为最早研究服务创新的学者。现在关于服务创新的研究愈来愈多, 但至今影响力依然极大的应该是Bilderbeek等[3]在对服务创新的概念、特征等进行梳理整合后, 提出的服务创新四维度模型, 具体分为概念创新、界面创新、组织创新和技术创新4个维度。
因此, 本文将重点从服务创新的角度, 结合Bilderbeek等四维度模型提出了众筹服务创新模式, 并进行了详细的讨论, 以促进众筹创新视角, 丰富服务创新理论。同时, 对众筹的运行机理进行分析, 提出启示, 指导众筹服务创新模式实现长远发展。
1 服务创新的四维度模型
Bilderbeek等提出的经典服务创新四维度模型, 如图1所示。
虽然上述经典模型只是一个简单的概念模型, 但可以充分描述服务创新, 引导各种实践活动的服务创新。
服务概念创新指服务企业提出一个解决问题的新方法或新模式, 以此来保留现有客户、发展新客户, 是其他服务创新维度的基础。顾客界面创新指企业与顾客之间进行交流合作, 协同创新企业服务能力, 提高企业的创新绩效, 是其他服务创新维度的保障;服务传递创新指企业完善员工灵活管理体系和企业组织管理结构, 促进创新顺利进行, 或设计适应现有企业管理的创新活动的过程, 是其他服务创新维度的动力;服务技术创新指企业通过技术创新推动服务创新的发展, 服务技术创新是服务创新非常重要的方面, 但不是所有的服务创新都需要技术创新的维系。从某种程度上看, 每一项服务创新活动都是服务创新四维度的特定组合, 各维度之间相互联系, 企业服务创新才能够得以实现[4]。
2 众筹服务创新模式的四要素分析
从某种意义上看, 众筹是继Web1.0与2.0之后的Web3.0[5], 不仅能实现多数人集资资助少数人。还与传统社交网络筹资方式有交集, 并通过与P2B、P2P平台协定实现不同个体投融资者或机构群体间融资的功能, 因而具有强系统性特征, 各主体之间共同运作, 实现融资服务创新。因此, 本文认为众筹服务创新的四要素有其独特的内涵与特征。
2.1 服务概念创新
本文认为, 众筹的服务概念创新主要体现在互联网金融、以及小微经济体融资对融资的适用匹配性、促进创新和创意产业上。
众筹这一服务创新模式起源于美国, 已经有10多年的历史, 概念2011年引入我国, 之后发展迅速。同时众筹也让互联网金融走进了人们的视野。“互联网金融”最早由谢平[6]等提出, 认为互联网金融不同于以间接融资形式存在的商业银行, 也不同于以直接融资形式存在的资本市场。众筹作为互联网金融的典型代表, 满足了普通民众与小微经济体的金融需求, 操作更加灵活, 手续简单便利, 是对传统融资体系的补充。互联网金融是在互联网为平台基础上建立的, 拥有金融功能、独立生存空间的、投融资运行机制[7]。众筹具有互联网投融资的运行机制, 发起者主要通过众筹平台向投资者融资, 虽然融资清算环节依然需要借助于传统银行, 但从某种意义上看众筹俨然是互联网金融的产物, 并在互联网金融的基础上发生质的飞跃。
小微经济体在我国国家经济体系中起着基础性的作用, 但由于信息对称性差、资金流动性和信用水平也普遍低于大中型经济体, 因此小微经济体通常面临融资途径缺乏的困境。而众筹的出现, 弥补了中小微经济体融资困难的短板。正如Agrawal认为在全球金融危机导致资本短缺的情况下, 众筹的兴起为创业创意项目融资提供了极大地帮助。
从目前项目看, 众筹项目主要围绕科技及文化创意展开, 包括影视、音乐、游戏等作品, 因而众筹扩大了创新创意产品设计的空间, 极大地促进了创意产业的发展。现在中国正从一个制造大国转变为一个设计强国, 在这一过程中创新创意设计毫无疑问地成为关键所在。而设计师在创业初期, 不可避免的就是面临资金不足的问题, 众筹的出现不仅解决了资金方面的问题, 还实现了创意者与消费者之间的无缝对接, 帮助创新创意项目进行市场地初步考证, 最大限度地反馈市场信息, 为创新创意设计实体化提供帮助。
2.2 投资者界面创新
众筹的界面创新主要表现在互联网界面与投资者参与2个方面。
与传统金融服务相比, 众筹的宣传、交易均依托互联网。众筹面向的对象是小额的、分散的大众投资者, 两两之间信息传递成本高, 同时缺乏投资经验。基于互联网平台的众筹融资模式, 相比于传统金融服务可以解决部分信息不对称的问题[8]。如投资者可以实现理性的集体行动, 他们通过观察学习之后进行决策。每一位投资者对融资信托的信任度还没有完全理解, 但是投资者可以通过众筹平台上的信息, 结合自己的投资经验做出判断。或者通过线上交流线下模拟等各种方式获取信息。投资者根据其他投资者的投资信息进行投资决策, 这些私人信息就转化为了理性的集体决策。
投资者参与众筹与其自身的价值感知密不可分。因此, 融资者可以通过分析投资者的感知价值, 分析众筹项目成功的因素, 提高众筹项目成功的概率[9]。服务价值是投资者在与公众交流的过程中获得的感知, 是投资者认知价值的重要体现。价值高的服务项目, 给投资者一个更好的体验, 提高投资者的认知价值, 并加强其对众筹的忠诚度与满意度。曾江洪等认为面对个性化日益突出的投资者, 众筹项目的独特价值有助于投资者在参与众筹时实现自我、个性的情感需求[10]。众筹投资者往往在参与众筹的过程中, 也期望表达其个性、时尚的特性。
2.3 服务传递创新
众筹的服务传递创新主要在于众筹的“金融脱媒”创新与众筹平台的作用。
从融资形式看, 众筹融资模式意味着金融服务正在向“金融脱媒”的新方向发展。投资者探索更高收益, 企业追求更低融资成本, 通过众筹网络平台进行投融资, 绕开商业银行等其他金融中介机构, 是一种“脱媒”的融资模式。众筹虽没有银行等金融中介机构的直接参与, 但其间接作用不仅丰富了金融中介功能的内涵, 也改变了传统金融中介组织的形式, 成功实现服务传递过程去中介化的创新。值得注意的是, 从众筹收益的不确定性、创新创意项目的年轻化、尤其是投资群体的陌生化等特点看, 互联网金融的服务传递方式并不会因为众筹等交易模式而消失, 因为信用中介等媒体始终不可或缺[11]。
众筹平台作为众筹实施时各主体之间的信用中介媒体, 项目的成功通常取决于服务传递作用。提高信息的对称性、强化融资者产权的保护, 在服务过程中会发挥更加重要的作用。服务过程中众筹平台与投资者互动的质量, 很大程度上决定了投资者对项目的态度、以后购买的决策态度。众筹平台在完成服务生产时, 还应增加对服务的适应性, 不仅作为一个项目推送的平台, 还应该成为项目成功的促进者。同时, 加强融资者在众筹平台上信息的透明度, 使投资者可以充分了解项目的概况与融资者的基本情况。
2.4 服务技术创新
众筹是社交化媒体、大数据和云计算技术等的融合, 是小微经济获得资本的方法。
技术与众筹的关联度极高, 服务技术创新是众筹必须的一个维度。众筹的发展会受到技术创新的制约与推动, 所以从众筹发展看, 技术支持是服务创新的整体, 包括众筹平台、融资者项目技术设计等方面。众筹投融资服务技术创新的内容相当广泛, 根据技术在众筹投融资服务中的重要性可以分为社交媒体设施、信息收集与处理、项目开发等。技术创新旨在提高整个众筹投融资服务的质量, 进而提高整个众筹的技术水平和服务素质。众筹投融资服务中的技术创新, 要符合投融资高技术化发展的趋势和我国的实际情况, 实现众筹投融资服务的规范化、标准化、网络化、信息化和智能化。
众筹融资服务反过来还会影响技术创新的速度与方向[12]。众筹平台上成功项目已经过投资者的检验, 更具有创新性和适用性, 符合社会的需求。而没有实际价值的项目很难获得融资。众筹投融资机制实际上有筛选创新项目的作用。因此, 众筹在一定程度上对技术创新发展方向有引领作用。在传统融资渠道中, 某些技术创新项目很难得到启动的资金, 但是众筹融资提高了对具有使有价值的技术创新进行生产的可能。
2.5 众筹服务创新四维度拓展模型
其实任何一项众筹服务创新活动都是四维度的特定组合。众筹服务的出现通常意味着新服务概念的形成, 同时开发出一个新的众筹服务传递系统, 众筹平台的运行方式及其与投融资者之间的关联也将改变, 这些过程的实现必须依赖技术创新来支撑。
但是, 在众筹服务发展中, 仅有这4个维度是不够的, 还必须将众筹平台、众筹投资者和融资者有机的结合起来, 才能有效地进行服务创新。在众筹服务创新四维度模型中最重要的是创新创意项目的融资。融资者向投资者推出新创新的服务概念, 经过投资者的信息反馈再进行调整, 之后通过众筹平台再次向投资者推送创意项目, 投资者利用服务传递创新再反作用于融资者。
在服务技术创新的基础上, 投资者界面创新为服务概念创新提供功能保障, 而服务概念创新又在一定程度上对功能保障提出新要求。服务创新创新是投资者界面创新具有良好的环境平台支撑, 服务传递创新中发现的问题反馈至投资者界面创新进行完善。服务传递创新又对服务概念创新提出了新的优化配置要求。各维度相辅相成, 相互耦合, 相互影响, 因而提出众筹服务创新四维度拓展模型, 如图2所示。
由此可见, 只有通过单个服务创新维度的发展以及不同维度之间的相互作用, 反复循环更新, 众筹这一服务创新才有可能实现。
3 众筹服务创新的运行机理
众筹服务创新四维度之间之所以能够产生巨大的威力, 与其内在的运行机理有莫大的关联。尤其是“网络外部性”的投资者基础, “长尾效应”和“羊群效应”的投资者个性特征, 将众筹服务创新四维度的运行进行连接。众筹服务创新运行的机理, 是众筹平台在激烈的优胜劣汰环境下生存的基础, 是投资者与融资者取得各自相关利益的根本。
3.1 众筹的“网络外部性”
众筹的运行需要庞大的投资者基数的支撑。如果没有投资者基数作为支撑, 众筹也就失去了存在的价值。与投资者基数紧密相关的众筹特征就是所谓的“网络外部性”。
“网络外部性”作为“新经济”中的一大重要概念, 是指获取的网络价值的大小, 取决于该网络中已有的人数。每个投资者从使用某项产品中得到的效用, 与投资者的数量有关。一般而言, 众筹活动中每个投资者获得的感知价值与网络中其他投资者的数量成正比, 也就是说投资者人数越多, 每个投资者得到的效用就越高。这就意味着投资者数量的增长, 将会带动投资者总效用指数级的增长。
另外, 众筹项目也倾向于“网络外部性”。项目集资增多会刺激融资者进行进一步创新与设计, 形成良性循环。从投资者角度看, 因存在网络外部性的特点, 投资者的转化成本较高, 因此投资者往往不愿意对众筹项目进行转化, 容易使众筹项目成为最终的标准。
3.2 众筹的“长尾效应”
“长尾效应”一般是指由网络科学技术的驱动, 使在过去一直被忽视、少量但多样化、在统计图表上像尾巴一样的利基商品, 能够创造出比一般最受重视的销售商品更大的商机。长尾效应强调“个性化”、“投资者力量”和“小利润大市场”, 众筹“众人集资”的思想与其不谋而合。众筹项目定位创新创意项目符合长尾效应的个性化特征。面向的是大众投资者, 聚集的是他们闲置资金, 形成一定规模的融资, 促成积少成多的投资力量。
众筹服务创新模式的成功正是恰当运用了长尾理论, 将无数细小的资金“聚合”起来, 从而抓住传统投资者经常忽视的极度个性化的投资项目, 进而聚少从多, 最后获得巨大的收益, 推动创新创意产业的发展。
3.3 众筹的“羊群效应”
“羊群效应”在P2P市场中最为常见, 众筹模式和传统的P2P较为相似, 因而也存在羊群现象, 这一现象往往成为左右投资者行为的主要因素, 即潜在的投资者在进行投资决策时会受到先前投资者的影响。
投资者的参与行为, 通常并不仅仅依赖个人的信息判断能力, 更多的是受到他人行为的影响。在信息不对称的情况下, 羊群效应的作用更为明显。单纯的信息不对称下, 羊群效应不一定显现;但随着不确定信息的不断积累, 羊群现象开始产生, 并逐渐扭转市场的投资趋势。众筹模式中, 投资者与融资者之间存在较大的信息不对称, 更容易产生羊群现象。投资者也更愿意选择存在大量支持者、高支持比率的众筹项目。
众筹羊群效应还具有放大的作用[13]。资金投资者会是理性的, 会主动观察众筹项目的创新性与可行性, 当发现明显的瑕疵时, 羊群效应极大, 而良好的项目, 羊群效应作用较小。
3.4 众筹服务创新运行机理模型
众筹服务创新的运行很好的利用了电子商务中普遍存在的“长尾效应”, 将原本相当分散的资金“聚合”在一起。同时, 众筹表现出很强的“网络外部性”的特点, 使得众筹很容易规模化。在“创新创意理念”的驱动下, 众筹服务创新运行更加具有意义与价值, 并与时俱进。“羊群效应”的存在, 加速了众筹项目服务创新的实现。因而, 在众筹服务创新四维度拓展模型的基础上, 提出了众筹服务创新的运行机理模型, 如图3所示。
众筹模式的3个实体, 即投资者、融资者与众筹平台, 在“网络外部性”、“长尾效应”及“羊群效应”的作用下, 完成服务创新四个维度间的组合创新, 实现众筹服务创新的运行。众筹3个实体与其服务创新之间相辅相成, 不断推进众筹服务创新的发展, 促进众筹的持续健康运行。
4 启示
通过对众筹服务创新模式的探讨, 及其运行机理的探析, 本文得出以下几点启示:
4.1 关注项目投融资者的潜在需求
投资者是众筹项目成功的保障, 是融资者及众筹平台创新的源泉, 众筹模式的流行本身就是关注投资者与融资者的需求的结果。众筹模式准确的把握了投融资者的服务需求, 从服务的角度, 不断满足投融资者的需求, 提升他们的满意度。
作为投资市场的理性人, 众筹投资者在进行项目投资时, 最基本的目的是为了在较小的风险下, 取得理想收益。而融资者进行项目发布的目标在于, 一方面获取项目的启动资金, 另一方面在于躲避相关评审流程。因而, 根据项目投融资者的需求发现, 融资目标较小的创新创意类众筹项目, 更适合进行众筹, 容易获取到超额的融资。在界定投资回报时, 回报的种类越丰富, 在进行信息披露是, 信息发布越清晰, 减少投资者与融资者之间的各种不确定性, 越容易在项目激励中产生作用。
4.2 简单便捷式互联网金融服务的目标
无论是众筹的服务概念创新, 还是投资者界面创新、服务传递创新和服务技术创新, 最终出现的平台界面须简洁、容易操作。简单便捷的互联网界面能够提高投资者的投资效率, 增加感知价值, 提高投资成功率。
众筹投资者与融资者对众筹模式相对陌生, 众筹平台的易用性对于初次使用众筹平台的用户具有潜在地吸引力, 为后续持续信任奠定基础。众筹模式最基本的目标在于为众筹双方提供闲散资金的流通渠道, 简单实用的互联网服务, 可以增加投融资双方的感知有用性, 促进众筹项目的完成。
4.3 关注“长尾”
众筹将人们的视线从紧盯“头部”转移到关注“长尾”。积少成多, 聚沙成石的原理是众筹成功的源泉。未来众筹发展必须注意众筹的服务创新及众筹项目的差异化、创新性与专业化。
越来越多的众筹平台开始细分市场, 进行个性化的市场区分, 以增加投资者的吸引力。如国内最早的众筹平台———点名时间, 在2014年8月成功转型成为一个专注发布科技类产品的平台;追梦网专注发布创意设计类产品。投资者根据自己的需求, 选择不同的众筹平台。不同投资者的偏好往往各不相同, 这就导致投资者在选择众筹平台时会根据平台项目类型进行抉择。如对创业者和投资者而言, 他们更倾向于选择股权类众筹平台。对好奇的青年支持者, 他们的流动资金有限, 可能更倾向于选择创意类产品项目的众筹平台。
4.4 提升众筹项目质量
服务创新的基础是产品, 提升产品质量是服务创新的重要保障。投资者可通过众筹平台优秀项目资源的数量, 简介获得平台及融资者的相关信息。在投资者接触众筹时, 平台积累的优秀项目资源的数量将作为投资者对众筹平台信赖的重要因素, 直接影响投资者对众筹平台的信任度, 在此基础上的服务创新才具有真正的意义。
良好的众筹项目, 是众筹服务创新的开始, 也是众筹模式长期努力经营的结果。因而拥有较多的优秀项目资源的平台, 意味着众筹平台和众筹融资者具有较好的信息披露行为, 不会轻易进行投资行为, 是众筹项目可靠性的体现。高质量的众筹项目, 也是吸引投资者, 形成羊群效应的来源。因而, 不论是众筹平台还是融资者, 在创造或发布新的众筹项目时, 关注项目的质量, 是实现众筹服务创新的关键。
5 结论
重点结合经典服务创新四维度模型进行研究, 研究显示, 众筹的服务创新模式既表现为服务概念创新, 也表现为投资者界面创新、服务传递创新以及服务技术创新, 众筹服务创新是这4个维度的整合。其中服务概念创新表现为互联网金融、与小微经济体融资的适配性、促进创新创意产业发展, 顾客界面创新表现为互联网界面、投资者参与, 服务传递创新表现为“金融脱媒”与众筹平台的作用, 服务技术创新主要表现为大数据与云计算。同时, 结合众筹投资者、融资者、平台、外部环境特征, 分析了众筹的“网络外部性”、“长尾效应”和“羊群效应”3个主要运行机理, 提出众筹服务创新的运行机理模型。由此认为为实现众筹的服务创新, 应密切关注投融资者的潜在需求、追求简单便捷、关注“长尾”以及提升众筹项目质量。
文章主要创新点在于:第一, 从服务的角度, 结合服务创新四维度模型, 全面解释了众筹的服务创新模式, 深化对我国本土化服务创新模式的探讨。第二, 在经典四维度模型的基础上, 提出了众筹服务创新四维度扩展模型, 更直观的反映众筹运行时的服务协同创新, 有助于融资者设计适合的项目, 促进众筹平台的长远发展。第三, 对众筹服务创新的运行机理进行分析并提出相应的模型, 直观反映众筹运行特征。
着眼于众筹服务创新模式的基本构成, 对众筹的创新模式进行了初步的探讨, 虽然得到了一些结论, 但对其具体的运行机理没有进行深入探讨, 更没有进行实证检验, 未来可以从这方面对众筹的服务创新进行更加深入的研究。
摘要:众筹是互联网金融的一项应用, 也是目前国内外的热门话题, 更是服务创新的典型案例。研究重点结合经典服务创新四维度模型进行, 从服务概念创新、投资者界面创新、服务传递创新、服务技术创新四维度对众筹服务创新模式进行深入探讨, 构建了众筹服务创新四维度拓展模型。并对众筹“网络外部性”、“长尾效应”和“羊群效应”3个主要运行机理进行分析, 提出了众筹服务创新运行机理模型。因而, 为了实现众筹持续的服务创新, 我们应关注投融资者的潜在需求、追求简单便捷、关注“长尾”并提升众筹项目质量。研究对服务创新理论有一定的理论意义, 同时有助于众筹模式更好地运行。
多维度模型 篇5
一、前言
何镇飚教授在《媒介安全论》中提出了具有阐释力的媒介安全模型, 提出媒介安全只发生在媒介话语 (ΔM) 所描述的风险与客观事实风险 (ΔR) 相符的情形之下[1]。在其视角中, 将研究重点放在了文本研究之中, 本文指出在图像盛行的当下, 媒介安全需要从纯粹的文案符号的研究转向视听符号, 从纯粹的传播视角转向传播与影视实务流程互动的视角, 将技术维度纳入到媒介话语 (ΔM) 的考虑范畴。
二、案例的选择与研究的重点:典型的假新闻“纸馅包子”
当我们用媒介安全模型去探究假新闻“纸馅包子”的案例时, 其真实风险C1=0, 当我们用媒介风险C2与之相除时, 会发现媒介安全系数S趋向于无限大, 即由媒介营造的虚拟环境中, 风险被无限的放大了, 是媒介制造了这个无限被放大的恐慌事件。
针对ΔM (解说词) 的研究, 已经在何镇飚教授的《媒介安全》一书中得到了充分的阐释, 其知识体系中的各个学派用各自的视角对其进行了研究, 在本研究中不做过多的赘述, 并将视线转向ΔM (技术符号) 。
三、ΔM (技术话语) 的误用与电视新闻的不安全因素
(一) 景别:特写镜头与恐惧情绪的渲染
钟大年指出, 一般来说当一个镜头进入叙事系统中后, 它具有两方面的主要功能:一是介绍功能, 主要是将画面中信息传达给观众;另一是创造情绪功能, 即通过一定视觉感受强度调动观赏者的情绪反应[2]。
在“纸馅包子”的案例中, 对于大多数的工作作坊、街边的摊位与食客, 均用了大量的特写、大特写。而特写这一手法的使用会有极强的视觉冲击力, 是种超常视点的景别。从介绍性角度讲, 特写与近景相同, 用来表现细节和表情与之不同的是特写具有很强的主观色彩和感情色彩。另外特写在表现事物时又具有一种暗示和强调的作用, 剪接时经常用它来制造悬念和创造视觉震惊效果。
(二) 推镜头:环境与恐惧元素的暗示绑定
摄法指拍摄过程中, 摄像机的运动方式。往往包括静止拍摄与运动拍摄, 运动拍摄一般包括:推、拉、摇、移、跟、甩几大模式。在“纸馅包子”的案例中, 会大量运用推镜头的方式, 推镜头的直接结果是将环境与环境中的细节联系在一起。这种方式同样具有极强的视觉冲击效果, 尤其当使用“急推”的方式时, 效果更为突出。
在纸馅包子案例中, 往往以人们在早点铺吃早点作为起幅, 然后用急推的拍摄方式, 以包子或者包子馅为落幅。这样的方式使得环境与恐惧元素捆绑在一起, 具有极强的暗示性。
(三) 视角:跟拍模式使受众卷入恐怖氛围之中
视角。视角指拍摄过程中, 摄像机与主体之间的关系, 从位置关系上分, 包括水平视角、垂直视角。从主客观的关系分, 包括主观视角与客观视角。该案例中大量运用了跟拍或者“偷拍”的手法, 跟拍手法由于是从受众的主观视角进行对世界的观照, 主观性视角的使用往往会使得观众有一种身临其境的感觉, 如果与恐慌事件的报道联系在一起, 会使得观众的恐慌感进一步加强。
(四) 剪辑:强势剪辑手法的滥用
钟大年指出:一般来说单个镜头往往不具有完整的叙事功能, 完整的意思是由镜头组接后产生的[3]。对于电视新闻而言, 剪辑一般为新闻叙事服务。通过镜头的对列造成视觉的隐喻与象征, 这是一种独特的视觉语言意义的内容。视觉的隐喻类似于文字的比喻, 它利用两种形象的比较, 使人们通过心理联想构成一个有新含义的内容。在“纸馅包子”的案例中, 却出现了强势剪辑的手法, 对于街边小吃摊铺、做包子的师傅、裹包子用的馅料、吃包子的民众、刚出炉的包子, 进行镜头的拼接, 而且每个画面时间只有几帧, 通过这样的组接, 使得观众将几者强烈的联系在了一起, 从而产生了强势剪辑作用下的心理震撼, 进一步扩大了媒介恐慌感。
(五) 配音:艺术效果的误用
在配音环节上, 对于电视新闻而言, 一般只要对现场同期声所产生的杂音进行处理并将解说词旁白配上去即可, 但是在该案例中, 却运用了大量的背景声效作为配音, 而且均为尖锐的弦乐, 该种方式往往在电影中运用较多, 用于制造一种恐怖气氛, 较为经典的案例为希区柯克的《精神病患者》, 仔细分析这个电视新闻的背景配乐, 与《精神病患者》的配乐如出一辙。
四、建议
(一) 字幕:理性客观的事件展示手段
在影视中, 字幕往往容易被忽视, 因为影视是一种用声画叙事的艺术, 文字似乎与该媒介不具有很强的兼容性, 因此往往在影视中作为一个点缀的部分, 多用于交代一些背景性的信息。但是, 在媒介恐慌事件爆发时, 电视新闻空间中的字幕却变得尤其重要。麦克卢汉曾言及, 媒介即讯息, 文字符号相对于声画符号而言, 往往更加的理性, 基于字幕的理性思考往往可以使受众能够更加理性的去看待当下所发生的一些恐慌事件。诸多的恐慌性事件可以用字幕的方式在电视新闻空间中得到更加客观、中立的展示, 例如在央视新闻《卫生部公布可能在食品中添加的非食用物质名单》中, 则纯粹的是基于字幕的一个电视新闻空间展示, 显得客观、中立。
(二) 景别:尽量客观、中立
在何镇飚教授所构建的媒介安全模型中指出, 只有当现实威胁与媒介威胁处于动态平衡时, 媒介安全才能够实现。相对于中立、平衡、客观的大景别而言, 特写与大特写在放大受众感官的同时, 将夸大某些某些细节, 而如果这些细节具有恐慌的因素, 将不可避免的带来媒介恐慌的现象。由此, 在景别的角度上而言, 对于恐慌性事件的记录, 尽量使用一些较大的景别, 避免使用容易引起受众情感卷入的小景别。
(三) 摄法:应以信息交代为首要目的
同样引用媒介安全系数的概念, 相对于推、拉、跟、甩等一些产生较大主观卷入的技术手段而言, 媒介有必要去思考着在这些危机事件爆发的过程中用静止镜头或大景别摇镜头的的方式进行拍摄于记录。这些镜头本身能够记录事件, 而且, 由于取缔了编导的技术原因所导致的镜头内部蒙太奇所带来的恐慌与自身的强相关性, 而会显得更加的安全。
(四) 后期剪辑:对属于“第三空间”的电视新闻负责
电视新闻空间的塑造不同于电影空间的塑造, 两者最大的区别在于前者的目的是以信息的呈现为最大目的, 而后者则是以艺术效果为最大追求。因此, 作为后期剪辑者以及编导, 需要明确在电视新闻空间的建构过程中是否合适引用某些在电影空间中才会用到的诸如基于越轴以及强势剪辑所带来的一些引起受众强烈情感反应的手法。对于配音也同样如此, 毕竟电视新闻空间并不是一个艺术的实践场所, 与其相对的是受众所感知到的“第三空间”, 而非基于纯粹艺术的变动不拘的“第二空间”。
(五) 技术之外的建议:加强媒介问责
技术符号蕴藏的“戏剧派”制片风格值得处于竞争中的民生新闻栏目警惕。电影史上, 将电影的风格分为“纪实派”与“戏剧派”两个类别, 前者以纪实为主要目标, 后者则以戏剧化的情节表现为目标。处于竞争压力中的媒介将收视率作为栏目以及员工考核的标准, 与之相伴的则是具有可观赏性的“戏剧派”制片风格在民生新闻栏目中的出现。民生新闻的客观性与纪实性在这样的背景下遭到了威胁。
媒介问责的框架指向两个对象:员工与媒介考核体系。首先, 媒介作为社会的公器, 其员工除了需要对媒介负责外, 更需要对社会负责。同时, 值得业界反思的是, 如果没有一套基于收视率的考核体系, 或许也就不会出现类似的假新闻的炮制现象。因此, 从媒介生态的角度而言, “纸馅包子”案例除却问责栏目的编导, 更需问责媒介的员工考核体系。
五、电视新闻空间中的微言大义:让我们永远免于恐慌
尼尔波茨曼在《技术垄断》一书中指出, 技术是一个赌场, 其形塑了一个游戏规则, 里面有赢家也有输家, 只是, 无论是赢家还是输家, 其都受到了技术的影响, 我们的时代也由此由技术来划分[4]。在当下, 电视媒介技术的介入, 使得我们或多或少受制于其游戏规则, 在官僚主义的视角下, 电视媒介可以控制受众的信息获知, 形塑着他们头脑中的“民族想象共同体”, 从而便于社会的维系与稳定, 只是, 在由任何技术所形塑的游戏规则中, 只要我们不摆脱尼尔波茨曼所言及的技术垄断的现状, 那么我们每个人都将成为技术的奴隶。当我们在使用电视媒介建构新闻时, 媒介制作者倾向于以注意力为导向来使用技术, 而在使用技术之后, 却没有想到, 这些技术的使用, 正在逐渐剥夺我们对于社会的常态性认知, 受众的理性思维退化了, 整个“民族想象共同体”存在于一个以收视率数据考核的“媒介空间中”, 数据的逻辑就是以量取胜, 结果随因诞生, “媒介空间”存在着种种恐慌奇观。存活于这个时代的每个受众, 是否都会恐慌于媒介空间所形塑的影像, 是否会更加怀念过去纯粹以信息传递为主旨的“电视新闻空间”时代?人是万物之灵, 当我们最后的防线几近奔溃时, 时代需要一个个爱心斗士对当下的非常态的媒介现象进行批判与否定, 而其目的只有一个:让我们从技术垄断的时代回归到工具时代, 让我们重新让技术为在神祗下诞生的我们服务, 让技术服从于普世的道德与生灵的标准。
摘要:何镇飚教授所提出的媒介非传统安全研究以话语分析为核心, 随着读图时代的到来, 单纯基于话语分析的思路需要介入媒介技术的维度, 本文结合假新闻“纸馅包子”的案例对媒介安全模型的核心变量媒介话语 (ΔM) 进行技术维度的阐释。社会正在为技术垄断, 理论需要随着媒介技术环境的变化而不断嬗变。在图像至上的时代中, 让“电视新闻空间”以安全为基本诉求为“民族想象共同体”服务, 是本文的愿景。
关键词:电视新闻空间,媒介逻辑,媒介非传统安全研究
参考文献
[1]何镇飚.媒介安全论[M].北京:中国传媒大学出版社, 2011:160.[1]何镇飚.媒介安全论[M].北京:中国传媒大学出版社, 2011:160.
[2][3]钟大年.纪录片:影像意义系统[M].北京:北京师范大学出版社, 2006:120-126, 119[2][3]钟大年.纪录片:影像意义系统[M].北京:北京师范大学出版社, 2006:120-126, 119
多维度模型 篇6
人力资源是企业可以将其看作能够为创建和实现企业的使命、愿景、战略与目标做出潜在贡献的人所具备的可被利用的能力与才干[1]。在全球化竞争和知识经济时代, 人力资源是企业的第一资源和根本竞争优势, 人力资源管理已成为支撑企业核心能力与竞争优势的重要力量, 具有高度重要的战略地位。但与此同时, 由于人力资源所涉及的企业部门层级繁多、业务流程复杂、数据信息庞大, 其管理工作极其复杂困难, 人力资源的战略作用难以完全得以发挥。即使近年来通过人力资源管理信息系统优化了业务流程, 提高了日常工作效率, 在业务流程层面上实现了人力资源管理工作高效和稳定的运行, 但是在战略决策支持层面上, 人力资源管理仍存在一些问题亟待解决。这些问题表现在决策信息难以获取和正确性难以保证两方面。
造成决策信息难以获取和正确性难以保证的主要原因是:第一, 人力资源决策信息包括人力资源现状盘点、人力资源需求预测、职位信息、人员胜任能力信息、招聘与配置信息、人员绩效信息、薪酬信息和培训信息等, 种类繁多, 数据庞杂;第二, 人力资源内部管理信息系统的数据组织方式是面向具体业务流程的, 并不是以决策分析主题为导向组织数据。获取某一项决策信息势必引起对所有相关数据的重新抽取和归纳, 计算复杂, 耗时巨大;第三, 人力资源管理涉及企业各个部门和层级, 很多决策信息来源于人力资源管理部门外部的其他部门数据库。各种外部数据库中的数据在定义、粒度和更新策略上高度不统一, 无法直接进行统计、归纳和计算, 必须经过漫长的数据预处理, 进一步增加了获取决策信息的难度。
针对上述问题, 本文提出了人力资源数据仓库多维数据模型, 借助数据仓库技术, 以决策分析主题重新组织数据, 实现数据的正确统一, 以解决决策信息难以获取和正确性难以保证的问题。
2 数据仓库
1992年, William H.Inmon提出了数据仓库的定义和设计方式, 与传统的数据库在数据组织和应用目标等方面有很大的不同, 数据仓库改变了数据的组织形式, 通过按主题组织数据, 以维度抽取主题信息, 来达到海量数据集成和分析的目的。数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合, 用以支持经营管理中的决策制定过程[2]。根据数据仓库概念的含义, 数据仓库具有以下4个特点:
(1) 面向主题。主题是用户进行某项决策时所关注信息的抽象集合。数据仓库是按主题域进行数据组织的。数据仓库以主题为组织数据的中心, 有利于实现决策信息支持这一目标。
(2) 集成的。数据仓库中的数据主要用于进行分析决策, 需要对细节数据进行归纳、整理和综合。同时, 数据仓库中的数据多来源于多个异构数据源, 不能对数据进行简单的汇总和拷贝, 必须对数据进行清理和转换, 保持数据的一致性。
(3) 具有时间特征。为保证数据仓库数据提供的决策信息随时间不断做出适当调整, 数据仓库需要随时间变化不断增加新的内容, 同时也需要随着时间变化删去过去陈旧的数据。数据仓库中数据表的键码都包含时间项, 以标明数据的历史时期。
(4) 稳定的。数据仓库是随时间而变化的, 但又是相对稳定的。数据仓库的数据主要供企业决策分析之用, 提供的服务主要是数据查询, 一旦某个数据进入数据仓库以后将被长期保留, 一般情况下并不进行修改。数据仓库的数据通常只需要定期加载、刷新[3]。
分析型数据仓库要对大量的数据进行汇总和分类, 要求能按客户的要求快速、灵活地完成复杂的查询, 并且查询的结果要便于用户理解。这要求数据仓库在存储数据时, 必须消除数据冲突和表达不一致等问题;在面临用户的查询需求时, 必须对所需要的信息提前准备, 以便缩短响应时间。为达到这一目的, 数据仓库的基本体系结构至少包括数据获取、数据存储与管理、信息访问3个基本组成部分。
(1) 数据获取。数据获取是指从多个异构数据源获取原始数据, 经过提取、清洁、转换、聚集等操作得到以主题为中心的集成数据, 并将数据装载到数据仓库的过程。
(2) 数据存储与管理。数据存储与管理负责数据仓库的内部维护与管理, 提供的服务包括数据存储的组织、数据的维护、数据的开发、数据仓库的理性维护等。
(3) 信息访问。信息访问属于数据仓库的前端。数据仓库前端是面向最终用户的。最终用户通过信息访问部分获取支持决策的信息。信息访问部分一般由报表生成器、OLAP工具、数据挖掘工具和可视化工具等构成。
数据仓库的基本体系结构[4]如图1所示。
3 人力资源数据仓库基本结构
人力资源数据仓库的最终用户是人力资源部门高层决策人员和日常工作人员。人力资源数据仓库可为人力资源战略规划、胜任能力分析、培训开发管理、薪酬管理、招聘与配置管理工作提供决策信息支持[5,6,7]。人力资源数据仓库的基本结构由数据仓库服务器、查询服务器和前端展示工具组成[8]。人力资源数据仓库基本结构如图2所示。
人力资源战略规划和人力资源日常管理工作所需信息决定了数据仓库的分析主题、维度、粒度、度量要求以及数据提取、转换和装载规则。根据数据提取、转换和装载规则, 人力资源数据仓库从多个外部异构数据源抽取数据, 然后将抽取的数据按主题进行组织, 以便查询服务器提取数据。最终, 前端展示工具从查询服务器中提取相应的数据, 按最终用户的需求组织成决策支持信息展示出来。
4 人力资源管理流程分析
根据现代企业的人力资源管理理论, 人力资源管理系统可分为战略规划、职位管理、胜任能力管理、招聘与配置、绩效管理、薪酬管理和培训管理七大部分。人力资源管理系统各个职能模块相互联系、相互作用, 在人力资源管理机制作用下, 呈系统化运行, 人力资源管理流程如图3所示。
人力资源战略规划贯穿整个人力资源管理工作, 决定了人力资源管理工作的各个环节。首先, 人力资源战略规划通过理解企业发展战略及策略目标, 分析企业业务状况与组织框架, 确认人力资源的战略、目标、原则和政策。然后, 人力资源战略规划对人力资源现状进行盘点, 分析人力资源现状与未来战略需求的差异, 通过对人力资源的供给与需求的预测, 发现人力资源缺口, 明确人力资源规划所面临的具体问题。在明确具体问题之后, 人力资源战略规划将设计人力资源战略问题的系统解决方案, 调整人力资源管理系统的业务职能, 为实现人力资源战略规划的落地进行政策和制度安排, 并制订具体措施及行动计划。最后, 人力资源战略规划将对其具体实施情况进行实时评估和控制, 以保证人力资源战略规划顺利实施并及时调整, 以适应企业与战略发展的需要。人力资源战略规划在明确战略方向、识别当前问题、制订具体计划和控制计划实施的过程中, 必须得到职位管理、胜任能力管理、招聘与配置管理、绩效管理、薪酬管理、培训开发管理等具体职能部门强有力的信息支持。
职位管理基于对企业业务结构、组织结构与流程的深刻认识与理解, 设计和构建职能、职类、职种体系, 形成企业完整的职位体系。
胜任能力是指能将工作中绩效表现优秀者与表现平平者区分出来的个人潜在的、深层次的特征, 它包括知识、认知或行为技能、态度或价值观、自我形象、特质、动机, 即任何可以被可靠测量或描述的个体特征。胜任能力应该包括需要达到的实际绩效, 以及取得这些绩效所需的个性特征。胜任能力管理通过对员工的学历、职称以及岗位绩效等进行分析, 明确员工的潜在能力, 为进一步潜力挖掘与能力培养提供依据。胜任能力管理为人员的招聘、甄选提供了用人方面的素质要求;为人力资源配置提供了人员配置的标准和依据;为薪酬体系设计提供最基础的标准、依据和框架。
招聘与配置的基础是职位管理和胜任能力管理, 根据企业的职位与企业人员的内在特征选择有效的招募方法、渠道及甄选方法, 实现对企业员工的合理配置。招聘与配置包括企业发现人力资源获取需求、制定人力资源获取策略、劳动力市场相对位置分析、人员招募、人员甄选与配置5个环节, 其最终的落脚点是人员甄选。
绩效管理是指为保证企业经营目标的实现, 定期对企业员工进行考核, 对人员所在岗位的绩效考核标准和实际完成值进行分析, 对员工做出正确评价。绩效管理包括目标与计划确定、绩效评估和绩效回顾。目标与计划确定是指依据企业战略目标要求, 制定目标与计划, 明确工作内容和评价标准。绩效评估是指根据事先设立的评价指标, 对企业员工的工作进行客观评价。绩效回顾是指分析产生差距的原因, 制订工作改进措施。
薪酬管理系统是整个企业激励机制的核心, 是企业吸引和保留人才的关键。薪酬管理通过对人员、所在职位和业绩考核结果数据进行分析, 对薪酬体系做出有效的调整, 实现人工成本的有效控制和有效的薪酬激励。薪酬管理包括薪资策略保持与企业人力资源战略、企业经营目标的一致性, 提升薪酬管理的战略管理能力;确定合适的薪酬水平, 以保证薪酬的外部竞争力与内部的公平性, 正确处理人工成本与人力资本投资之间的关系;设计多元的薪酬激励要素与薪酬结构, 反映不同类别员工的特点, 满足不确定性的、多层次的、复杂的员工需求;建立分层分类的薪酬管理体系, 进行工资动态调整, 使薪酬设计反映不同层次、不同类别的员工的需求与劳动特点;薪酬的机制与制度设计做到程序公平, 薪酬的机制与制度和人力资源的其他机制与制度配套, 尤其是和绩效考核体系及任职资格体系相互统一;薪酬制度与管理体系设计应做到合法合规, 避免企业付出违规成本。
培训开发管理通过分析培训需求和历史数据所反映的培训效果, 制订企业员工的培训计划, 确保以有限的培训费用, 最大限度地提高员工素质和员工技能, 实现企业效益增长最大化。培训开发管理表现为对培训基地的管理、培训预算与费用核算等业务的管理。培训开发管理的具体工作内容包括了解和掌握公司的战略发展以及员工的能力与素质状态, 为公司培训开发计划的制订提供依据;根据员工的潜能特点及企业需求, 帮助员工制订职业发展与个人能力开发计划;控制培训实施过程;评估培训开发效果。
人力资源管理体系以职位和人员为基点, 以战略规划为主线, 以胜任能力管理、招募与配置、绩效管理、薪酬管理、培训开发管理为主要职能, 保证企业人力资源管理正常运转, 确保人力资源价值得到最大限度的发挥。通过对人力资源管理构架的分析可以得出, 人力资源管理在实际运行中所需决策信息是围绕职位信息、人员基本信息、胜任能力、招募与配置、绩效、薪酬、培训与开发7个中心进行组织的。由此, 人力资源数据仓库将以职位、人员基本信息、胜任能力、招募与配置、绩效、薪酬、培训与开发为主题, 建立多维数据模型。
5 人力资源数据仓库多维数据模型
多维数据模型是进行决策支持数据建模的最好方式, 是数据仓库普遍采用的数据建模方法。多维数据模型以直观的方式组织数据, 并支持高性能的数据访问。每一个多维数据模型由多个多维数据模式表示, 每一个多维数据模式都是由一个事实表和一组维表构成。数据仓库多维数据建模包括确定主题、选择事实与维度、确定粒度、标识维度和事实表属性。
5.1 确定主题领域
主题是一个在较高层次上将数据归类的标准, 每一个主题基本对应一个宏观的分析领域。主题是一个抽象的概念, 是在较高层次上把企业信息系统中的数据综合、转换、归类并进行分析利用的抽象。通过上述人力资源管理系统架构的分析, 人力资源数据仓库的主题确定为职位主题、人员基本信息主题、胜任能力主题、人员调整配置主题、培训开发主题、绩效考核主题、薪酬主题。
(1) 职位主题。职位主题通过分析当前企业组织体系中岗位的职种、职能、职类, 以及企业员工的定岗定编信息, 决定是否增设新职位并对新职位进行设计和说明。
(2) 人员基本信息主题。人员基本信息主题通过分析全体企业员工的学历、技能、职称、工作经历等信息, 形成对当前企业人力资源的全局认识, 为人力资源盘点工作提供数据支持。
(3) 胜任能力主题。胜任能力主题通过分析企业员工学历、技能、职称和岗位适应性等基本信息, 为人员的招聘与甄选、调整与配置、薪酬提供信息支持。
(4) 人员调整配置主题。人员调整配置主题通过对企业员工胜任能力和岗位职能的研究, 决定员工的合理化调动和调整。
(5) 培训开发主题。培训开发主题通过对员工基本信息、培训基地信息、培训预算和费用管理信息的分析, 制订培训计划, 以最低的成本取得最大的人力资源价值增长。
(6) 绩效考核主题。绩效考核主题是指为保证经营目标的实现, 根据企业员工所在岗位的绩效考核标准, 对员工做出客观评价。
(7) 薪酬主题。薪酬主题通过分析员工胜任能力、职位和绩效, 对薪酬体系做出有效的调整, 实现成本的有效控制和激励效果最大化。
5.2 确定粒度
所谓粒度是指数据仓库中数据单元的详细程度和级别。数据越详细, 粒度就越小, 级别就越低;数据综合度越高, 粒度就越大, 级别也就越高。选择的粒度必须满足业务需求, 并且基于源数据库中的数据进行选择。一般粒度选择方式采用最低细节级别, 即数据仓库的粒度可以看作是每个源数据库中的一行记录。
5.3 选择维度
维是指人们观察事物的角度。根据在人力资源管理过程中信息的组织角度, 选择各个主题的维度如下:
(1) 职位主题维度为时间维、定编人员维、单位维、职种职类维。
(2) 人员基本信息维度为时间维、学历维、技能维、职位维、职称维、单位维。
(3) 胜任能力主题维度为时间维、职位维、人员维、单位维。
(4) 人员调整配置主题维度为时间维、职位维、人员维、绩效维、单位维。
(5) 培训开发主题的维度为时间维、单位维、职位维、人员维、培训基地维、职称维、费用维。
(6) 绩效考核主题维度为时间维、单位维、职位维、职称维、人员维、考核指标维。
(7) 薪酬主题维度为时间维、职位维、人员维、单位维、薪酬种类维、考核维。
5.4 建立多维数据模型
人力资源数据仓库采用星形模式构建多维数据模型, 根据上述主题域和维度的选择, 构建多维数据模型, 如图4~图10所示。
(1) 职位主题。职位主题提供了以时间、单位、定编人员信息、职种职类为分析维度, 有关职位名称、工作内容、工作特征、任职资格的综合信息。时间维包括年度、月份和日期3个维层次。定编人员维包括人员种类、人员级别和人员数量。单位维包括单位名称、单位类别和单位级别。职种职类维包括职位种类、所属部室和职位级别。
(2) 人员基本信息主题。人员基本信息主题提供了以时间、学历、技能、职位、职称、单位为分析维度, 有关人员的姓名、性别、出生日期、籍贯和数量的综合统计信息。学历维包括学校名称、专业名称、学历、毕业时间、学位、授予时间。技能维包括技能名称、技能类别、技能级别。职称维包括所属类别、级别、评定时间。
(3) 胜任能力主题。胜任能力主题提供了以时间、人员、职位、单位为分析维度, 有关人员胜任能力的综合统计信息。人员维包括技能维、学历维、姓名、性别、出生年月和籍贯。
(4) 人员调整配置主题。人员调整配置主题提供了以时间、人员、职位、单位、绩效为分析维度, 有关人员调整配置的综合统计信息。绩效维包括考核结果。
(5) 培训开发主题。培训开发主题提供了以时间、人员、职位、单位、职称、培训基地、费用为分析维度, 有关培训计划和培训效果的综合统计信息。培训基地维包括使用时间、培训基地名称、培训基地类别。费用维包括费用预算和费用结算。
(6) 绩效考核主题。绩效考核主题提供了以时间、人员、职位、单位、职称、考核指标为分析维度, 有关绩效考核结果的综合统计信息。考核标准维包括考核标准。
(7) 薪酬主题。薪酬主题提供了以时间、人员、职位、单位、薪酬种类、绩效考核为分析维度, 有关薪酬数量的综合统计信息。薪酬种类维包括基础工资、绩效提薪、奖金、津贴、股权、保障福利、健康与救济福利、退休福利、带薪休假福利。
6 结论
针对目前人力资源管理决策信息难以获取和正确性难以保证的问题, 建立人力资源数据仓库是比较理想的解决方案。本文通过分析人力资源战略规划和日常业务流程, 明确了人力资源工作信息赖以组织的7个主题:职位、人员基本信息、胜任能力、人员调整配置、培训开发、绩效考核、薪酬, 并对每一个主题确定了维度, 建立了人力资源数据仓库多维数据模型, 为解决人力资源决策信息难以获取和正确性难以保证的问题奠定了基础。
摘要:针对人力资源管理决策信息难以获取和正确性难以保证的问题, 提出了人力资源数据仓库多维数据模型。人力资源数据仓库多维数据模型通过分析人力资源战略规划以及人力资源日常业务流程, 确定了分析主题和维度, 借助数据仓库技术, 以决策分析主题为导向组织数据, 为人力资源决策提供信息支持。人力资源数据仓库多维数据模型能准确地表达决策分析主题的数据组成关系, 为解决人力资源管理决策支持信息难以获取和正确性难以保证的问题提供了依据。
关键词:人力资源,数据仓库,多维数据模型,决策支持
参考文献
[1]彭剑峰.人力资源管理概论[M].第2版.上海:复旦大学出版社, 2011.
[2]W H Inmon.Building the Data Warehouse[M].Second Edition.Hoboken, NJ:John Wiley&Sons Inc, 1996.
[3]Han J W, Kamber M.Data Mining:Concepts and Techniques[M].Beijing, China:China Machine Press, 2006.
[4]武森, 高学东, [德]M巴斯蒂安.数据仓库与数据挖掘[M].北京:冶金工业出版社, 2003.
[5]刁柏青, 乔迪.人力资源管理数据仓库建设方案设计与实现[J].电力信息化, 2011, 9 (2) :80-83.
[6]郭庆.数据仓库为中心的企业人力资源统计信息系统的设计与实现[J].人力资源管理:学术版, 2010 (2) :42-45.
[7]项金灵, 陈德焜, 宋玲, 王波.基于BSC与数据仓库的高校战略人力资源分析[J].计算机工程与设计, 2010, 31 (16) :3685-3688.
多维度模型 篇7
随着信息化建设不断发展, 各行各业对信息化的应用水平和依赖程度在不断提高。包括企业、政府机关在内, 都逐渐意识到信息共享和协同联动对工作的重要性, 但由于建设时间不同、建设技术不同, 带来的异构数据问题, 已经成为了严重制约信息共享、协同联动的瓶颈。要实现异构数据的共享和联动必须要明确异构数据间的相互关系, 对异构数据开展相似度研究, 否则也仅仅是把不同的异构数据堆积在一起, 无法实现真正意义上的信息共享, 更无法发挥共享数据的潜在价值。
目前, 主流的异构数据相似度方法主要有基于关键词的方法, 基于语义词典的方法, 基于语义依存的方法, 基于计算编辑距离的方法, 基于语境框架的方法, 基于属性论的方法, 基于统计的方法等等。这些方法在信息领域的应用已经比较成熟, 但随着个体数据信息量的不断扩充, 单一的某种方法已经无法很好的保证查全率和查准率, 这就要求我们从不同的数据维度, 采取相适宜的算法, 再通过权重控制, 综合分析, 保证大信息量的异构数据相似度对比的可靠性和可用性。本文针对结构化数据、非结构化数据、时序数据、空间数据采取不同的成熟相似度算法, 再通过权重分配加以控制, 经过综合计算, 得出符合实际应用的异构数据相似度。
本文采用基于权重分配的多维异构数据相似度比对算法, 使得各维度上的数据相似度互为补充。这里我们将介绍所采用算法和数据的基本概念, 再对每一信息维度上采用的相似度算法简要分析, 在此基础上提出基于权重分配的多维异构数据相似度算法, 结合实验给出算法的评价和结果, 最后是对当前工作的总结和技术展望。
2. 概念
2.1 异构数据
异构数据通常指来源于不同异构数据源的结构化数据, 比如分别来自Oracle、DB2、SQL Server的数据, 或者来源于异构系统的数据。本文中的异构数据除了包含通常意义上来源于不同数据库、不同应用系统的结构化异构数据外, 还包含非结构化异构数据。
2.2 知网
知网 (英文名称为How Net) 是一个以汉语和英语的词语所代表的概念为描述对象, 以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。知网通过用一系列的义原, 利用某种知识描述语言来描述一个概念, 义原通过上下位关系组织成一个树状义原层次体系。
2.3 本体论
本体论是概念化的详细说明, 一个ontology往往就是一个正式的词汇表, 其核心作用就在于定义某一领域或领域内的专业词汇以及他们之间的关系。本体论可以分为四种类型:领域、通用、应用和表示。领域本体包含着特定类型领域的相关知识;通用本体则覆盖了若干个领域, 通常也称为核心本体;应用本体包含特定领域建模所需的全部知识;表示本体不只局限于某个特定的领域, 还提供了用于描述事物的实体。
2.4 时间序列
时间序列是指将某种现象某一个统计指标在不同时间上的各个数值, 按时间先后顺序排列而形成的序列。时间序列分析 (Time series analysis) 是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法, 研究随机数据序列所遵从的统计规律, 以用于解决实际问题。
2.5 空间数据
空间数据是指用来表示空间实体的位置、形状、大小及其分布特征等多方面信息的数据, 它可以用来描述来自现实世界的目标, 它具有定位、定性、时间和空间关系等特性。空间数据是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数据。
2.6 权重
权重是一个相对的概念, 是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。权重分配的常用方法包括:主观经验法、主次指标排队分类法、专家调查法。本文将具体分析多维数据不同维度相似度在综合相似度算法中所占权重的分配问题。
3. 基于维度采用相适应的相似度算法
针对目前单一相似度算法不能很好适应大信息量多维异构数据相似性比对的现状, 本文提出了基于数据维度的综合数据相似度算法, 下面我们将分别介绍不同维度上采用的相似度算法。成熟度、适用性是选用算法的重要指标。
3.1 结构化数据采用基于本体中概念的知网相似度算法
在自然语言的处理中, 目前通常采用“距离”这个指标来推导刻画词汇间的相似度:两个词汇的语义距离越大, 则词汇含义越具有无关性质, 故相似度越小。
对于两个词汇W1和W2, 其距离为, 相似度为, 根据两者的部分反比特性, 我们不妨设定如下的转换关系:
其中α为可调参数, 等于相似度为0.5时的词汇语义距离值。
在探讨词汇相似度的算法上, 针对其标准、规范的特点, 我们采用基于本体概念的知网相似度算法并对其加以研究改进。
“知网”是一个以词语所代表的概念为描述对象、以揭示概念与概念之间以及概念所具有属性之间的关系为基本内容的常识库和知识库。知网中有两个主要的概念:“义项”与“义原”。“义项”是对词汇语义的一种描述。每一个词汇可以表达为一个或多个义项;“义原”是用于描述一个“义项”的最小意义单位。
在本文中, 为简化起见, 我们只计算对应单一义项的词汇间的相似度, 对于对应多个义项的词汇, 我们则分别计算其间的义项相似度后取算术平均值。设词汇W1对应义项S1, 词汇W2对应义项S2, 则W1和W2的相似度在知网相似度算法中即等于义项S1和S2的相似度:
与一般的语义词典不同, “知网”并不是简单地将所有的“义项”归结到一个树状的概念层次体系中, 而是用一系列的“义原”来对每一个“义项”进行描述, 故而义项的相似度计算可基于义原的相似度算法。
义原根据上下位关系可以构建出树状的义原层次图, 下方的子义原总是对上方父义原的分类或具体化, 义原间距离与两个义原在义原层次树对应节点间的最短路径有关。例如:
知网中提供了实体类、事件类、属性类等多棵义原层次树, 分属于不同的概念领域, 对于不在同一棵树上的两个义原, 显然无可比性, 相似度为0。对于同一棵树上的两个义原a和b, 有且仅有一条连通路径, 设边数为n, 对于义原层次图, 我们考虑到, 位于上位的义原概念较大, 位于下位的义原概念较小, 故对于同处于同一棵树下部的一对父子节点, 他们对应的义原间的距离应当小于处于其上的任意一对父子节点。则他们之间的距离可用如下公式定义:
其中, level (i) 为该路径上第n条边在该义原层次树上的层级, weight (k) 为每层级的权重函数, 该函数随层数递增而单调递减, 定义如下:
其中, depth为当前义原层次树的层高。
故而a和b的相似度为:
下面我们考虑义项的相似度算法。知网中义原对义项的描述是通过一种知识描述语言KDML进行定义的, 其基本结构如下:
可见次要特征、关系义原特征、关系符号特征都可划归为两个义原集合中的相似度, 对于义原集合之间的相似度算法, 我们采用如下办法:
首先我们计算两个集合P和Q中的义原个数, 记为m和n, 不妨设m≤n, 将P和Q中的义原分别取一计算相似度, 得到m×n个相似度, 取其中最大的相似度, 令其对应的两个义原分别为p1和q1, 然后将集合P与Q中分别去掉该两个义原, 再重复上述办法取得p2和q2……直至P为空集, 令Q中剩余义原为qm+1, qm+1, …qn, 并令其均对应空义原。然后我们分别计算这n对义原之间的相似度, 取其算术平均值即为义原集合P与Q的相似度。即:
综上, 我们可归结义项S1和S2的相似度为四部分相似度的加权平均值:
其中sim1 (S1, S2) 即为 (1) 式算法, sim1 (S1, S2) 即为 (2) 式算法 (i=2, 3, 4) 。β1表示四部分相似度分占权重。在此我们按照以往文献研究中的通常取法, 将上述算法中的几大参数设为:
3.2 非结构化数据采用基于VSM的相似度算法
计算非结构化数据相似度的常用模型主要有基于向量空间模型和集合运算模型等, 综合应用程度和实际需要, 本文选择最常用的向量空间模型。
向量空间模型VSM是在20世纪60年代被提出的, 为代数模型的一种。该模型中假设词与词是不相关的, 将非结构化数据处理成独立的一序列词条组{T1, T2, T3, ∧, Tn}, 根据其在文档中的重要程度赋予相应的权重W1, W2, ∧, 并将{T1, T2, T3, ∧, Tn}看作n维向量空间的一组向量坐标轴, W1为其相应的坐标值。这样我们便得到了一个基于该条数据的向量空间。
基于向量空间模型的TD-IDF方法, 综合考虑了词在所有数据中的出现频率和这个词对不同数据的分辨能力后, 进行非结构化数据训练集中特征项的选取。本文中我们采用改进后的算法, 将特征项在特征选择阶段的权重应用到计算相似度的数据集合中, 改进后的公式如下:
其中:表示该特征项在数据中的重要程度, Wt表示特征项t在训练集中的权重;指特征项在数据d中出现的次数, 另外IDFt的表达式为:
其中:N表示数据集合中所有数据的数目, nt表示所有数据集合中t出现的次数, 称为特征项的数据频率。
非结构化数据的相似度可用向量之间的夹角或距离来表示, 其距离或夹角越小, 说明数据相似度越高。具体公式我们采用余弦计算方法, 其公式如下:
其中:Ti表示数据特征向量;Ti, t表示数据Ti的第t个向量。
3.3 时序数据采用基于分段极值DTW距离的相似度算法
基于动态时间弯曲技术的时间序列相似度查询已经应用的非常成熟和广泛, 但它的计算复杂度在某种层度上限制了其进一步应用。2010年被提出的基于极值点的DTW时间序列相似性算法在多次实验中被证实较为合理, 本文中将采用此方法改进后的PDTW算法中的部分核心思想作为在时序数据维度上算法的主要依据。
设我们即将比对计算相似度的两条时间序列分别为Q{q1, q2, ……, qn}和R{r1, r2, ……, rm}, 其中m≤n。根据序列Q和R可建立矩阵M, 其中Mi1= (qi-rj) 2+ (i-j) 2, 1≤i≤n, 1≤j≤m。在矩阵M中根据以下规则进行路径搜寻:
(1) 路径从M (i, 1) 开始, 初始成本为Mi1, 其中1≤i≤n-m+1;
(2) 每一步是从M (i, j) 到M (k, v) 的一个连接, 成本为Mkv, 其中k≥i+1, v=j+1;
(3) 路径在M (t, m) 结束, 其中t≥m;
(4) 路径的成本是初始成本与每条链接的成本的总和。
根据以上规则, 可在矩阵M中搜寻出多条路径, 利用计算机编写所需程序, 我们可以得到其中成本最小的路径, 并把该路径的成本值作为序列Q和R的距离。采用3.1中相似度与距离的转换公式:
其中α为参数, 考虑到本文中的实际应用需要, 我们暂以日为单位, 对一年中的时间序列做相似度考察, 故而我们取参数
3.4 空间数据采用基于多尺度线状目标的相似度算法
伴随着GIS系统的推广应用, 地理空间数据在实际应用中价值越来越凸显, 在数据中所占的比例也越来越大, 已成为数据综合相似度必须考量的一部分。本文中将模拟空间地理位置变动轨迹为折线, 通过对线状目标形状的分析, 从几何学的角度, 将空间数据的相似度研究建立于相应的基本图形中折线间的相似度算法之上并将算法加以研究改进, 从而建立出多尺度地理空间线状目标形状相似性的计算模型。
下面, 我们先分析一个最为简单的折线与线段的相似度算法:
如图1所示, △ABC的形状可由任意一边与其上的高之比ha和该边对角的角度α唯一确定其相似形, 显然具有相同相似形的三角形对应的该折线和线段具有同样的相似度。故而我们只需考虑上述两点要素即可。
观察图1中的图形, 不难得到如下几个特点:
a) α不变, 当h→∞时, sim (ABC, AC) →0;当h→0时, sim (ABC, AC) →1;
b) h不变, 当α→∞时, sim (ABC, AC) →1;当α→0时, sim (ABC, AC) →0;
c) 当α→180°时, sim (ABC, AC) →1;当α→0°时, sim (ABC, AC) →0。
由上我们可以给出衡量ABC与AC间相似度的两个因素的其中一种表达示如下:
通常情况下我们取两者的算术平均值作为最终相似度:
下面我们将上述算法延伸到混合型的折线与线段间的相似度算法。
a) 串联型图形。
考虑ABDE与AE间的相似度, 我们不妨将其拆分为两个基本三角形△ABC和△CDE, 记两个小三角形所占的权重分别为考虑到折线ABDE与AE的相似度与两个小三角形相应边的相似度关系较难直接给出表达示, 我们不妨按照3.1中的方法从折线间的“距离”出发, 有:
根据图形相似比特点, 我们定义折线ABDE与AE的距离为:
故而我们得到ABDE与AE间的相似度为:
b) 并联型图形。
这类图形的相似度关系较为简单, 经考察图形关系我们可以直接给出:
综上所述, 我们便对此类型中折线与线段间的相似度给出了一个算法。
4. 基于权重分配的多维异构数据相似度算法
以上我们简单讨论并部分改进了关于结构化数据、非结构化数据、时间序列数据、空间序列数据的主流相似度算法, 对于多维异构数据集的数据比对, 我们可以结合上述四个维度上的算法, 根据实际情况赋予相应的权重, 得到一个综合性的多维异构数据间的相似度比对模型:
对于两个包含多维异构数据的信息集P和Q, 设其相关的结构化数据、非结构化数据、时间序列数据、空间序列数据分别为Pi和Qi, i=1, 2, 3, 4。则我们有:
其中αi为各维数据相似度所占的权重, 根据具体应用方向实际情况特定取值。
5. 模型应用方向举例
本文中根据上述探讨的算法在此给出一个初步应用的参考方向。
在各行业信息化发展推动进程中, 大量人工作业被信息化软件所取代, 众多行业的各方信息逐渐实现统一平台化汇总。例如街道社区中的各类社会矛盾, 也通过信息化的手段实现了事件采集和协同共享, 在信息采集过程, 因系统不同, 采集人员不同等因素, 势必会造成信息登记上的遗漏、错误等现象, 那么, 如何从海量矛盾信息中根据相似度判重, 是有效解决社会矛盾, 提高各级调解组织工作效率的有效手段。
信息采集过程中, “姓名”、“性别”、“身份证号”等信息存储为结构化数据, 这些信息指向明确、输入值唯一, 在相似度比较过程中会占有较大比重;“登记笔录”“事件描述”等信息存储为非结构化数据, 通过研究其特征项关键词的相似度, 例如“采光”、“污染”、“拆迁”等词汇, 可在一定程度上反应该案件的信息方向;矛盾反映的日期、事件发生时间等一系列时间存储为时间序列数据, 例如“来访日期”、“调解日期”、“回访日期”等;相应的, 对于空间数据我们考虑事件记录中反映人“出生地”、“户籍地”、“事件发生地”等。
考虑实际中上述四方面的权重, 根据多次实验测试, 我们最终选定以下参数作为此类应用实例的取值。
6. 实验结果及分析
下面我们筛选来自于不同录入系统的两个矛盾事件。为简化起见, 我们只考虑案件部分信息作为举例实验。
A.姓名:小红, 小明;性别:女;事件描述:离异财产纠纷;事发日期:2010-1-1, 来访日期:2010-2-1, 调解日期:2010-2-15;出生地:北京市崇文区;户籍地:北京市海淀区;事件发生地:北京市昌平区。
B.姓名:小明;性别:男;事件描述:夫妻离异, 婚后财产分配存疑义;事发日期:2010-1-1, 来访日期:空, 调解日期:2010-2-10;出生地:北京市崇文区;户籍地:空;案件发生地:北京市昌平区。
a) 提炼上述两登记案件中的结构化数据信息, 即姓名和性别部分, 根据知网中词汇分类详细信息, 按照3.1中算法进行计算, 我们可得到 (以下结果我们均保留两位小数点) :
b) 文档A简要案情的词条组为{离异, 财产, 纠纷}, 文档B简要案情的词条组为{夫妻, 离异, 婚后, 财产, 分配, 疑义}, 根据3.2中的算法, 提取其特征项计算相似度, 可得到:
c) 案件A中的三个时间序列以2010-1-1日为起始, 以日为单位, 化为数值即为:{1, 32, 46}, 案件B中两个时间序列即为:{1, 41}。根据3.3中算法, 我们可找到两个时间序列集合中A到B的最短路径 (1, 1) → (46, 41) , 经计算A到B的距离dis (A, B) =26, 故而。
d) 案件A中的空间数据为{崇文, 海淀, 昌平}, 案件B中的空间数据为{崇文, 昌平}, 即可化为3.4中计算折线 (崇文-海淀-昌平) 与线段 (崇文-昌平) 的相似度, 按地图将三地等方位化为点, 考察其中各线段, 在此我们省略其中计算过程, 可最终得到折线 (崇文-海淀-昌平) 与线段 (崇文-昌平) 的相似度sim4=0.86。
我们可以设定一个阀值, 当计算得到的相似度大于该阀值时即判定两事件为重复事件, 显然对于案件A和案件B间相似度为0.775的结果来看, 我们可基本得到两矛盾为重复事件的结论。
事实上, 我们不难看出, 在第一个系统中录入为A矛盾时, 记录为多人矛盾, 为小明和小红, 并且性别按照小红录入为女;而在第二个系统中录入为B矛盾时, 由于信息缺失或其他原因, 仅记录小明一人, 并且性别按照小明录入为男, 且漏记录了“来访日期”、“户籍地”等信息;按照现在一般程序信息化判断, 由于最主要判断依据项的姓名和性别不同, 且简要案情叙述不同, 故而有极大概率无法判别出两事为同一事件。而在本文提出的模型中, 即可应用到此方面, 较为智能的综合各维度进行比对判定, 大大提高了数据相似度的查全率。
7. 总结与展望
本文从应用角度出发, 针对大信息量的多维异构数据相似性比对, 提出了全新、综合的相似度算法, 实验结果证明, 此算法能较好的适应多维异构数据相似性比对。当然, 由于自然语言较难完全自动信息化模拟等因素, 本文中构建模型尚有各种不完善及需要补充改进之处, 下一步我们会重点关注如何结合神经网络, 针对不同应用, 训练不同维度上的的权重, 以达到进一步推广应用的要求。
伴随信息化应用水平和技术的不断提高, 应用系统的综合度和规模也在不断升级, 亟需针对大型综合应用系统, 提出新的技术和新的建设思路, 本文只是针对大型综合应用系统, 从异构数据相似性角度进行了初探, 还需在这个方向上继续深入, 提出更多符合实际需要、可应用于实际的新技术、新思路。
摘要:本文从应用角度出发, 探索包含结构化数据、非结构化数据、时序数据、空间数据的大信息量多维异构数据相似性比对问题。即在不同的数据维度上采用主流、适合的算法, 计算每个数据维度上的相似度, 再从权重分配角度综合考虑, 提出综合不同维度的大信息量异构数据相似度算法, 从应用的角度, 探索异构数据相似度比对的新思路。
关键词:多维度,异构数据,相似度,权重
参考文献
[1]赵妍妍, 秦兵, 刘挺, 张俐, 苏中.基于多特征融合的句子相似度计算.全国第八届计算语言学联合学术会议 (JSCL-2005) .
[2]刘群, 李素建.基于《知网》的词汇语义相似度计算.第三届汉语词汇语义学研讨会, 2002:59-76.
[3]葛斌, 李芳芳, 郭丝路, 汤大权.基于知网的词汇语义相似度计算方法研究.计算机应用研究, 2010年9期.
[4]郭庆琳, 李艳梅, 唐琦。基于VSM的文本相似度计算的研究。计算机应用研究, 第25卷第11期, 2008年11月.
[5]吴学雁, 黄道平, 莫赞.基于极值点特征的时间序列相似性查询方法.计算机应用研究, 第27卷第6期, 2010年6月.
多维度模型 篇8
虽然我国动漫产业公共服务平台建设成绩斐然,但与动漫企业的需求相比,在服务机制、服务创新等方面存在诸多不足,需要在理论和实践上进行探索。
1 我国动漫产业服务平台发展问题分析
我国动漫产业服务平台起步较晚,所面临的问题主要体现在服务供给与需求不平衡,服务平台作为“服务”角色不能了解中小企业深层次的需求和困境,它在满足中小动漫企业需求、解决行业共性需求方面效果并不明显。
1.1 服务平台建设政府主导化倾向
我国动漫产业平台建设过程中,政府在资金、管理等方面提供支持是必要的,但过于依赖政府资助,使得平台自身创造的价值相对有限,没有创造价值的压力和能力,长期来说不具备可持续性。由于政府的资源配置方式主要包括法律、计划、命令这些手段,一定程度上具有滞后性,容易由“政府引导”导向“政府主导”甚至“政府领导”,致使企业迫切需要的一些公共服务滞后供给或直接未供给,有的地方甚至把平台建设成为争取专项资金的途径,然而服务平台建设不等于建筑工程,软实力更重要。我国政府将动漫产业作为重点产业扶持,但投入产出较低,服务层次浅。政府出资,政府设置专项资金等方式影响了服务平台创造价值能力。
政府主导服务平台缺乏市场竞争力,缺乏灵活性,服务能力不能与行业发展同步。服务平台在税收、场地租金、配套资金获取等方面享有优厚的政策支持,无形中在行业内形成了“价格双轨”的局面,容易出现“寻租”行为,对从事动漫服务的咨询公司等造成不良的社会影响。这也是服务平台服务创新能力薄弱的原因。
1.2 服务平台服务效率低
目前我国动漫产业服务平台大多属于职能型组织,组织层级过多,导致信息需求信息传递过程中出现噪音,职能型组织倾向导致沟通效率低。创新创业文化方面的缺失,导致信息从下而上的传递受阻碍,甚至缺失,服务的反馈功能丧失。而反馈和向客户学习是服务提高的动力之一。
服务平台服务创新跟不上行业发展,传统服务如会议服务、物业服务、政府资金支持、税收优惠等方式不能从根本上解决问题,服务形式单一、跟风现象严重。2009年《中国文化报》相关调查中描述:当年8个月内全国共举办四十三个动漫节展,众多雷同的动漫节展“沦为促销动漫衍生品的普通市场或主题重复的学术讨论会”,其总体状况“良莠不齐、专业观众偏少、商业洽谈环节缺失、交易量不够”[2]。此外,由于各个服务平台隶属于不同地方政府管辖,平台之间缺乏交流与组织之间学习,影响创新氛围与组织学习能力。
1.3 动漫服务平台管理人才缺乏
现有平台在用人制度方面,实行的是类似于事业单位用人制度,由于事业单位编制所限,一方面,动漫服务平台的管理人员较少,只能对动漫企业提供一些基本服务,缺乏动漫产业服务管理人才;另一方面,服务平台从业人员专业知识储备不足,服务人员不具备动漫从业经验,而动漫专业人才又因为不具备服务管理实践从而使得动漫服务人员专业不对口。此外,服务平台缺乏造血功能和灵活的用人与激励机制,难以吸引和留住高层次的人才。
1.4 服务技术支撑不合理
技术引进与本地化需求错位,且区域发展不平衡,平台之间、平台与企业内部的技术流动困难。地方平台耗巨额资本购置的设备闲置、过度投资,相反的,有些平台技术支撑不足、服务平台技术更新速度过慢致使平台服务范围内企业需要跨省甚至出国接受配套服务。
基于服务平台现存分析,本文针对怎样的创新是符合产业需求的,探索性的提出动漫产业服务创新模型。
2 动漫产业服务平台服务创新模型构建
创新是服务产业提升产业结构、促进产业升级的重要手段,20世纪80年代专家开始针对服务创新进行研究,Bilderbeek等人提出的服务创新四维度模型[3]是服务创新研究体系中重要成果。四维度模型虽然只是一个概念模型,但能较为全面地描绘服务创新并指导实际的创新活动,实践证明,该模型对创新政策制订者和服务创新企业家来说都具有一定价值[4]。针对动漫产业服务平台现存的问题,在已有成果基础上构建动漫产业服务平台的创新模型,为动漫产业公共服务平台的服务创新提供一个框架。创新模型如图所示。
2.1 服务概念创新维度
概念创新是创新活动的开始。杰克·特劳特和阿尔·艾里斯所倡导的“市场营销实际上是概念之间的竞争,而不是产品之间的竞争”这一观念明确了概念创新的先导作用。动漫产业平台服务具有“体验性”,为动漫行业所熟悉的常州动漫产业文化周、杭州动漫产业博物馆等皆是以概念创新为先导的。被服务企业是服务平台服务概念创新的源泉,概念创新要具备对行业的深度了解,深入平台服务创新的各个维度。
2.2 平台—企业交互维度
虽然动漫产业公共服务平台自身并不进行动漫产品的创意、生产活动,但是对动漫行业整体发展现状、发展趋势,以及所服务范围内企业面临的问题或困境等要有整体的把握,而且服务创新是渐进式的创新,模仿成本较低[5],因此,平台—企业交互维度是平台提升服务创新能力必不可少的维度。实证发现,平台—企业交互拓宽了企业获取知识的通道,增加了学习知识的途径和机会,从而有利于促进组织学习,组织向顾客学习对服务创新绩效有显著的正向影响[6]。
2.3 服务传递维度
服务传递就是指服务提供方为满足服务接受方的需求,将服务从提供方递送给接收方的过程。Miles认为服务创新中传递创新主要指服务企业的传递系统或服务产业传递媒介中的创新,包括企业与客户交互作用方式的变化,体现为一种“前台”的创新[7]。服务传递创新是服务创新的纽带与桥梁,也是服务的作用点,只有将创新传递到服务对象,服务才有价值。服务从后台传递给前台再传递给服务对象,受到服务基础设施、服务平台组织结构、信息沟通渠道、企业文化、员工素质等多方面因素影响。
2.4 服务技术维度
创新的另一个重要基础是技术创新,动漫企业服务平台服务创新要体现技术与创意的融合。动漫产业与新媒体的嫁接可以为其带来无限的生机和活力[8],服务平台的技术维度服务创新的重要性不仅体现在要促成这种联合,还体现在以下两点:1、技术支撑体系的完善上。2、网络应用普及,服务平台要注重自身服务系统的技术创新,提高服务信息化程度。借助平台优势吸引科研人员和科研机构进驻,在已有技术基础上拓展,不断开发自身的核心技术,构筑技术优势。
2.5 四维度间关联
动漫产业服务平台服务创新四个维度并不是孤立存在的,而是一个相互联系的稳定四面体,各维度之间不存在绝对界限,它们都是双向互动的关系。概念创新建立在熟悉行业发展状况基础上,掌握行业状态又离不开企业与平台的互动,与企业之间互动又是以技术服务维度为支撑的,四维度之间的关联导致创新策略也存在交叉。
3 动漫产业公共服务平台的服务创新策略
3.1 服务概念创新策略
针对模型分析中的服务概念创新维度可以从体系化、市场化、品牌化三个策略层面进行服务创新。
(1)体系化服务理念
以“体系化服务”为提升服务能力的切入点,强调完整服务理念,延伸服务价值链。除注册、办理营业执照、物业管理等基础服务外,还需要提供更深层次服务,从而构建了一条龙的服务体系,包括人才引进—创意研发—融资—制作生产—市场开拓—衍生品开发等覆盖整条价值链的系列服务,防止动漫产业价值链断裂的问题出现。开展市场调查服务,调查内容包括:动漫企业保留现有顾客群、发展新的消费群等所需要的创意和管理理念;行业内竞争者的最新创意、成功的盈利模式以及衍生品开发手段;已有和在产的动画片、电影项目等对现有的消费群体传递怎样的价值观。通过“妈妈式服务”、“保姆式服务”等理念体现服务的全面且贴近动漫企业的实际服务需求。
(2)市场化服务概念
多元化投资主体方面,在保证平台服务于动漫内企业这一核心宗旨条件下引入民营企业、高校、第三部门等不同的投资主体,不设定行政范围,服务平台通过公平的市场竞争来提高自身服务效率,使得民营资本发挥在资源配置和运用的效率上。
经营机制企业化方面,把企业经营机制引入服务平台的运作中,克服行政化运作机制。在产权上,可适当运用企业集团、大学科研机构、其他社会团体建设和政府监督的模式,以利于动漫产业服务平台运作成熟,有自己的造血功能,以实现所有权与经营权分离;在组织机构上,建立起完善的法人治理结构,尽可能精简创业基地内部治理的事务,提高运行效率,加强对动漫企业的支持力度。将服务平台置于市场环境中,对外服务适当收取费用,补贴成本。
(3)品牌化服务概念
服务平台的运行需要品牌化概念,具有鲜明品牌形象的服务平台才可以更广范围、更深层次的吸引更多优秀创业企业的加盟。
总结服务成功的典型服务经验,发展成品牌服务流程,在优质服务基础、标准化与定制化基础上培育核心品牌服务。
通过广告宣传等手段提高服务平台知名度,同时注意经营好与媒体关系,以利于维护服务品牌形象,进一步提高品牌的美誉度,在核心品牌的带动下延伸形成系列服务品牌。
3.2 平台与企业交互创新策略
调整组织结构,建立虚拟网络服务平台,搭建关系网络,咨询服务专业化都是可供参考的有效交互创新策略。
(1)建立学习型组织培养创新氛围
动漫企业是服务平台的客户,在与动漫企业交互中,向客户学习,提供行业市场调研服务,在服务平台了解行业动态基础上促进服务企业的行业知识累积。
扁平化组织,扁平化有利于知识与信息在组织内部的纵向交流与共享,充分发挥学习型组织的灵活性,开放性等特征。可通过组织再造减少组织层次,建立扁平化管理体系;通过鼓励创新等方式营造创新的文化氛围。
倡导团队合作精神,保障平台内部与外部、平台内部各要素之间、成员之间交流与沟通的渠道畅通,增进成员之间的互信与合作。良好的沟通渠道是平台构建包含流、物流、信息流的流通体系的结构要素。
(2)基于Internet的虚拟网络化平台服务
信息交流离不开现代网络,服务平台建设网络平台,实现在线信息共享和传递无疑有利于更好的整合资源。搜集整理宏观层而的最新政策、法律法规、管理办法、投资指南以及产品销售、市场行情、竞争者动态等信息便于动漫企业了解产业环境、适应不利环境、在产业环境发生变化时有缓冲时间。例如时下兴起的微博、3G等方式都可以作为服务的工具,使服务更贴近动漫企业从业者。
动漫产业作为创意产业的一类,其传播、销售等都离不开网络这一载体,虚拟化网络平台既是传播载体也是消息和服务获取的载体。将各个城市、各个区域服务平台组成网络,实现服务、信息、知识、资金、空间等资源的共享,促进动漫企业之间、服务平台与其他机构之问的双向交流与互惠发展。
(3)构建关系网络
平台—企业交互的创新意味着平台与企业关系的延伸,需要积极的推动动漫企业的参与度,同时延伸至平台与平台间互动、与利益相关者、社会网络之间的互动。平台与发展较好的服务组织签订紧密型战略合作协议,引入先进的专业管理服务团队、先进的服务理念、成熟的服务模式。与动漫行业相关组织建立关系网络,动漫产业服务平台的关系网络包括动漫产业链各环节主体(动画片制作、衍生品生产与销售企业、播放机构)、金融机构、政府、非盈利组织等;服务平台服务范围内的企业与企业之间需要搭建桥梁,使处于产业链不同链条的企业合伙交流,使得企业可在平台服务范围内找到合作伙伴,共享平台内资源;在更广范围内“建立动漫产业联盟,推动国内外动漫企业的分工协作”[9]。
(4)专业化咨询服务创新
聘请境内外专家组成的“动漫专家咨询委员会”,可实行“项目管理”型的专家团队, 针对不同企业需求、企业不同需求进行专业化咨询服务。组建针对创意编剧,形象设置,制作质量方面的“专业动漫委员团队”同时开展动漫题材征集活动,凭借专家资源从中筛选出好的题材,推荐给动漫制作企业。针对市场营销,企业组织管理方面的“专业管理团队”在原创动画制作前、制作中,以及各个环节进行跟踪,为企业出谋划策,辅导企业经营。针对动漫产业的生产成本高,复制成本低特点,组织“产权保护法律专家团”针对企业的知识产权保护等方面提供法规法律方面的咨询建议。组建“投融资团队”,帮助企业解读政府优惠政策,帮助企业获得银行等金融机构资金支持,多元化融资通道,吸引社会资本和其他资本投入被服务企业,同时充分发挥主渠道作用,组织对重点企业、重大项目的投融资。
3.3 服务传递创新策略
在服务传递创新方面有服务标准化与定制化策略,人才策略关系网络与开放式创新策略以及合理利用承诺等具体策略。
(1)服务标准化与定制化策略
未来服务的两大趋势即更专业化和更标准化,在当前的服务发展中,为了提高效率和控制服务质量,定制化的服务有可能转向标准化,更标准化也有可能转向更专业化,甚至定制化[10]。一方面让服务平台通过标准化建设寻求标准与企业自身业务发展及经营模式的切入点,借助政府、行业、产业链上下游之力,提升企业的核心竞争力。从服务平台设施的建设、使用、管理,动漫产业产品的认定、展示、使用,服务质量管理等方面进行标准研制,将有竞争力的服务理念和运作成熟的服务项目标准化。另一方面开展定制化服务策略,筛选有发展潜力且有定制化需求的龙头企业作为定制化服务对象,“龙头企业优化了产业结构,激活了产业链的各个环节,龙头企业是行业信用的保证,对于优化产业的生态环境可以起到积极的作用”[11]。重点服务有潜力的动漫企业成为龙头企业,或者吸引优秀企业成为集群内的龙头企业,对其深度服务使其成为服务标杆。
(2)服务创新人才策略
平台服务创新的知识来源不依赖于其R&D行为,而主要来自于企业员工的经验积累和专业技能[12],动漫产业是指以“创意”为核心,涵盖动漫图书、报刊、电影、电视、音像制品、舞台剧和基于现代信息传播技术手段的动漫新品种等动漫直接产品的开发、生产、出版、播出、演出和销售[1]。针对各个价值链环节的服务人才要求不同,需要具有相关知识储备,能同时在动漫专业领域,管理理论等都有一定了解的人才能胜任。
培养和吸收精通动漫产业、有服务精神的管理人才,只有热爱动漫行业,且有服务精神才能主观上更好的传递服务,才能在服务上有所创新。创新是建立在熟悉服务业务流程,熟悉行业环境、所服务行业发展现状与问题、服务流程的基础上。
通过产学研结合,培育专业化新型动漫管理人才。通过提高从业人员的素质来提高服务质量,扩展服务功能。
(3)服务承诺合理化策略
动漫企业对服务平台的服务期望越高,服务满意的可能性就相应降低。盲目对动漫产业大包大揽的承诺,不仅不能引导和调节动漫产业的需求期望,而且可能因为承诺未能及时兑现而损害服务品牌。服务平台应在完善自身服务的基础上,将服务承诺合理化,可采取对动漫产业阶段性服务进程沟通等方式,将动漫企业的服务期望调节到合理水平,从而更有利于服务传递。
3.4 服务技术创新策略
在服务技术层面上主要注重合理化技术引入以及引入的技术如何转化成为所服务企业的生产能力的同时建立起平台与企业的双向评价体系。
(1)合理配置技术引入
针对技术方面的需求,服务平台需依托本地资源、平台资源,合理购置动画制作设备,使企业能以低于市场的价格租用,减轻企业的生产投资成本,提高企业创意生产效率。例如:建立能提供稳定、快速、无瓶颈的渲染服务的集群网络渲染平台(也叫渲染农场);建设二维无纸化技术公共服务平台,利用二维无纸动画平台数据库存储动漫相关素材,通过网络传递方式为动漫企业提供服务;引进二维、三维成套制作系统,满足高清、标清、数字电影、数字娱乐、网络游戏等不同层次的技术需求,平台以低于市场价格服务于基地企业。
增强数字电视网络及第三代移动通信(3G)平台等的运营管理与创意研发方面的技术咨询来促进动漫新媒体技术的融合。
(2)技术联盟与创意转化服务
依靠高校、科研机构、网络专家学者等资源,在不同企业地区间建立技术联盟,使得不同企业或地区服务平台服务范围内的企业能共享技术设备与服务。同时对已租赁企业提供技术培训、咨询服务,提高技术转化率,让企业能及时消化新技术。
动漫产业服务平台通过技术引进,不断丰富技术支撑体系的内容,并为动漫企业提供技术转让服务,搭建技术交易服务桥梁,以交易形式促进技术交流与进步。
为新创意提供转化技术支持等方式促进创意的转化和市场化,与相关企业合作,为动漫新创意新题材提供实践基地。以技术支撑带动创意转化成功率,甚至联系关系网络内企业提供转化实验基地,为有技术设备购置需求的企业提供融资服务。
(3)双向评价体系
服务平台对动漫企业提供认证与评价服务,对申报立项的动漫创意题材、专家委员会进行评估咨询,为动漫企业生产制作提出专业意见。制定标准化评价方法,使动漫企业产品或创意受到市场认可,促成行业标准的产生。
通过被服务企业对平台的服务反馈建立平台自身评价指标。对动漫企业服务平台管理体制和运行机制进行深层次理论研究,为服务平台提供理论支撑。根据服务创新的投入产出指标,完善服务业企业的财务指标统计体系[13],借鉴360度评价、六西格玛管理等方法建立量化服务质量评价体系,促成从业规范。
4 结论