多因子模型

2024-08-04

多因子模型(通用9篇)

多因子模型 篇1

一、引言

互联网时代媒体导致的公众预期强化,通过投资者情绪使证券市场波动加剧。Sabherwal(2008)通过采集TheLion.com论坛上被投资者高频评论的股票帖,运用事件研究法估计发帖量和异常收益的关系,发现发帖量与股票异常收益率正相关。Zhang(2010)采集6个月的Twitter推文,分析情感指标和股市指示的关系,结果发现,无论是正面情绪或负面情绪,均与道琼斯指数、标普500指数和纳斯达克指数有着显著的正向关系。Sprenger(2013)运用计算机语言技术,分析了微博上25万条推文,发现推文情感和股票异常收益,推文量和交易量、波动率存在一定关系。这表明通过挖掘媒体信息来研究股市异象甚至预测股价走势真正从理论走向实践,为理论研究和实际运用注入了强大的动力。基于以上研究发现,本研究在探索中国股市的情感指标与股市变量间互动关系时,优先选择了负面情感与总情感词数的占比作为论坛情感指标。

二、实证方法

本文的实证研究主要基于东方财富网股吧论坛,利用爬虫程序抓取论坛与融资融券标的股相关的发帖信息并将其量化处理后作为公众情绪指标(指标一),同时计算发帖量(指标二),结合经典的Fama-French三因子模型,研究公众情绪指标、发帖量与相应上市公司异常收益率、交易量和波动率因子的关系,从投资者情绪分析视角探索融资融券投资者的信心以及对证券市场进行趋势预测。

这一研究按照图1所示流程展开,其中的发帖量分析引擎、情感词分析引擎和计量模型是分析的核心部分。

根据如上构建的“财经专业情感词库”和使用爬虫抓取到的每日论坛帖子,利用中国科学院的ICTCLAS分词系统对论坛帖子进行分词,然后将分好词后的帖子通过匹配的“财经专业情感词库”来对情感词进行标记,负面情感词标记为“negative words”,正面情感词标记为“positive words”并对每个公司每天的情感词数进行加总统计,计算出每个公司每日帖子的负面情感的占比,计算公式如下。

式(1)-(2)中,Neg表示每个公司每日帖子积极词汇与消极词汇的总和中消极词汇的占比;μNeg表示每个公司每日帖子中消极词汇的均值;σNeg表示每个公司每日帖子中消极词汇的标准差;neg是对Neg的标准化(当Neg是不稳定时标准化是非常有必要的),表达每公司每日帖子中负面情感的占比采用的指标是neg。

三、多因子回归模型

Fama和French提出采用投资组合的超额回报率可由它对市场资产组合(Rm-Rf)、市值因子(SMB)、账面市值比因子(HML)三因子的暴露来解释股票回报率,模型为:

式中Rft表示时间t的无风险收益率;Rmt表示时间t的市场收益率;Rit为资产i在t时间的收益率;E(Rmt)-Rft表示市场风险溢价;SMBt为时间t的市值因子的模拟组合收益率;HMLt为t时间的账面市值比因子的模拟组合率。

在FF三因子的基础上考虑把发帖量或负面情感加入构成四因子模型,分别为“AR-PV”模型和“AR-SENT”模型,在此基础上考虑同时加入发帖量和情感因子构成五因子模型,称为“AR-PV&SENT”模型,具体模型如下:

AR-PV模型:

AR-SENT模型:

AR-PV&SENT模型:

式(4)-(6)中,PV为发帖量(Posting Volume),SENT为负面情感(Sentiment)占比。

四、实证结果与分析

以中证100指数为基础,根据前述时间区间、剔除数据存在较多缺失值后,选择42家股票作为研究样本(见表1)。

FF三因子模型中涉及到的变量,以及回归模型中需要用到的交易量、波动率变量均可从《RESSET金融研究数据库》下载,变量对应关系见表2。

(1)发帖量、帖子情感与异常收益率的关系。运用面板数据回归分析法比较分析了FF三因子回归模型(见式3)、分别加入发帖量和帖子情感的AR-PV四因子回归模型(见式4)和AR-SENT四因子回归模型(见式5),以及同时加入发帖量与帖子情感的AR-PV&SENT五因子回归模型(见式6),结果见表1,模型9的估计结果见表3,其中AR为异常收益率(Abnormal Return)。

从表3可知,单独使用三因子时,R2为0.52,F检验值为119.6,表明该回归模型拟合效果较好,总体显著,这一结论与Fama-French的研究结果一致。而当分别加入发帖量因子和帖子情感因子后,不仅模型的P值仍然显著,更有模型的R2较之前FF模型的R2分别增加了约1.5%和0.48%。当同时加入发帖量因子和情感因子后,模型依旧显著,R2增加了1.94%,这充分说明发帖量和负面情感的占比对异常收益率有一定的解释作用,虽然这种解释力比较微弱但在统计上是显著的。

从计算可知,AR-PV&SENT回归方程中PV所在列的系数均大体为正,P值显著,说明发帖量的增加会导致异常收益的增加,反之亦然,该研究结果说明负面情感的比重越大就会导致异常收益的降低,较高的负面情绪暗示投资者对于该股不看好,因此该股有可能下跌。

(2)发帖量、帖子情感与异常收益率的关系。采用信息丰富的面板回归模型,将发帖量具体跟踪到公司每日,有利于发掘出针对公司级的价值信息,从而能为投资者提供投资决策。发帖量对交易量的影响强度远远高于交易量对发帖量的影响强度,因此,将发帖量作为自变量,波动率与交易量分别作为因变量进行面板数据回归(采用变系数回归方程)分析。实验结果显示:一是PV&TV所在列系数均为正数,P值统计显著,且模型R2较高,说明发帖量对交易量有显著的正向作用,即对该股的发帖数量越多,该股受关注的程度越高,投资者交易该股的可能性越大。上述结论与Antweiler(2004)关于股评与交易量的研究结果一致。二是PV&VOL所在列的系数大体都为正,说明发帖量与波动率有较显著的正相关关系。

为展示负面情感的占比对交易量、波动率的影响效果,选择将一定时期内每周论坛上发表的帖子数的均值,与其在相应时期内的交易量均值、波动率均值作比较。结果显示,某一周内的发帖量与该股票的成交量同步加速上升,而发帖量萎缩时,成交量也相应地减少,具有相同的拐点,这说明股票论坛上的帖子数与该股票的成交量存在正相关关系。

(3)帖子情感与交易量、波动率的关系。本文采用面板数据回归分析法进一步研究负面情感的占比对上市公司个股的影响程度。其中,SENT&TV表示将负面情感的占比作为自变量,交易量作为因变量的回归方程,ENT&VOL表示将负面情感的占比作为自变量,波动率作为因变量的回归方程,结果见表4。

从表4可知,SENT&TV、SENT&VOL两个模型P值统计显著,说明帖子情感对交易量与波动率确实具有一定的解释力。将每周该公司的负面情感词的占比的均值与相应期间内交易量和波动率的均值进行图形的绘制比对,结果显示,当负面情感的占比走到极大值或者极小值的时候,交易量与波动率几乎均达到极大值处,这说明异常高或者异常低的负面情感,均会导致股票的成交量和波动率出现异常高的情形,主要原因是论坛、股吧中的发言者一般为个人投资者,资金规模小,消息来源少。因此易受小道消息或道听途说的消息影响,交易缺乏原则与规划,交易行为较冲动随意,因而会集中体现在交易量和波动率的变化上。

五、结论

本文基于东方财富网股吧论坛,利用爬虫程序抓取论坛与样本标的股相关的发帖信息将其量化处理后作为投资者情绪指标,同时计算发帖量,对经典的Fama-Frenc三因子模型进行扩展,采用三因子、四因子和五因子回归模型实证研究了公众情绪指标、发帖量与融资融券标的股异常收益率、交易量和波动率因子的关系,从投资者情绪分析视角探索投资者的信心以及对证券市场进行趋势预测。由此通过建设公开透明的信息披露机制,可以有效降低投资者情绪影响,推动证券市场的稳定发展。

摘要:基于东方财富网股吧论坛,利用爬虫程序抓取论坛与样本标的股相关的发帖信息并将其量化处理后作为投资者情绪指标,同时计算发帖量,对经典的Fama-French模型进行扩展,采用三因子、四因子和五因子回归模型实证研究了公众情绪指标、发帖量与融资融券标的股异常收益率、交易量和波动率因子的关系,从投资者情绪分析视角探索投资者的信心以及对证券市场进行趋势预测。由此通过建设公开透明的信息披露机制,可以有效降低投资者情绪影响,推动证券市场的稳定发展。

关键词:多因子,回归模型,投资者情绪,异常收益率

参考文献

[1]杨忻、陈展辉:中国股市三因子资产定价模型实证研究[J].数量经济技术与经济研究,2003(12).

[2]蒋玉梅、王明照:投资者情绪与股票收益:总体效应与横截面效应的实证研究[J].南开管理评论,2010(3).

[3]Fama,E F,French K R.,1993,Common Risk Factors in the Returns on Stock and Bonds,Journal of Financial Economics,33(1),pp.

[4]史永东、田渊博、马姜琼、钟俊华:多因子模型下投资者情绪对股票横截面收益的影响研究[J].投资研究,2015(5).

多因子模型 篇2

那么,量化是不是等同于模型,量化投资到底有何过人之处呢?带着这样的疑问,记者走访了大摩多因子策略基金经理张靖,让他为投资者解密量化投资的“黑匣子”。

量化模型是工具,投资理念是灵魂

“如果把投资比作吃饭的话,那么‘吃什么’由投资理念来决定,再根据所吃的食物决定使用的吃饭工具,即量化模型。”张靖认为,在量化投资领域,投资理念才是量化投资的灵魂,决定了投资的逻辑。只有将最根本的逻辑融入适当的量化方法中才能将量化投资的“魔力”发挥出来,创造最大的投资收益。

谈到模型在量化投资中的作用,张靖有其独到的见解,“量化模型的采用必须与投资理念密切结合,并不是越复杂的模型越好,有时简单易操作的模型反而更加有效。正如吃西餐要用刀叉,吃中餐要用筷子一样,与投资理念相匹配的模型才是最好的模型。”

用量化的方法做有把握的事

张靖对量化投资最通俗的解释就是“用量化的方法做有把握的事儿”。换句话说,就是通过对大量样本数据和市场环境的量化分析,通过平衡投资的风险和收益,建立量化模型,捕捉大概率事件,有把握地获取市场上普遍的、稍高于平均水平的超额收益。

另外,张靖提到,量化模型并不是固定不变的,需要逐步提升,不断改进,在变化中总结经验和规律,使得量化模型能够适应市场和投资者投资习惯的变化。以大摩多因子基金模型中现有的动量因子为例,从总体来看,随着市场逐渐回归理性,其效应应该是逐渐递减的。所以随着该因子效应的递减,未来可能会将其从模型中剔除掉。相应地,另外一些新的因子可能会加入模型中。

量化选股、量化择时、量化交易

提到张靖管理的大摩多因子基金,不得不说该基金将量化投资的特点和优越性展现得淋漓尽致。大摩多因子基金是一只纯量化基金,不但量化选股,也量化择时,并且能够客观地选择交易策略,降低情绪影响,可以说是量化选股、量化择时以及量化交易三位一体的有效结合。

据张靖介绍,大摩多因子基金采用多种数据模型对投资时机进行判断,其中宏观经济监控模型显示宏观经济去库存趋势有所放缓,未有明显改观,实体经济需求处于历史低位,未见明显反转,并且在未来2个月内CPI的压力仍然较大,期间政策松动的可能性较小。另外判断短期市场的资金动量模型显示投资者行为未出现异常,没有发出明确信号。根据因子择时模型,我们判断目前调整尚未结束,但可能蕴藏机会,因此大摩多因子基金的仓位控制在合适的水平,过去三个月大摩多因子基金超额收益有一半以上来源于择时模型。从板块和个股的选择来看,对不同因子的选择仍然贡献了不菲的超额收益,前期表现较好的反转因子与分析师预期因子继续发挥效用,估值因子的近期表现较好,有望回归其长期水平,其余各因子表现相对均衡。估值因子长期有效,贡献的超额收益非常明显,可关注低估值个股的机会。

多因子模型 篇3

关键词:大规模分布式环境,多决策因子,信任管理与预测模型,更新计算

1 引言

随着因特网技术的发展和大规模分布式计算环境 (如P2P计算、网格计算、Ad-Hoc网络、社交网络等) 的深入研究与广泛应用, 网络系统表现为由多个异构的系统或软件服务构成的动态协作模型。这类系统的形态正从传统的集中式、封闭的、相对静态的形式, 向开放的、面向公共用户的、动态协作的模式转变[1]。由于现阶段因特网环境的不确定性和上述动态属性的加入, 基于PKI (Public Key Infrastructure) 的传统静态信任机制已不能适应这些新的应用需求, 因而, 针对大规模分布式应用中的可信网络技术成为一个及待解决的热门问题[2,3]。现实的人类社会是一个“开放的”系统, 即存在每时每刻因为一些不确定因素导致超出控制的可能性。大规模分布式计算环境下的新应用模式 (如P2P、社交网络等) 和现实人类社会也具有很大的相似之处。此外, 动态信任管理技术是近几年才发展起来的, 对很多相关理论和技术性问题仍缺乏系统的、明确的方法引导, 对此没有形成共识, 也没有完全解决互联网发展过程中对于信任关系准确度量与预测的需求[4]。因而, 对动态信任关系量化机理进行系统而深入地研究具有重要的意义与广阔的前景。

现有的关于信任机制的研究有效地推动了相关任务的发展。Qu在文献[5]中引入了衰减因子、衰减速率因子和时间区间来提高结果的正确性, 但其模型针对时间区间的定义不够明确, 因而当时间区间的长度过大, 合成的直接信任度将会影响到对信任客体信任的判别。文献[6]在大规模分布式环境中采用了求取推荐实体对推荐客体的信任度的平均值做为参数, 建立共识操作符 (Consensus Operator, CO) 来构建间接信任度, 但受到合谋攻击行为时会影响合成的间接信任度。Almenarez等在文献[7]中采用了以自身信任度作为权重, 建立权重平均操作符 (Weighted Average Operator, WAO) 来构建间接信任度, 但面对合谋攻击行为时, 最终的间接信任度也会显著地受恶意实体影响。Chang等在文献[8]中采用推荐实体的信任度与群体总信任度的比值作为权重, 建立比例操作符 (Proportion Operator, PO) 来构建间接信任度, 但是该模型也很难在面对合谋欺骗做出合理的反应。文献[1]中认为在匿名的大规模分布式环境中, 极易发生的一种攻击行为就是选票阻塞[9]后的合谋攻击。因而其采用推荐实体推荐值的标准差的标准差运算符 (Standard Deviation Oper-ator, SDO) 来构建间接信任度, 并以遗忘因子为权重结合直接信任度和间接信任度最终合成对信任客体的信任评估。但在面对合谋欺骗时, 当恶意实体在全部推荐实体中所占的比例超过一定的数值时, 该模型也会因为这些恶意实体通过相互给出虚假的高的信任度评估值并影响到最终的间接信任度。

为使信任模型评估更加准确并更好的面对合谋攻击等安全问题, 本文引入了遗忘因子 (Forgetting Factor) β、衰减速率因子S、 推荐度 (Recommended Degree) 和偏向权重因子 (Biased Weighting Factor) W等多决策因子, 很好的处理了上述模型存在的不足, 提高了信任度的准确性。在信任机制中, 通过上述因子并定义推荐预算符 (Reasonable Operator, RO) 同自身信任度作为权重来构建间接信任度, 提高了间接信任度的准确性和可靠性。在合成信任度评估模型中, 通过本文的偏向权重因子设定参数来增加模型对环境的适应性, 使模型能够适用于多种环境。在分析节点的实时行为中, 根据新的交互经验或者推荐信息等来更新信任值。并且将实体的行为分为积极行为和消极行为两类参考因素, 对节点的信任值进行更新, 使模型在有恶意节点攻击的环境中, 也能有很好的安全性。对本文的模型通过模拟实验分析, 相较于其他的模型:本文中的模型能够更好的适应各种环境, 具有良好的动态性, 并且在面对各种攻击具有更好的安全性。

2 构建信任关系模型

2.1 构建动态信任关系

大规模分布式网络环境中, 信任具有时间相关的动态性, 即信任关系必须随时间的变化而更新。因此, 动态信任关系模型必须要能够反映出这种信任关系的动态更新性, 还必须具备信任关系随时间和上下文变化而重新评估的功能。本文定义信任关系是实体间的一个连续函数, 整个系统的状态是由各实体建立的信任关系组成。上述是单属性的信任关系的定义, 即实体只有一个属性, 但是单属性无法满足现实中的环境, 本文引入多属性[1]的信任关系定义, 即实体具有:自反性、非对称性、条件传递性和动态性。

2.1.1 信任度空间

为使表述信任程度的动态变化更加精确, 本文使用连续法[10]来表述这一空间。文中使用区间[0, 1]范围内的一个实数来表示信任度。在这个区间里, 信任度为0 表示信任客体完全不可信;信任度为表示信任主体完全信任客体;而相对的, 信任度为0.5 表示对信任客体的信任度处于没有任何把握的状态。使用这种连续值法来表述信任度, 使得在信任主体的决策行为中能更好的应用信任度。

2.1.2 动态信任关系的构建

大规模分布式网络环境中, 本文的信任评估模型主要采用基于历史交互记录的直接信任和基于推荐度的间接信任作为信任信息来源计算信任评估值。当节点A需要对节点B做出信任评估, 节点A将首先查找自身的历史记录中是否有节点B的直接交互信息。直接信任基于过去有效时间内的历史交互经验, 主体节点与客体节点如果有历史交互记录, 可以根据这些交互的结果来判断客体节点的可信度, 这就形成了直接信任度。如果不存在历史交互记录, 本文将直接信任值设为默认值0.5。

(1) 直接信任的合成

对于节点的直接信任使用DT (A, B) , 表示节点A对节点B的信任度是由两个熟悉节点间通过交互得到的直接经验信息。在大规模的分布式计算环境中, 恶意节点也常常使用信任震荡的方式来提高自身信任度。直接使用这些历史记录信息, 则违反了信任的时间相关性原则。

为解决上述问题, 本文在信任模型的构建中引入了遗忘因子 β, 其定义如下:

这里, t表示当前时刻, 而t表示过去交互行为发生时刻。Δtmax表示历史行为有效的时间窗口大小, 即经过多久, 过去的交互信息被认为完全失效, 该参数是可定义的。S是衰减速率因子, 它的取值根据具体的应用情况而定义。这样当历史交互发生在有效的时间窗口长度以外时, 认为过去的经验毫无价值, 遗忘因子 β 为0。而过去交互时刻t越接近当前的时刻t, β 值越接近1, 表示过去的交互经验越有价值。

通过上述遗忘因子, 本文将直接信任模型定义为:

(2) 间接信任的合成

本文将主体节点A对客体节点B的间接信任度使用IT (A, B) 表示。假定存在一组节点为{Ci, 0<i≤n}, 主体节点与该组节点均存在信任关系T (A, Ci) , 而该组节点与客体节点B也都有信任关系T (Ci, B) , 本文利用该信任关系来合成IT (A, B) 。本文引入推荐因子 δ 表示推荐主体C对信任客体B的推荐度, 其定义如下:

其中, t表示的是当前的时间, h表示的是恶意攻击发生的时间。Δtmax和前面的定义一样, 表示历史行为有效的时间窗口大小, 是可定义的参数。从上式可以看出, 当恶意攻击发生的时间h离现在越久, 推荐值 δ 越接近于1, 表示过去的恶意攻击行为越没有价值。

通过引入推荐度, 将标准差定义为公式:

通过引入推荐度, 将方差定义为公式:

定义推荐运算符为RO (Ci) 为:

通过定义推荐运算符, 得到最终的间接信任评估公式为:

(3) 信任度的计算

利用直接信任度、间接信任度和偏向权重W, 本文提出的时间相关信任度计算过程模型如下, 即主体节点A对客体节点B在时刻t的信任评估方式为:

其中, W为偏向权重其定义如下:

其中, E为根据不同环境设定的参数, 表示不同环境中对直接信任的依赖程度, 本文规定0<E≤1。

2.2 信任模型的更新

根据大规模分布式环境的特点, 信任模型必须不断的根据新的交互经验或者推荐信息等来动态更新。本文把节点的行为分为两类:积极行为和消极行为。积极行为将导致信任评估值的提升, 相反的, 消极行为会导致信任评估值的降低。

动态信任关系具有时间相关性, 在某一时刻t时, 主体节点A对于客体节点B的信任评估值本文使用Tt (A, B) 来表示。等同于信任度合成的信任模型, 该信任评估值由默认预设值或之前某个时刻t主体节点对客体节点的直接信任度DTt (A, B) 和当前的时刻t来自推荐实体的推荐信息合成ITt (A, B) 提供。因此, 根据信任客体B的这些行为的结果, 主体节点A将客体节点B的行为按照自身的标准编码成一个连续的实时行为值{Va, 0≤Va≤1}。当行为值为0 表示主体节点A对B的行为不满意, 相反的, 如果行为值为1 表示完全符合A的标准期望。

当动态信任评估利用实时行为值Va来更新时, 必须要考虑恶意节点的战略性行为改变攻击。此时, 直接利用实时行为值Va来对动态信任评估结果进行更新, 会使恶意节点累积到一定的信任评估值之后, 采用两种行为交替的行为来攻击系统达到所要的目的。通过对上述问题的分析, 本文采用实体历史行为作为权重来修正实时行为值Va, 最终得到历史行为值V[t]如下所示:

Va是根据当前行为的结果编码而成的行为值, t表示选取的最大截止时间。信任必须具有动态性和系统实用性, 本文采用 Δtmax表示历史行为有效的时间窗口大小, 用来保存一定大小的历史行为窗口, 该值可以预先配置。显然, 当过往的历史交互行为越积极时, 该权重越趋向于1, 而如果过往的历史交互行为越消极, 该权重值越趋向于0。当不存在历史交互记录时, 本文将直接使用该行为值。

根据上述公式, 本文将信任模型更新为如下所示:

其中, Tt (A, B) 是之前t时刻的信任评估值。W是之前定义的偏向权重, 表示不同环境中过往历史对当前更新的权重大小。当历史行为发生的时间已超过了有效的时间窗口时, 则认为历史信任评估值完全没有价值而全部根据行为值来更新。ε表示预设恶意行为的阈值, 是可配置参数。

根据上述的模型, 节点在建立联系之后的行为结果将会影响对该节点的动态信任评估的更新, 即节点采用积极行为将导致信任评估值提升, 相反的消极行为将会导致信任评估值的降低并最终失去自身的声誉。通过上述模型的建立, 体现出信任具有难以累积却很容易因为恶意行为而失去的性质。节点必须通过长期、连续的积极行为才能使节点的声誉缓慢增加, 但是随着声誉的增加, 节点的一次消极行为也将导致声誉的发生严重的丧失。因而, 上述的战略性行为改变攻击将会导致该节点的声誉总体上呈下降趋势, 并最终使自身的声誉毁灭。

3 模拟实验和结果分析

本文使用MATLAB程序进行仿真模拟, 设置一组节点模拟仿真P2P网络中节点的交互过程。实验中指定一个节点为信任主体, 另一个节点为信任客体, 通过模拟信任客体做出的不同行为导致的主体节点对其信任度的变化情况来验证本文提出的信任模型的正确性与有效性。

本文将通过三组实验对模型在时间相关性、一贯性和快速性方面是否具有有效性和正确性进行评估, 并在最后设置一组常见的信任系统攻击方法的攻击实验来评估模型面对这些攻击方法时的健壮性。

3.1 时间相关性

实验中, 主要针对信任模型是否具有时间相关性进行实验, 即主要验证本文模型引入的遗忘因子对信任评估的是否存在有效的影响。其分为其他因素没有发生改变的情况下和根据节点的行为结果来更新节点的信任评估值两种情况。在第一种情况中, 根据本文的信任模型, 假定对客体节点在t=0 时刻的信任评估值为1。t时刻的信任评估值将根据t时刻的历史交互经验和当前其他推荐节点的推荐信息来合成, 假定其他所有节点对客体节点的推荐信息均相同, 因而间接信任评估值设定为0.7。忽略不同的环境因素, 我们设定E=1, 以此考察不同的历史行为有效的时间窗口 Δtmax对信任评估值合成的影响。

图1 表明本文的模型在时间相关性方面得到了很好的验证。历史交互的影响随着时间的流逝会缓慢减弱, 并最终消失。在历史行为有效的时间窗口 Δtmax之内, 历史交互的影响一开始虽缓慢降低, 但在接近时间窗口的最大值时则迅速降低, 并在超过时间窗口的最大值后彻底消失。之后的评估主体节点将完全依靠其他节点的推荐值合成的间接信任评估值来计算最终信任评估值。

实验的第二部分的实验是考察过往的历史经验与当前行为时间差是否会对根据实体的行为结果来更新实体的信任评估值产生时间相关性影响。由于在上述这种更新客体节点的信任值合成中, 本文的模型同样使用了遗忘因子, 故结果同图1 一致。

3.2 行为一贯性

大规模分布式网络环境中对于声誉和信任的认识等同于现实人类社会中的信任建立和维护过程, 即节点必须通过长期、连续的积极行为才能使节点的声誉和信任缓慢增加, 但是随着声誉的增加, 节点的一两次消极行为也将导致声誉发生严重的丧失。因此, 本文的信任模型也应具有类似于人类社会信任的缓慢积累以及快速毁灭的特性。

在实验中, 主要考察信任客体的行为值与信任客体行为之间的关系。在本实验中, 取遗忘因子为0.25, E为1, 同时设定时间窗口 Δtmax为4。本文为本次的实验设定了三种行为方式:

(1) 行为一贯好:本文模拟节点通过采取一直坚持积极行为来积累并提高自身的信任评估值的过程。在此行为一贯好的实验中, 本文假定节点的初始信任值为0.5, 此后每次交互行为都进行Va=1 的积极行为。

(2) 行为一贯差:行为一贯好的相反方式, 本文假定实体的初始信任值为1, 此后每次交互行为都进行Va=0.5 的消极行为。

(3) 行为震荡:本文模拟了节点战略性行为改变来进行信任震荡攻击的过程。在此过程中, 本文假定节点的初始信任值为1, 此后每次交互过程都交替进行一次实时行为值Va=1 和Va=0.4 的积极行为与消极行为。

图2 结果表明本文的模型应具有信任的缓慢积累和快速毁灭的一贯性特性。节点通过长期和连续的积极行为使节点的声誉和信任缓慢增加, 而相反的消极行为则会使节点的信任值快速降低。而对于节点战略性行为改变攻击的行为震荡, 本文的模型也能够做出正确的判断, 使得攻击者的信任评估值随着行为改变引发的震荡行为的进行总体趋于不断降低, 并最终丧失自身的信誉。

3.3 抵抗常见攻击

现阶段的网络环境中有多种针对基于声誉的信任模型的攻击方式, 如:Whitewashing、Sybil、Rep Trap、Collusionattack、DOS、Slan-dering和Self-promoting等[11,12,13,14,15]。Whitewashing攻击和Sybil攻击这两类攻击是利用身份的重塑或使用多重身份进行节点攻击。对于这两类攻击, 通过对新加入节点与现有已建立关系节点的信息进行严格比对或对节点身份进行固定化防范。Rep Trap攻击类似于实验2 中提到的震荡攻击, 而从图2 所示的结果来看, 本文模型能够有效地对其进行抵御。由于本模型是分布式的信任模型, 每个节点对自身信任模型系统都是自主管理, 因而能有效地抵御DOS攻击。

实验3 中, 本文假定主体节点A与客体节点B之间无历史交互信息, 因而完全使用间接信任来计算信任评估值。假定在推荐节点群中, 有六个可信的节点给出对节点B的推荐信息。主体节点A对这些推荐节点的信任评估值和他们分别给出的推荐信任值如表1 所示:

在推荐节点群中, 除了上述诚实的推荐节点群外, 本文假定还存在一个共谋的恶意节点群体, 该群体通过一致对节点B给出高推荐信息来误导节点A。考虑实验的一般性, 本文假定节点A对所有的恶意节点的信任评估值均为0.8, 而恶意节点群对节点B的信任评估值均为1, 其给出的推荐度也均为1。本文模拟在有上述6个诚实推荐节点的环境中, 恶意推荐节点的数量对最终得出的信任评估值的影响。

图3中CO为Josang[7]提出的平均值操作符, PO为文献[9]中提出比例操作符, WAO为文献[8]中提出的权重平均操作符, SDO为Feng在文献[1]提出的标准差操作符, RO为本文提出的推荐运算符。根据图3的结果, 我们不难看出本文提出的RO面对此类攻击能够做到有效的抵御, 存在恶意节点影响的环境中, 在五种方法中受到恶意推荐节点群的影响最小, 并在恶意节点超过一定值的时候间接信任度的增长明显趋于不变。

4 总结

多因子模型 篇4

关键词 金融危机传染;传染因子;潜伏因子模型;迭代累计平方和算法

中图分类号 F830.9 文献标识码 A

Abstract We constructed a latent factor model based on the capital asset pricing model to analyze the contagion effects of the financial crisis. We decomposed the volatility of the returns of the equity market into common factor, idiosyncratic factor and contagion factor respectively, and used an Iterative Cumulative Sum of Square algorithm to identify the crisis period endogenously. We used the data of four major emerging countries' stock markets during the 2008 global financial crisis for empirical studies. The results show that these markets have suffered from different degrees of financial contagion. The contagion effects of China and Brazil are relatively weak while India and Russia are strong.

Key words financial crisis contagion;contagion factor;latent factor model;cumulative sum of square algorithm

1 引 言

自20世纪80年代以来,金融危机频繁发生.金融危机所表现出的传染性越发强烈,一次局部性的金融事件都可能通过金融市场的耦合作用被逐级放大,最终演变为全球性的金融市场动荡,给金融市场造成了严重的破坏.所以,寻找出有效的数量分析方法来对金融危机的传染效应进行刻画,建立金融危机的预警和防范机制具有重要的理论价值和现实意义.

在金融危机传染的实证研究上,Bekaert和Harvey对不同金融市场建立双因素资产定价模型,研究欧洲、东南亚和拉丁美洲股票市场收益率相关系数,证实危机从金融贸易渠道的传染[1].Fasika等使用面板条件概率模型对37个发达和新兴市场经济体季度数据进行分析,认为贸易比其他渠道的影响更重要[2].我国学者韦艳华和齐树天采用Copula理论研究在2008年爆发的越南金融危机对周边亚洲新兴市场的风险传染效应[3].杨柳勇和周强考察了跨国金融机构在金融危机传染过程中的作用,结果表明资产证券化和国际金融市场的存在提升金融市场效率的同时也扩大了市场流动性风险,短期资产价格波动可能导致挤兑现象,引发金融市场系统性风险[4].汪素南和潘云鹤采用小波分辨方法对美国、香港及沪市的波动溢出进行了检验,发现美国股市对香港股市有显著的溢出效应,但沪市的波动则独立于两市[5].游家兴运用非对称多元GARCH模型捕捉中国与亚洲、欧美7个重要的资本市场资产价格的动态条件相关系数,从收益率传染的角度对中国经济一体化进程与金融危机传染二者之间的内在关联机制进行计量分析[6].

本文沿用目前学术界广为接受的对于金融危机传染的定义方法,将其理解为“不能被基本面所解释的资产价格运动的过度协同”,即Masson所谓的“净传染”[7].并以2008年全球金融危机为背景,选取全球主要新兴国家市场为对象进行研究,检验传染效应的存在.采用基于经典的资本资产定价模型所衍生出的潜伏因子模型构建计量模型,定量刻画金融危机传染的强度.同时,为了避免在划分金融危机起止时间上的主观性,采用基于迭代累积平方算法内生性的对金融市场的演化阶段进行了确定.

2 模 型

潜伏因子模型是由资本资产定价模型(CAPM)衍生出来的一种对金融资产收益率序列进行刻画的方法.对于个金融资产,其观测的金融资产收益率序列yi,t,在金融市场的平稳期可将其表示为

式(9)给出了通过方差贡献率来衡量金融危机传染强度的数量方法.由此可见,潜伏因子模型不仅可以提供金融危机传染的证据,还可以对金融危机传染的强度进行定量的刻画.其中,“共同因子”代表了对所有市场均起到影响的因素,可以理解为是市场之间相互依赖关系的体现,“特质因子”则代表了只对某一特定市场起作用的特质因素,“传染因子”代表了金融危机的“净传染”效应,是不能被经济基本面所解释的市场间资产价格运动的过度协同.

3 数据选择及模型设定

3.1 ICSS算法决定危机窗口

由于对金融危机传染效应的检验结果高度依赖于对金融危机持续窗口的时间划分,故对金融危机起止时间的确定尤为重要.以往的研究中,大多采用时变相关系数法检验金融危机传染效应,对危机时间窗口往往是采用定性的分析方法进行划分,带有较强的主观性和随意性,由此也导致了结论的主观性.本文采用迭代累计平方和算法(ICSS)监测资产收益率方差的突变点,从而内生性地对金融危机起止阶段进行划分.假定在市场的初始平稳阶段收益率序列具有固定方差,当市场遭受外部冲击后收益率序列方差将出现突变点然后恢复稳定一直到出现下一个突变点,ICSS算法能够有效地识别这些突变点,从而可将金融市场的演化阶段进行划分.

nlc202309051120

以上对于方差贡献率的结算结果不仅可以证明金融危机传染现象是否存在,同时还可以衡量金融危机的传染强度.在检验模型的设定是否有效时,对式(12)加以不同的约束条件,并采用Hansen’s J·test方法来检验模型在当前约束条件下是否成立.令J=TQ,T为样本容量,Q为GMM估计的目标函数值的计算结果,Q=M'W-1M.其中,M为包含实证与理论矩阵差的向量,W是最优加权矩阵.J统计量服从自由度为的渐进卡方分布.若J的值在5%的显著水平上小于临界值,则原假设“该模型在当前约束下是有效的”将被接受.

对于传染因子的显著性检验,本文采取自由度为4的LR显著性检验方法检验原假设δ1,j=0是否成立,实际上这等于检验方差协方差矩阵是否发生了改变.

4 实证结果

实证研究中以股票市场作为研究对象,检验2008年次贷危机中传染效应的存在.所选择的国家包括美国,以及巴西、印度、中国和俄罗斯4个新兴市场国家.样本空间为2004年1月2日至2010年12月31日.

4.1 金融危机起止时间计算结果

采用前文所述的迭代累计平方和算法(ICSS)确定金融危机的起止时间,结果如表1所示.

表1是用数量方法得出的金融危机演化阶段时间点,结果和美国经济研究局(NBER)以及世界银行对本次危机时间节点的划分基本吻合,故将金融危机发生期定义为2007年7月19日至2009年5月1日.

4.2 施加约束条件下模型有效性检验

式(16)所代表的传染模型需要15个参数和15个矩条件进行识别.且该模型设定存在一个能够对所有市场起到影响作用的共同因子wt,wt在所有时间段里均被包括且具有时变性.为了检验这一设定是否正确,用Hall所提出的结构变点检测方法假设检验,结果如表2所示.根据表2的结果,接受原假设,即存在这样的共同因子.同时,表2的结果也指明虽然存在着在金融市场平稳期和危机期均起影响作用的共同因子,但共同因子的载荷参数却发生了变化.

由表3可知,对于施加约束(i),检验结果拒绝了原假设.对于施加约束(ii),检验结果表明无法拒绝原假设.由此可以得出,当美国爆发金融危机后,新兴国家市场间的依赖关系没有明显的变化.

当施加约束(iii)时,检验结果拒绝这一原假设,表明金融危机期间传染效应是真实存在的.

4.3 方差分解结果

表4所示为基于潜伏因子模型的无条件方差分解结果,可以看出对于新兴国家市场,在金融危机期间“共同因子”解释的比例很小,只有巴西市场比较高,其他新兴市场均主要由“特质因子”所主导.巴西市场和中国市场中“传染因子”贡献率较低,分别为25%和31%,而印度和俄罗斯市场中“传染因子”贡献率较高,分别达到55%和74%.此结果表明,在新兴国家市场中,俄罗斯和印度遭受的金融危机传染效应最强,而中国和巴西市场遭受的冲击较小,这可能和巴西以及中国市场的资本开发程度相对较低有关.

5 结 论

2008年美国爆发的金融危机起源于美国房地产市场的泡沫破灭,进而导致美国资本市场的崩盘,并影响到全球的金融市场,最终导致成为一场系统性的全球金融危机.本文采用基于潜伏因子模型的分析手段对这次金融危机期间全球主要新兴国家市场的传染效应进行了检验,结果不仅证明了传染现象的存在,也给出了传染强度的定量衡量.目前,学术界对于金融危机传染效应的检验更多是采用基于相关系数或是时变相关系数等方法,相比较而言,本文所采用的方法现实经济意义更明显,是对现有的方法一种很好的补充.

参考文献

[1] K BEKAERT, M HARVEY. Contagion as a wealth effect of financial intermediaries[J]. Journal of Finance, 2014, 31(56): 33-55.

[2] K FASIKA. Export competition and contagious currency crises[J]. Journal of Monetary Economics, 2011, 31(50): 20-31.

[3] 韦艳华, 齐树天. 亚洲新兴市场金融危机传染问题研究——基于Copula理论的检验方法[J]. 国际金融研究, 2009, 30(9): 1- 9.

[4] 杨柳勇, 周强. 资产证券化与金融危机的国际传染——一个理论模型及经验检验[J]. 国际金融研究, 2012, 33(12): 22-29.

[5] 汪素南, 潘云鹤. 美国股市与中国股市间溢出效应的实证研究[J]. 浙江大学学报, 2012, 23(2): 81-86.

[6] 游家兴. 经济一体化进程会放大金融危机传染效应吗?——以中国为样本[J]. 国际金融研究, 2011, 32(3): 3-10.

[7] P MASSON. Informationbased contagion and the implications for financial fragility[J]. European Economic Review, 2013, 21(7): 15-22.

[8] A SANS. Testing for changes in the unconditional variance of financial time series[J]. Journal of Econometrica, 2004, 41(3): 558-597.

[9] C INCLAN, G C TIAO. Use of cumulative sums of squares for retrospective detection of changes of variance[J].Journal of the American Statistical Association, 1994, 89 (427): 913-923.

基于因子模型的我国金融风险研究 篇5

美国次贷危机以后,我国的金融形势更加复杂。为了对我国的金融风险状况有一个客观准确的把握,需要对金融风险进行系统分析。我国现行的一些金融风险等级评定法都属于综合评分法,其显著特点是计算简便,易于理解和操作,但评价标准的确定具有很强的主观性。因此评价结果的准确性和客观性有时难以令人信服。本文试图运用因子分析方法对我国的金融风险进行分析,以把握金融风险的发展态势,找出影响金融风险的因素,制定防范和化解金融风险的有效措施。

二、我国金融风险指标体系的构建

金融风险可以划分为宏观、中观、微观三个层次,本文所指的金融风险是宏观层次上的,即引发整个金融系统出现严重动荡不稳的可能。根据中国现有的经营领域与范围,中国的金融风险可以分为:

(一)商业银行风险

是由银行呆坏账逐渐累积而引起的,表现为随着坏账率的不断上升,银行业陷入支付危机的可能性越来越大。由于引发这种风险的根本原因在于银行制度本身的缺陷,因此呆坏账率的上升并不只限于少数银行,而是绝大多数银行都如此。由此可见,只要这种风险演变成金融危机,就必然意味着整个金融系统同时瘫痪,其危害程度将远远超过任何一种风险。

(二)泡沫型金融风险

其典型特征就是货币流通与商品流通的联系逐渐脱离,资本在逐利的天性下纷纷涌向股市等投机性市场,金融资产的现实价值被严重高估,与其所代表的实物基础价值之间的偏差越来越大,金融资产在虚拟的价格高位上蕴藏着金融风险。

(三)国债风险

在政府负债规模过大的情况下,只要经济中出现一些意想不到的重大事件,政府就有可能无力偿还债务。其风险的大小取决于国债规模和国债投资效益。

(四)外资冲击型金融风险

是指外国投机资本对本国货币和金融市场进行攻击的可能性,只有在资本流动比较自由的情况下才有可能发生。

在认识金融风险产生根源、基本类型的基础上,本文共选取了中国自1999年~2009年5个方面,16个监测指标,包括宏观经济环境(GDP增长率、固定资产投资增长率、通货膨胀率、M2增长率、企业资产负债率)银行坏账累积型风险(不良贷款比例、国有商业银行资本充足率、国有商业银行资本收益率)泡沫型风险(股票市盈率、股票市价总值/GDP)国债风险(债务依存度、债务负担率、财政赤字/GDP)外资冲击型风险(外债/GDP、短期外债/外债总额、经常项目差额/GDP)

三、我国金融风险的因子分析的实证研究

因子分析是从研究相关矩阵内部的依赖关系出发,把一些具有相关性的变量归结为少数几个综合因子的一种多变量统计分析方法。在对原始数据进行标准化变换后,利用因子分析模型对我国金融风险进行定量分析。按照累计方差贡献率大于85%的原则,选取了4个因子,其累计方差贡献率为89.921%。四个因子的解释能力占所有变量总方差分别为36.021%、24.901%、15.614%、13.385%。为了使因子能更好地解释变量,需要进一步进行因子旋转,本文采用方差最大化旋转方法,因子载荷值越高,表明该因子包含该指标的信息量越多。

从旋转后的因子载荷矩阵可以看出,因子载荷矩阵呈现出0和1两极分化,四个因子已经有了明显的实际意义:

(一)公共因子F1

在经常项目差额/GDP、短期外债/外债总额、外债/GDP上的载荷值较大,可命名为外汇冲击型风险,它对整个国家的金融风险状况影响最大,有着36.021%的方差贡献率。可见,随着经济全球化及我国对外经济开放程度的不断增加,对外贸易顺差持续增长,我国外汇储备不断增加,导致我国的对外经济风险不断上升。

(二)公共因子F2

在通货膨胀率、M2增长率、资本充足率、债务负担率上的载荷较大,可命名为国内金融体系风险,它对整个国家的金融风险状况影响居次,但仍然是中国现阶段面临的主要金融风险。

(三)公共因子F3

在固定资产投资增长率、企业资产负债率上的载荷值较大,可命名为投资增长性风险。固定资产投资增长加速,企业资产负债率的提高明显导致金融机构基建贷款等中长期贷款增大,货币信贷总量过快增长,加大了通货膨胀压力,增大了潜在金融风险。

(四)公共因子F4

股票市盈率和股票市价总值/GDP上的载荷较大,可命名为股市泡沫风险。我国资本市场的市盈率明显过高,从发展趋势看,由于中国股市规模仍属于扩张型,所以应警惕股市泡沫成分的过快增加。

四、我国金融风险的防范

随着全球经济金融的发展,金融危机时有发生。为了防范和规避金融风险,为我国经济、金融体系的运行创造一个良好的环境,我们应注意以下几个问题:

(一)控制对外经济风险

加强对隐性外债的监控,优化外资结构,坚持以直接投资为主、间接融资为辅的利用外资方式。

(二)加强国内金融风险的监测和预警,逐步建立起金融风险的综合防范体系

在央行等金融监管部门、金融企业之间建立起一套沟通联系制度,并制定和实施风险防范相应的对策,要进一步转换政府职能,建立全社会共同防范金融风险的大体系。

(三)健全证券市场制度化建设,积极、规范而稳妥地发展资本市场

中国的股票市场长期以来存在着制度性缺陷致使资本市场行为扭曲,减弱了证券市场资源的内在配置能力。

(四)稳步提高直接融资的比重

加快发展和不断深化资本市场,拓宽企业的融资渠道,尽快建立完整的资本市场运行规则,扩大资本市场流通规模,增加上市品种和数量。

参考文献

[1]黄赛男, 曾松林基于因子分析的中国金融风险研究[J]中南财经政法大学研究生学报2007年第06期

[2]陈守东, 杨莹, 马辉中国金融风险预警研究[J]数量经济技术经济研究2006年07期

[3]段敏芳基于因子分析的我国金融风险研究[J]中南民族大学学报2005年第03期

[4]宋清华, 李志辉金融风险管理[M]中国金融出版社2005

熔断器老化状态多因子检测系统 篇6

由于熔断器使用数量巨大,不易通过全部检测来判断是否老化;而且,一旦发生熔断,很难鉴定是由于电路异常引发的正常熔断还是熔断器老化引起的误动作。这种现象对于某些重要电路或负载,存在重大安全隐患。

现有对熔断器进行测试的手段主要有熔断器电阻测量、熔断器温度测量、熔断性能测试以及X-RAY检测技术,这些检测的主要目的是生产厂家对新熔断器产品进行性能测试与筛选。在熔断器老化状态检测技术方面的研究相对落后,无法及时察觉熔断器的老化状态,导致大量老化的熔断器继续使用的情况。因此,如何及时地检测出熔断器的老化状态是亟待解决的问题。

鉴于此,本文提出了一种熔断器老化状态多因子检测系统,该系统包括红外测温系统[2]、接触式测温系统、高精度电阻测量系统、X-RAY检查系统以及SEM检查系统[3,4]。通过红外测温以及接触式测温,可得到熔断器的“电流-温度”曲线、“电流-温升速度”曲线以及熔断电流特性曲线;通过高精度电阻测量系统,可得到熔断器阻值变化量;结合X-RAY检查、解体SEM检查的结果,能够综合地判定熔断器的老化状态。

1 检测系统

1.1 硬件构成

图1为本文提出的熔断器多因子状态检测系统原理框图,主要包括如下几部分。

(1)可调恒流源

可调恒流源与待测熔断器相串联,其量程与精度能够调整,用于为不同容量等级的待测熔断器提供需要的模拟电流。根据不同试验要求,电流输出信号可调波形有:阶跃、正弦(工频)、脉冲及其他特定波形;调控方式为微机控制。

(2)可调恒温箱

可调恒温箱用于模拟待测熔断器现场运行工况,其内部设有用于将待测熔断器安装在其中的测试板。

(3)温度采集装置

温度采集装置包括与待测熔断器相接触用于测量熔断器上多点温度的小型、高精度热电偶以及与热电偶输出端相连接的多通道采集卡。

(4)红外检测装置[2]

红外测温装置通过红外热成像技术直观地检测熔断器上的温度分布,精确定位热点,并将测量数据实时传递给微机处理。

(5)外观检测

外观检测装置通过判断熔断器的形状与尺寸是否发生变化,初步判断熔断器是否出现老化迹象。

(6)电阻测量

通过高精度万用表定期或实时测量待测熔断器在恒温箱内的电阻数据,并将测量数据实时传递给微机处理。

(7)PC机

PC机根据多通道采集卡的温度数据以及红外检测结果可得到熔断器的“电流-温度”曲线、“电流-温升速度”曲线以及熔断电流特性曲线,同时结合电阻测量仪得到的电阻数据对熔断器是否老化进行判断。

PC机可分别与可调恒流源及可调恒温箱进行数据传递,在测量过程中,PC机对测得的数据进行处理,并以图表方式显示。

另外,PC机设置有人机交互界面,在根据不同熔断器及不同现场工况进行相应的设定后,系统对待测熔断器状态进行自动检测。

(8)X-RAY、SEM检测

通过X-RAY检测系统可以对熔断器进行透视检测;通过SEM检测可以对经过开封处理的熔断器进行微观检测,这两种检测手段可用于进一步评估熔断器当前的老化状态。

1.2 软件系统

图2为该系统的软件构成,主要包括三大部分:

(1)输入输出界面

人机交互的系统界面直观友好,操作简单,智能化,通过人机交互界面可对待检测的熔断器的参数特征进行设定。

(2)自动控制

根据系统界面接收到的控制信号,能够根据需要任意调制恒流源电流输出波形,包括阶跃、正弦、脉冲及其他特定波形等;能够控制恒温箱温度,模拟熔断器现场运行工况;能够控制多通道温度采集卡和红外检测装置实时、连续、断续或特定时刻自动采集数据;能够定期对熔断器的外观、电阻进行自动测量;所有的检测过程以及检测结果的记录都能够实现自动化控制。

(3)数据处理

对自动采集的检测结果进行处理,形成特性曲线、表格、图片或视频,并形成数据库,能够实现存储、查询与调用功能;综合X-RAY检测(能够对熔断器进行无损检测,检测熔断器的熔丝或焊点是否存在缺陷)以及SEM检测(对确认存在缺陷的熔丝进行开封处理以及微观检测,从微观的角度对缺陷进行观察与分析,有利于找出缺陷产生的原因)的结果对熔断器的老化状态进行综合评估。

(4)数据库

包括自动采集的数据以及处理后的数据,并以表格、曲线、图片或视频等方式存储。

2 检测实例

本节将以某种型号的2A熔断器为例进行试验,验证上述方法能否有效地检测出老化样品。取3只样品进行试验,1只新样品,2只已经使用过尚未熔断的样品,在试验环境温度为22℃的条件下进行试验。试验电流从0.2倍额定电流开始逐步递增至额定电流,间隔时间为10 min,该系统测试结果见表1(熔断器的表面温度)、表2(在线实时电阻值);同时根据检测结果输出“电流-温度”特性曲线及“电流-电阻”特性曲线,分别见图3、图4。最后对三个试验样品作SEM微观分析验证,结果如图5所示。

试验结果表明:(1)熔断器的表面温度和电阻值均随试验电流的增大而升高;(2)老化的样品温升以及电阻增大的趋势更为明显,且出现了未达到额定电流即熔断的现象。

这说明温度和电阻是熔断器的老化敏感参数,通过电流—温升特性以及电流—电阻特性能够正确地检测出熔断器的老化状态。

通过SEM检测结果可发现老化的样品已经出现了局部熔球状凸起、凹陷、以及经历高温后冷却产生的凝固态毛刺等缺陷。

熔断器的温度(熔体温度、表面温度)和电阻是熔断器的老化敏感参数,通过电流-温升特性以及电流-电阻特性能够正确地检测出熔断器的老化状态。

提出了一种熔断器老化状态多因子检测系统,能够通过多种测量手段实现熔断器的多因子老化状态检测;能够结合X-RAY、SEM等检测手段对熔断器的老化状态进行综合评估,能够保证检测结果的准确可靠。

该检测系统可以对采购、库存以及在役的熔断器进行检测,有效地增强熔断器使用的安全性。

该系统还可以与PC机结合,实现多因子状态检测过程的自动化控制,包括检测手段自动化控制与检测结果的自动化采集与自动化处理。

参考文献

[1]NUREG-1760,Aging Assessment of Safety-Related Fuses Used in Low-and Medium-Voltage Applications in Nuclear Power Plants[R].2002.

[2]MERRYMAN S A,ROSE M F.A non-contact,real-time monitoring and control system for electronic circuits using infrared thermal imaging[C].In proc.4th European Conf. Power Electron.Applicat.,EPE '91,Florence,Italy, September,1991,3:120-122.

[3]SHI Jie,YAO Jian Lin,WANG Yong Nian.Analysis on contact failure of instrument and control switch in nuclear power Plant[C].16th IEEE International Symposium on the Physical and Failure Analysis of Integrated Circuits,2009: 101-104.

多因子模型 篇7

在分子生物学领域,理解转录调控机制是后基因组时代重大挑战之一。达到这一目标的重要步骤是转录因子结合位点TFBS(Transcription Factor Binding Sites)的识别。转录因子结合位点是基因上游启动子区域长度为5~15bp的短序列片段,被转录因子结合以调控下游基因。通过生物学试验检测TFBS的方法由于开销大、耗时长等缺点,不适合处理海量数据。因此,越来越多的计算识别方法被提出用于初选待测位点。通常一个转录因子结合位点可以被一个或多个转录因子结合,而相关研究表明这种结合具有较高的特异性。因此,在计算分子生物学领域,TFBS的识别问题可视为一个多类别模式分类问题,即给定一个未知样本,判定它可能被那一类或哪几类转录因子结合。

目前,基于核方法和正则化理论的机器学习分类算法是最常用的方法之一,也是统计学习理论SLT(Statistical learning theory)的核心内容[1,2]。SVM作为经典的分类算法,基于VC维理论和结构风险最小化原理,克服了传统机器学习分类算法维数灾难、陷入局部最优解、过拟合等缺陷,对未知样本具有良好的泛化性能,因此被广泛应用于模式识别、文本分类、生物信息学、信息安全等诸多领域。

传统SVM主要用于解决二分类问题。近年来提出的多分类SVM作为原始SVM的扩展,是将多分类问题分解为多个两分类问题,忽略了类别间的联系。其中,“一对多”策略采用了一个正负类不平衡的训练集,建立的每个二分类器负样本数远大于正样本。另外,现有的多分类SVM不适用于只包含正样本集的情况,而TFBS负样本集无法构造。因此,利用现有的多分类SVM处理TFBS识别问题并不恰当,需要设计一个能直接用于多类样本集的多分类器。

基于正则化理论建立的分类器的结构风险通常由两部分控制:经验风险(训练误差)和置信界。以二分类问题为例,一个规范超平面构成的指示函数集:

h(x)=sgn[(w·x)+b] (1)

的VC维h满足:

h≤min([R2A2],n)+1 (2)

其中,sgn[·]为符号函数,n为向量空间的维数,R为覆盖样本向量的超球半径,‖w‖≤A。通过式(2)不难发现,一定程度上减小R2,能使VC维的上界h减小,从而降低学习机的复杂性,以提高预测函数的泛化能力。这正是数据域描述模型的基本思想。数据域描述是对数据集所在的类别进行描述,拒绝可能来自其他类的数据[9,10]。本文在最新的多任务学习理论基础上将数据域描述问题拓展到多类的情况,并用于解决TFBS识别问题,从整体上对来自所有类别的样本同时学习,同时捕获类别之间的联系。

SVM采用的hinge损失函数对孤立点和噪声都是较敏感的,即对离群点不具有鲁棒性。本文根据训练样本的置信度不同,在惩罚项中引入模糊成员函数以区别对待,对置信度大的样本给予充分重视,相反(很可能是噪声点)则限制其作用。

基于核方法的机器学习算法的核心问题是核函数的选择,因其很大程度上影响分类器的性能。先前基于核方法的生物实体识别算法通常采用0-1编码的多项式核,显然不适合长度不规则的生物序列。本文采用基于编辑距离的字符串核来度量TFBS之间的相似性,以更好地比较序列间的相似性。

1相关工作

在计算分子生物学领域,常见的TFBS识别方法是通过从海量基因序列中寻找超频词(over-represented N-mers)来发现特定模式。代表性的算法有MEME[27]、Gibbs sampling[28]。实验表明对于位点进化较保守的物种(如酵母、果蝇等)有很好的识别效果,而对于位点进化相对不保守的脊椎动物(如人、大鼠、小鼠等),效果通常不尽人意[29]。另一种是采用支持向量机、人工神经网络等机器学习分类算法。文献[11]提出了基于数据域描述的一类SVM (One-Class SVM:OSVM)用于高维分布区域估计。文献[12]采用OSVM用于顺势调控元件判别。该方法分别对每类数据进行建模,没有从整个数据集出发,考虑不同类转录因子之间的联系。另外,采用0-1编码的核函数不适合长度不规则的TFBS序列。文献[3]结合SVM和ECOC算法实现了转录因子的四分类问题。通过构建4个二分类SVM对各个类别的转录因子独立地进行训练和分类,然后对分类结果进行综合判别,好处是能够直接利用现有的二分类SVM,缺点是不能对整个数据集同时学习,未考虑类间联系。近年来,多任务学习已成为机器学习领域的一个研究热点。文献[16,17]中提出了一个基于统计学习和函数正则化的多任务学习理论框架,通过新的正则化因子对不同的任务同时学习,捕获类间联系。本文在此基础上建立多数据域描述模型并用于解决TFBS识别问题。

最近几年研究者相继提出了一系列核函数用于生物实体分类[21,22,23,24,25],其共同的目标是寻找一种有效的相似性度量。本文采用基于编辑距离的字符串核以更好度量TFBS序列的相似性。

2多任务学习模糊样本集

本节首先简要回顾在Hilbert空间中利用核函数和正则化进行多任务的学习方法,更多细节请参见文献[1,13,14,15,16]。然后定义多任务学习模糊样本集。

在标准的单任务学习中,给定包含n个样本的样本集X={(xi,yi):i∈ℕn}⊂X×Y,假设这些样本是独立同分布的,来自同一个X×Y上的未知概率分布P。学习的目标是获得一个有较小的期望风险E[L(y,f(x))]预测函数f。设L为预定义的损失函数,如标准二分类SVM的hinge损失函数:(1-yif(xi))+。一个常见解法是基于SLT和Tikhonov正则化,即最小化下列风险泛函:

RΤ(f)=1ninL(yi,f(xi))+γfΚ2 (3)

其中‖fΚ2对应f在Hilbert空间某一子空间HK中的范数,用来度量假设空间的复杂度。参数γ为正则化参数,用来权衡训练误差和假设空间的复杂度。可以证明,式(3) 的解可表示为:

f(x)=incik(xi,x) (4)

其中{ci}是一个实值参数集,k(·,·)是核函数,在Hilbert空间中具有再生性。

Evgeniou和Micchelli在Tikhonov正则化的基础上将单任务学习拓展到多任务的情况,提出了基于SLT和正则化的多任务学习正则化泛函[16]。假设一共有m个任务,第l个任务包含nl个样本点,输入空间Xl=ℝd,l∈ℕm。 为估计参数向量u=(ul:l∈ℕm)∈ℝmd,通过最小化下列泛函:

R(u):=1mnlminlL(yil,uxil)+γJ(u) (5)

其中,L为预定义的损失函数,γ为一参数,用于控制两个指标的权衡。J(u)是正则化因子。多任务学习的目标是从这些样本中同时学习所有m个任务的预测函数fl(x)=ulΤx。针对TFBS识别问题,本文仅讨论各任务输入空间相同的情况,即X1=X2=…=Xm。在后续工作中,我们将讨论输入空间不一致的情况。下面引入Zadeh提出模糊子集的概念[17,18],定义多任务学习模糊样本集。

定义1 模糊子集 设X是一个论域,给出映射μ:X→[0,1],xμA(x)则μ确定X的一个模糊子集A˜μ(x)称为XA˜的隶属度。全体X的模糊子集组成的集合记为F (X),称为X的模糊幂集。

定义2 多任务学习模糊样本集 假设共有m个任务(或m个类),第l个任务包含nl个样本,用AlF(X)表示。为第l个任务的每个样本点xil赋予一个隶属度,记为sil。这样,第l个任务的模糊样本集可表示为Al={(x1l,s1l),,(xnll,snll)}d×[0,1],其中sil[0,1]。若规定sil{0,1},则不允许样本带有不确定信息。

需要指出引入模糊样本的主要目的是利用样本点的先验不确定信息增强损失函数对离群点的鲁棒性,原则上并不违背统计学习理论。

3基于多数据域描述的TFBS识别

本节讨论在多任务学习理论的基础上建立一个多数据域描述模型MDMH(Multiple Data Domain Description by Multiple Hyperspheres),并结合核方法用于转录因子结合位点识别问题。

3.1多数据域描述模型

借助定义2,引入被赋予隶属度的模糊样本集。对于一个m类数据域描述问题,试图用m个超球覆盖来自m类的训练数据,每个超球包含来自训练数据的一类子集。训练的目标是同时寻找所有m个超球面的球心c和半径R,并且最小化R。一种常见的做法是分别对每类样本数据分别建立相应的数据域描述[20],缺点是没有从样本集整体上考虑,忽略了类间联系,不能充分地利用样本集。为此,本文建立的多数据域描述对所有类别的样本同时学习并获得所有类的域描述,这样既能充分利用所有类别的已知样本,同时又一定程度上考虑了类别之间的联系。

定义3 多数据域描述模型 假设有m类数据样本,第l类包含nl个样本点,样本总数记为n=lmnl。第l类模糊样本集记为Al={(x1l,s1l),,(xnll,snll)},其中sil[0,1]。假设这些样本独立同分布,来自Xl×Yl上的一个联合概率分布P。则MDMH 模型表示为:

fl=g(x|Rl,cl) (6)

其中,g(·)是模型,定义一个超球假设类。覆盖第l类(l∈ℕm)样本的超球可用一般距离空间中的一个闭球描述,即BRl(xcl)={xXl:d(x,cl)≤Rl}。其中x是输入,Rlcl是第l类的参数,示例了假设类中的一个假设。下面的定义给出求解MDMH模型的最优化问题。

定义4 MDMH优化问题 假设有m类数据样本,所有样本点构成的全体记作X=lmXl,代表原始输入对象的全空间。设H为Hilbert空间,(·,·)是其上的内积。‖·‖为Hilbert空间H的一个范数,xΗx=(x,x)。通过适当的特征映射φ:XlH,将原始空间中的样本点映射到Hilbert空间H。这样,MDMH模型的优化过程定义为求解下列具有不等式约束的优化问题:

min1ml∈ℕmR2l+1nvl∈ℕmi∈ℕnlsilξil

s.t. ‖ϕ(xil)-cl‖2≤R2l+ξil

ξil≥0 Rl≥0 (7)

其中Rl、cl分别为第l个超球的半径和球心,ξil为松弛变量,v为惩罚因子, 其作用为平衡超球面的大小和落于超球外异常点的数量。显然,这是一个具有不等式约束的非线性规划问题,其目标函数和不等式约束条件都是二次的。下面的定理给出原始最优化问题式(7)的对偶问题,将非线性不等式约束转化为线性等式约束,将原问题转化为一个二次凸规划问题求解。

定理1 MDMH的原始最优化问题式(7)的对偶问题是求解下列二次规划问题:

max{lminlαilϕ(xil)2-mlminljnlαilαjl(ϕ(xil),ϕ(xjl))}s.t.inlαil=1m0αilsilnv(inl,lm)(8)

显然,式(7)的最优解应满库恩-塔克必要条件,即:

αil(R2l+ξil-‖ϕ(xil)-cl‖2)=0

βilξil=0 αil≥0 βil≥0 (9)

证明 首先引入式(7)的Lagrange函数:

L(Rl,cl,ξ;α,β)=1mlmRl2+1nvlminlsilξil-lminlαil(Rl2+ξil-ϕ(xil)-cl2)-lminlβilξil(10)

其中α=(α11,…,αil,…,αnmm)T,β=(β11,…,βil,…,βnmm)TLagrange乘子。根据Wolfe对偶的定义,分别求Lagrange函数式(10)关于Rl,cl,ξil的极小点。由极值条件得:

LRl=2

mRl-2Rli∈ℕnαil=0

Lcl=∑i∈ℕnlαil(ϕ(xil)-cl)=0

Lξil=sil

nv-αil-βil=0 (11)

inlαil=1m (12)

cl=minlαilϕ(xil) (13)

βil=silnv-αil (14)

将式(12-14)代入Lagrange函数式(10),得证。

第l个超球的半径Rl可通过位于其球面上的样本点(记yl)求解,满足:

Rl2=‖ϕ(yl)-cl‖2(l∈ℕm) (15)

下面说明如何寻找位于超球面上的点。

定理2 设式(8)是MDMH原始优化问题(7)的对偶问题,定义xsurf(l)={xil:0<αil<silnv;xilXl,inj},则对任意x∈xsurf(l)是位于第l个超球面上的点,成立Rl2=‖ϕ(xil-cl‖2。

证明 当0<αil<silnv时,有βil=silnv-αil>0。由库恩—塔克必要条件式(9)的αil(Rl2+ξil-‖ϕ(xil)-cl‖2)=0知:Rl2+ξil-‖ϕ(xil)-cl‖2=0。再由βilξil=0和βil>0,得ξil=0,从而Rl2=‖ϕ(xil)-cl‖2。

设yl为满足定理2的位于第l个超球面上的任意一点,l∈ℕm,将式(13)代入式(15),得到:

Rl2=ϕ(yl)2-2minlαil(ϕ(yl),φ(xil))+m2inljnlαilαjl(ϕ(xil),ϕ(xjl))(16)

对于测试数据x,MDMH的第l类判别式为:

fl=Rl2-ϕ(x)-cl2Rl2=1-ϕ(x)-cl2Rl2(17)

其中,

ϕ(x)-cl2=ϕ(x)2-2minlαil(ϕ(x),ϕ(xil))+m2inljnlαilαjl(ϕ(xil),ϕ(xjl))(18)

通过引入核函数k(x,y)=(ϕ(x),ϕ(y)),MDMH的最优化问题式(8)变为:

maxl∈ℕmi∈ℕnlαilk(xil,xil)-ml∈ℕmi∈ℕnlj∈ℕnlαilαjlk(xil,xjl)

s.t. ∑i∈ℕnlαil=1m 0≤αilsilnv(i∈ℕnl,l∈ℕm) (19)

对于测试数据x,MDMH的第l类判别式(17)变为:

fl=Rl2-ϕ(x)-cl2Rl2=1-ϕ(x)-cl2Rl2=1-k(x,x)-2minlαilk(x,xil)+m2inljnlαilαjlk(xil,xjl)k(yl,yl)-2minlαilk(yl,xil)+m2inljnlαilαjlk(xil,xjl)(20)

对于多分类问题,最常见的情形是判别测试样本x最可能所属的类别,通过求:

f(x)=argmaxlfl(x;Rl,cl) (21)

另一种情形是预先设定一个阈值λ,大于这个阈值的判别为样本所属的类,可通过求下面的截集得到:

fλ={l: fl(x)>λ,l∈ℕm} (22)

还有一种情形是希望将测试样本x判为最有可能的N(N∈ℕm)个类别。记fmin=inflm{fl}fmax=suplm{fl},则x所属的N个类别为:

fN={l:#{fl(x)≥μ}=N,∃μ∈[fmin,fmax],l∈ℕm} (23)

3.2基于多数据域描述的TFBS识别

如前所述,TFBS的识别问题可看作是一个多分类问题。根据定义,TFBS在计算机中可表示为由字母表Σ={A,G,C,T}构成的一定长度的字符串。设x,y分别为两个待比较的TFBS序列片段,记x=x1x2…xm,y=y1y2…yn(xi,yiΣ),长度分别为|x|=m,|y|=n,(m,n∈ℕ+)。令ε代表空串,由Σ组成的所有字符串的全体记为:X={ε}n=1Σn,构成TFBS序列的输入空间。

定义如下基于编辑距离的字符串核作为学习机的核函数:

k(x,y)=exp{-β·Edit(x,y)} (24)

其中Edit(x,y)代表xy的编辑距离。β为一参数,为避免Gram矩阵强对角占优,需根据具体的应用选取β值,本文实验中取β=0.2。显然,xy越相似,k(x,y)的值越大。

通过以上输入空间和核函数的定义,利用式(19)对数据库中的TFBS样本进行学习获得多数据域描述,根据式(21-23)对测试样本进行分类。下面在真实数据集上验证方法的有效性。

4实验方法与结果讨论

4.1实验数据

本文从最新的TRANSFAC数据库(Release 9.4)[26]中取出50组脊椎动物转录因子结合位点作为样本集,均为权威机构通过生物学实验验证获得的真实数据。选取的原则是尽可能使位点的长度和每组位点数分布均匀,忽略长度在5~15bp以外的位点(很可能是噪声)。该数据集的一般性描述统计如表1所示。

4.2实验结果

本实验的具体环境为一台运行Windows XPPC机,具有Pentium Centrino Duo 1.83G 双核CPU和2G内存。所有代码用MATLAB实现。

实验分5组进行,第1组的训练样本来自前10类,记为M-10;第2组来自前20类(M-20);第3组前30类(M-30);第4组则包含所有50个类的样本(M-50)。以上第1~4组实验的测试样本均来自前10个类。 第5组实验的训练样本和测试样本均来自前10个类,采用One-class SVM(即模型中取m=1的情况,不考虑类间联系),并同前4组实验进行比较。我们采用交叉验证来测试算法的性能:每次取第l(l∈ℕm)类的一个样本作为测试样本,剩余的nl-1个样本和其他m-1类的所有样本作为训练样本,反复进行直到所有类别的样本测试完毕。算法的性能度量采用生物信息学中常用的三个指标:敏感性(Sensitivity)、特异性(Specificity)和F-measure,其中F-measure通过下式计算:

F-measure=2×Sensitivity×SpecificitySensitivity+Specificity (25)

以上5组实验独立进行,对每组实验分别得出上述3个性能指标。表2给出了5组实验的性能指标均值。

实验结果表明,MDMH模型能有效地应用于TFBS识别问题。当样本包含的类别数较少时(如:m=10),基于MDMHTFBS识别方法性能略低于One-class SVM方法。但随着训练集包含的类别数的增加,MDMH方法的预测准确率有不断提高的趋势,当m=50时,预测准确率达到88%,明显高于One-class SVM。这表明当训练集包含足够多类别的样本时,MDMH能充分利用来自所有类别的训练样本,有效地捕获多类别间的联系,提高预测准确率。

5结语

本文建立了一个基于多任务学习理论的多数据域描述模型:MDMH,并在此基础上设计了一个转录因子结合位点识别算法,从整体上对所有类别的样本同时学习,充分地利用了数量有限的已知样本,同时考虑了类别间的联系。针对生物序列的特点,采用基于编辑距离的字符串核来度量TFBS之间的相似性。实验获得了较高的预测准确率。

在后续工作中,我们将对多任务学习理论进行完善,考虑不同任务可能对应异构输入空间的情形。另外,本文假设数据样本是独立同分布的,对解决一些实际问题有局限性,因此需要考虑如何解除这个限制条件。其次,我们将从计算学习理论的角度出发,给出一般多数据域描述模型泛化错误的界。对于不同种类的多任务联系,考虑如何定义多任务核函数和改进正则化因子以更好地捕获类间联系。再者,需要从计算代价上降低多任务学习求解过程的复杂度或设计并行算法以适应大数据量或实时系统。最后,针对TFBS识别问题,我们将引入更多有效的生物学先验知识以提高预测效果,设计增量学习算法以适应生物数据库快速增长的需求。

多因子模型 篇8

机体执行免疫应答、发挥免疫功能都与免疫系统息息相关,免疫系统是防止外来病原体入侵人体最坚实的的保障,是由免疫器官(Immuneorgan)、免疫组织(Im⁃mune tissue)、免疫细胞(Immune cell)和免疫分子(Im⁃mune molecule)组成的复杂系统[1⁃2]。机体执行免疫应答时,在细胞的生长、活化、分裂以及细胞与细胞之间的相互作用等方面,细胞因子起着很大作用。细胞因子与细胞因子之间,经过合成与分泌的互相调控、基因表达的互相调节、生物学效应的互相作用、受体表达水平的相互调节等构成了一个特别复杂的免疫细胞因子网络[3⁃4](Immune Cytokine Network)。

当前,免疫细胞因子网络是生物学上比较热门的一个研究方向,然而与此同时也存在很多难题[5]。虽然已经有很多人研究过免疫细胞因子网络,并且也获得了很多研究成果,但还有许多问题没有解决。首先,人们仅仅对单个的细胞因子进行过研究,但是细胞因子之间是相互影响相互调节的,所以研究整个免疫细胞因子网络的免疫过程显得尤为重要;其次,在以前的研究中,主要采取手工实验的方法,其最大的缺点是无法研究复杂的现象——难以测定大量免疫细胞及其细胞因子的自身特性和它们之间的相互作用规律,所以依靠手工实验的方法很难研究这种繁杂的免疫细胞因子网络;最后,因为细胞因子有很多类别以及现代科技的限制,目前还没有完善的免疫细胞因子网络模型。

本文提出了CKSIM模型,并采用Net Logo模拟、仿真的方式来研究免疫细胞因子网络。在进行仿真时,不但能够看到仿真结果,而且能够看到系统运行过程,也能按照时间对仿真系统实施调节与控制,整个运行全部可视化,以便可以通过计算机来研究免疫细胞因子网络的整体机制。

1 CKSIM模型

1.1 细胞因子相关研究

免疫细胞(如巨噬细胞、T细胞、B细胞、成纤维细胞等)、细胞因子是免疫细胞因子网络的重要组成成分。细胞因子是免疫细胞和某些非免疫细胞在抗原的刺激下分泌的小分子多肽或者蛋白质[6⁃7]。细胞因子通过结合相应受体,在免疫细胞生长、分裂和效应,调控免疫应答等方面起着至关重要的作用。细胞因子有多种名称:淋巴因子、集落刺激因子、干扰素等[8],它们在细胞之间传递信息,调节细胞的生理过程,刺激细胞使其活化、分裂等。

1.2 CKSIM模型设计

针对免疫细胞因子网络的研究,目前主要有以下两种模型:IMMSIM模型和基于Multi⁃Agent的免疫模型[9 ⁃10]。IMMSIM模型仅仅模拟了免疫应答功能,基于Multi⁃Agent的免疫模型不能在时间上对其进行调节与控制,为了克服上述模型的缺点,本文提出了CKSIM模型。设计CKSIM模型的目的是为了在计算机上对免疫细胞因子网络进行模拟、仿真,主要模拟免疫细胞因子网络中免疫细胞、抗原、抗体、细胞因子之间的相互作用关系。CKSIM模型的具体设计如下:

(1)基本特征

每一个事件的发生都具有一定的可能性,在Net Lo⁃go仿真系统中可以用随机数的方式来实现。

用图像表示个体,同一类的个体用相同的图像表示,不同类的个体用不同的图像表示。并且它们能够由一个地方向自己附近的上下左右四个地方移动。

网格的每一个地方也能够有其他个体,并且个体的附近集合是位于自己这个地方的别的个体。

(2)模型构成

①网格

模型使用的网格是由方格构成的平面,方格每个位置有四个邻居,分别为上下左右,如图1 所示。

② 个体定义

个体包括免疫细胞、抗原、抗体以及细胞因子。由于免疫细胞和细胞因子种类繁多且作用十分复杂,所以本文只考虑比较常见的免疫细胞和它们分泌的细胞因子。其中免疫细胞包括七种,分别为:T细胞、B细胞、白细胞WC、自然杀伤细胞NK、肥大细胞MC、巨噬细胞MG、成纤维细胞FC。细胞因子包括九种,分别为:IL⁃1,IL⁃2,IL⁃4,IL⁃6,IFN⁃α,IFN⁃β,IFN⁃γ,TNF⁃R1,M⁃CSF。另外还有抗原Ag和抗体Ab。个体之间的关系见图2。

(3)状态及动作定义

状态定义:该模型为免疫细胞规定了相应的状态,分别是活化状态和非活化状态。当免疫细胞受到抗原的刺激时,将会转化为活化状态;否则为非活化状态。免疫细胞在活化与非活化状态之间根据模型定义相互转换,免疫细胞的状态转化如图3 所示。

动作定义:以下的定义都是按照生物学上的免疫机理来定义的。

① 免疫细胞具有活化的特性,并且还能够生长、分裂和死亡

当免疫细胞受到抗原的刺激时,便会转化为活化状态;在每个时间步中,当免疫细胞的尺寸小于模型规定的最大尺寸(该模型规定的免疫细胞最大尺寸是15)时,免疫细胞的尺寸将会加1,这是模拟免疫细胞的生长过程;当免疫细胞的尺寸大于等于模型规定的最大尺寸时,免疫细胞将会分裂,这是模拟免疫细胞的分裂过程;当免疫细胞的年龄达到模型规定的最大寿命时,免疫细胞将会死亡,这是模拟免疫细胞的死亡过程。

② 当抗原遇到免疫细胞时,可以刺激免疫细胞,使其活化并分泌相应的细胞因子

各种免疫细胞分泌的细胞因子为:T细胞分泌IL⁃2,IL⁃4,IL⁃6,IFN⁃γ;B细胞分泌IL⁃1,IL⁃2,IL⁃6,IFN⁃α,抗体;白细胞分泌IFN⁃α;自然杀伤细胞分泌IL⁃1,IL⁃2,IFN⁃γ;肥大细胞分泌IL⁃4;巨噬细胞分泌IL⁃1,IL⁃2,IL⁃6,IFN⁃α,TNF⁃R1;成纤维细胞分泌IL⁃1,IL⁃6,IFN⁃α,IFN⁃β,M⁃CSF。

③ 抗体可以杀死抗原

④ 细胞因子可以向免疫细胞发挥相应的效应

各种细胞因子的主要功能为:IL⁃1 可以活化T细胞,促进B细胞的生长;IL⁃2 可以促进T细胞、B细胞的生长,活化巨噬细胞;IL⁃4 可以促进T细胞、B细胞、肥大细胞的生长,活化巨噬细胞;IL⁃6 可以促进B细胞的生长;IFN⁃α可以抑制抗原的复制,活化自然杀伤细胞、巨噬细胞;IFN⁃β可以抑制抗原的复制;IFN⁃γ可以活化T细胞、B细胞、巨噬细胞、自然杀伤细胞;TNF⁃R1 可以抑制抗原复制;M⁃CSF可以活化巨噬细胞。细胞因子的分泌源、作用目标和主要功能如表1 所示。

⑤ 个体移动

免疫细胞、抗原、抗体以及细胞因子,这些所有的个体均可以移动,因为这些个体在人体内是不断移动的。

(4)个体之间的相互作用

免疫细胞与免疫细胞之间通过它们分泌的细胞因子而相互作用,免疫细胞分泌的细胞因子,不仅会作用于其临近的免疫细胞,而且会作用于自己本身,这样免疫细胞与免疫细胞之间通过它们分泌的细胞因子而相互联系起来,最终构成一个免疫细胞因子网络调控图,如图4 所示。

2 Net Logo仿真

Net Logo是一个用于模拟自然以及社会现象的编程语言和建模平台,特别适合对随时间演化的复杂系统进行建模,所以本文使用Net Logo对CKSIM模型进行可视化仿真,仿真系统的设计主要分为两个部分:前台界面的设计和后台程序的设计。

2.1 前台界面设计

在CKSIM模型中,个体包括七种免疫细胞、抗原、抗体以及九种细胞因子,在Net Logo中,将其定义为不同的种类,并采用表2 的图案分别表示不同的种类。

主体图案设计完成后,还需要添加一些参数来控制主体的性质,这些参数在系统运行之前设定。在Net Lo⁃go中,可以在界面上添加输入框和滑动条来设定参数,在本文的仿真系统设计中,输入框包括抗原数量(Ag⁃count)、T细胞数量(T⁃count)、B细胞数量(B⁃count)、白细胞数量(WC⁃count)、自然杀伤细胞数量(NK⁃count)、肥大细胞数量(MC⁃count)、巨噬细胞数量(MG⁃count)、成纤维细胞数量(FC⁃count);滑动条包括细胞寿命(cell⁃lifespan)、细胞尺寸阈值(Cell⁃maxsize)、细胞因子寿命(Cytokine⁃lifespan)、因子释放率(Cytokine⁃release⁃rate)。

然后,需要增添绘图模块,显现仿真的实时状况。此仿真系统需要添加2 个绘图模块,分别命名为Cell⁃chart和Cytokine⁃chart。Cell⁃chart模块包含9 种绘图画笔,分别是ags,abss,T⁃cells,B⁃cells,Wc⁃cells,NK⁃cells,MC⁃cells,MG⁃cells,FC⁃cells;Cytokine⁃chart模块包含10 种绘图画笔,分别是ags,IL⁃1s,IL⁃2s,IL⁃4s,IL⁃6s,IFN⁃αs,IFN⁃βs,IFN⁃γs,TNF⁃r1s,M⁃csfs。

最后,在界面上还需要添加一些数据监视器来配合动态曲线图去更好地显示并观察仿真结果,本文中,为每一类主体都配一个数据监视器,图5 为最终构造的仿真系统的前台界面。

2.2 后台程序设计

定义种类后,需要为其定义所需要的变量。免疫细胞拥有的变量:lifespan,reporting,sizer,isdivision,细胞因子以及抗体拥有的变量:iseffect,lifespan。一个时间步中的仿真过程如图6 所示。

下面对仿真过程中比较关键的地方进行详细说明:

(1)初始化免疫细胞、抗原。初始化一定数量的ags,T-cells,B-cells,WC-cells,NK⁃cells,MC⁃cells,MG⁃cells,FC⁃cells,包括设置各自的形状、颜色、大小、位置以及相关变量。

(2)细胞状态转化。对于这7 种免疫细胞,如果在其位置上有抗原,并且免疫细胞处于非活化状态(re⁃porting=false),那么此时免疫细胞在受到抗原的刺激下就会转化为活化状态(reporting=true)。

(3)细胞因子释放。免疫细胞如果是活化的,则会分泌相应的细胞因子。免疫细胞在分泌完细胞因子后便会死亡,但是为了维持机体的平衡,需要生成新的细胞补充上。

(4)细胞因子产生作用。细胞因子会向免疫细胞发挥相应的效应,发挥后便会死亡。

(5)清除抗原。抗体位置上如果有抗原,那么将会把抗原杀死,这个过程模拟抗体杀死抗原的过程。

(6)免疫细胞生长。该过程调整免疫细胞的sizer变量。系统每一个时间步刷新一次,在刷新时,如果免疫细胞的sizer小于maxsize,则把sizer加1,该过程模拟免疫细胞的生长过程。

(7)免疫细胞分裂。如果免疫细胞的sizer大于等于maxsize,并且没有分裂过,那么将会进行细胞分裂,该过程模拟免疫细胞的分裂过程。

(8)免疫细胞死亡。如果免疫细胞的lifespan小于等于0,说明已经达到自己的最大寿命,便会死亡,这模拟了其死亡过程。

(9)个体移动。抗原、免疫细胞、细胞因子和抗体都在不断地移动。抗原往非活化的免疫细胞附近移动;免疫细胞处于非活化状态时,往抗原附近移动,处于活化状态时,则随机移动,同时将其各自的lifespan减1;细胞因子往其作用的免疫细胞附近移动,同时lifespan减1;抗体往抗原附近移动,同时lifespan减1。

(10)更新曲线。每个时间步都进行曲线的动态更新,包括Cell⁃chart和Cytokine⁃chart两个模块,可以更加清楚地观察个体的数量变化,同时数据监视器可以实时地显示当前的个体数量。

3 仿真结果及其分析

首先对相关的变量进行初始化。Ag-count为100,7 种免疫细胞的数量都为15,Cell-lifespan为20,Cell-maxsize为15,Cytokine-lifespan为20,Cytokine-release⁃rate为45。

接下来运行仿真系统,在程序运行期间,所有的个体都在不断地移动;免疫细胞生长、分裂、死亡;抗原刺激免疫细胞,使其活化并分泌细胞因子;细胞因子对相应的免疫细胞发挥效应;抗体杀死抗原。前面这些全部都是根据生物免疫原理对其进行的定义,这样可以保证模拟的真实性。在此可以动态地观察到各个个体之间的相互作用关系,与传统的手工实验相比,计算机仿真具有容易设计、成本低、可视化的优点,其中系统运行中的一个界面如图7 所示,从图7 中可以充分地感受到可视化的好处。

在仿真时,主要从时间上对系统实施调控。在参数不变的情况下,进行大量重复的实验,在相同的时间内,根据每一次运行的系统曲线图来记录抗原、抗体、免疫细胞、细胞因子的数量变化,因为周期性的免疫特点,所以每次的曲线图基本一致。图8 是抗原、抗体和免疫细胞的数量曲线比较图,图9 是抗原和细胞因子的数量曲线比较图。

从图8 中可以看到,抗原会随着抗体的增多而逐渐减少,并且最终会减少到0,这是因为抗体会杀死抗原;当抗原被抗体全部杀死后,抗体的数量达到最大值,并且在之后由于没有了抗原,所以抗体的数量也开始呈现快速下降的趋势;免疫细胞在受到抗原的刺激后,数量也呈增长趋势,当抗原被抗体杀死后,免疫细胞的数量趋于平稳。

从图9 中可以看到,细胞因子的数量先增后减,直到为0。在刚开始,免疫细胞受到抗原的刺激后,变得活化,并且分泌相应的细胞因子,所以刚开始呈现增长趋势;当抗原被抗体全部杀死后,细胞因子的数量达到最大值,并且在之后由于没有了抗原,所以细胞因子的数量也开始呈现快速下降的趋势。从以上的分析中可以得出,本文的仿真系统运行结果与实际相符。

4 结论

本文对免疫细胞因子网络进行了建模与仿真。CK⁃SIM模型主要研究的是免疫细胞、抗原、抗体、细胞因子之间的相互作用关系,不再是单个的细胞因子对免疫细胞的作用,而是整个的细胞因子对免疫细胞共同作用所涌现出来的规律。同时,根据本文的CKSIM模型可以为以后进一步建立正确的免疫细胞因子网络模型提供帮助。最后,通过仿真结果可以清楚地看到免疫细胞、抗原、抗体、细胞因子之间的相互作用被正确地模拟仿真出来,并且整个过程全部可视化,更加深切地体会到计算机仿真比传统的手工实验具有可视化程度高、容易控制、参数易调节等优点。今后的研究可以以此模型为基础,不断进行改进,以促进对免疫细胞因子网络的研究。

摘要:针对免疫细胞因子网络,提出CKSIM模型,并利用Net Logo对其进行可视化仿真。该模型主要研究的是免疫细胞、抗原、抗体、细胞因子之间的相互作用关系,并且给出了仿真的具体步骤和仿真结果。研究表明,计算机仿真比传统的手工实验具有可视化程度高、容易控制、参数易调节等优点,利用计算机仿真可以研究整个的细胞因子对免疫细胞共同作用所涌现出来的规律。今后的研究可以以此模型为基础,不断进行改进,以促进对免疫细胞因子网络的研究。

关键词:免疫细胞因子网络,CKSIM模型,可视化仿真,计算机仿真

参考文献

[1]杨晓飞.免疫系统的计算机模型及应用[D].扬州:扬州大学,2013.

[2]莫宏伟,郭茂祖,毕晓君.人类免疫系统仿真与建模研究综述[J].计算机仿真,2008,25(1):11-15.

[3]CHENG X,CHEN B.The simulation system of cytokine net-work based IMMUNE-B[J].Lecture notes in computer science,2011,56(7):580-587.

[4]阳雪平.形式化B方法及在因子网络建模中的应用[D].扬州:扬州大学,2007.

[5]CAVALLA F,ARAUJO-PIRES A C,BIGUETTI C C,et al.Cytokine networks regulating inflammation and immune de-fense in the oral cavity[J].Current oral health reports,2014,1(2):104-113.

[6]曹新学.免疫系统的可视化计算模型研究[D].上海:东华大学,2014.

[7]ZOU S,YANG X,DU Z,et al.Modeling and simulating influen-za with immune-B[C]//Proceedings of the 2013 10th Web In-formation System and Application Conference.Yangzhou:IEEE,2013:229-236.

[8]LISOWSKA B,SZYMAŃSKA M,NOWACKA E,et al.Anesthesiology and the cytokine network[J].Postepy higieny I medycyny doswiadczalnej,2013,67(4):761-769.

[9]莫宏伟.免疫系统应答仿真研究[J].计算机工程与应用,2009,45(11):1-4.

多因子模型 篇9

飞行系统是一个为了完成特定飞行任务的系统。对飞行系统的安全性进行评估、预测是保障飞行安全的一种重要管理方法, 就是将“人-机-环-管理”这个飞行安全系统作为研究对象[1], 研究其状态变化对发生各飞行等级事故影响。目前, 国内外预测飞行事故的方法主要有:指数平滑法[2], 灰色预测法[3], 神经网络[4]和支持向量机 (SVM) [5等。主要是对事故万时率、事故征候万时率 (或千时率) 、问题万时率 (或千时率) 等进行预测, 但尚未有预测飞行系统安全状况范围, 进而有针对性采取预防措施的实例。鉴于飞行系统中各影响因素之间相互关系的错综复杂不确定性, 本文提出借助所研究飞行系统的历年统计数据, 建立各影响因素的隶属函数, 运用模糊关系合成原理, 在系统相对稳定的前提下, 作定性、定量集成分析, 预测飞行安全状况趋势。

1 飞行系统安全状态评价

1.1 飞行系统安全性主要影响因素

飞行系统是一个为了完成特定飞行任务的系统[1], 由“人-机-环境”三个子系统组成。但从对飞行系统进行安全评估的角度上看, 飞行系统内还应有一个重要的子系统, 就是“管理”这个子系统 (图1) 。

1.2“人-机-环-管”四个主要影响因素的综合评价

上述可见, 采用多层次综合评判法的二级模型是适宜的。选择主因素决定型模型M (∧, ∨) 对“人-机-环-管”四个因素的各自综合效果作评价[6]。将“人-机-环-管”四个评价对象分别划分为个等级, 即V={V1, V2, …VK…, Vm}。四个评价对象的影响因素集Uij={u1, u2, …uk…, un}, 式中, 下角标i为评价对象 (人、机、环、管) ;j为评判级别 (j=1, 2) ;n为影响因素个数。单因素评价子集为rk= (rk1, rk2, …, rkm) , 评价对象的n个影响因素的评价子集的集合构成总的评价矩阵Rij。

评价矩阵中的各因素隶属函数值, 采用专家评议结合线性插值待定系数法确定。各影响因素对所评价对象具有不同的重要度, 用模糊子集表示, , 为避免存在专家认识上的局限性, 因素重要度系数采用层次分析法。

依据模糊变换原理, 得出评判集B=A R, 最终依据最大隶属度原则, 确定出人、机、环、管四个评价对象的等级。从而确定出飞行系统的状态。

如:对某单位安全状况预测。飞行事故分为一等、二等、三等、飞行事故征候[7], 对应飞行安全状况划分为、、、、五个区间:

⑴为发生二起以上二等飞行事故或一等飞行事故, 表示安全状况“非常差”;

⑵发生一起以上三等飞行事故或二等飞行事故, 表图1示安全状况“差”;

⑶为多于三起飞行事故征候, 表示安全状况“存在严重隐患”;

⑷为发生三起以下 (含三起) 飞行事故征候, 表示安全状况“存在安全隐患”;

⑸为无等级事故且无飞行事故征候, 表示安全状况“安全”。

选用该单位2001~2005共五年的统计数据作为样本资料, 并根据上述方法对其间每季度的“人、机、环、管”四个子系统状态作出综合抉择评语集V确定为4个等级, 即V={好, 良好, 一般, 较差}。

将评价结论及统计结果列入表1。

表1中:符号△—较差;▲—一般;○—良好;●—好;★★—安全状况非常差;★—安全状况差;☆—存在严重隐患;■—存在隐患;□—安全

2 因子区间的权重及各区间内不同安全状况的权重

大量统计数据表明, 飞行系统安全状况趋势与飞行系统中“人、机、环、管”四个子系统的状态密切相关。

由于各子系统的相互关系的变化是不确定的, 通过建立它们的隶属函数, 确定因素 (子系统) 与对象 (安全状况) 间的模糊关系。

表1中, 各因子区间所含样本数与总样本数比值、、、为各因子区间样本对总样本的权重。

在各因子区间内, 各安全状况、、、、所含样本数与对应因子区间内所含样本数之比、、、、为区间内各安全状况的隶属度。见表2。

3 多因子飞行事故综合预估

因子与因子间的模糊关系实际是直积的一个模糊子集:

而因子与安全状况间的模糊关系S是的模糊子集, 为此可用模糊关系合成综合评判法预测安全趋势。

如, 对上例中2011年上半年, 人、机、环、管综合评估为:良好、良好、好、好, 由表2查得人、机、环、管的权重为:, 所以模糊集为。

同样, 在表2又可找到各对象 (安全状况) 区间的权重, 由此组成模糊关系,

将作为输入的向量, 作为模糊变换器, 按最大—最小法则可得:

其中0.45是安全隐患区间的权重, 它比0, 3/8, 0.25都大, 因而预报2011下半年安全形势是存在安全隐患, 这与实际情况相吻合。

4 结语

(1) 飞行安全状况受到诸多因素的控制并且对其判断具有模糊性的特点, 应用模糊数学中多层次群组模糊评判法评判“人-机-环-管”四个影响因素的状态, 并采用模糊数学中的模糊合成原理预测安全状况, 切实可行。

(2) 在系统相对稳定的前提下, 通过之前一个季度飞行系统中“人-机-环-管”四个影响因素的综合评估,

并结合之前的统计和计算数据, 运用模糊合成原理做多因素飞行安全状况预测, 该方法预测准确率可达90%以上, 满足进行安全管理和安全决策的要求。

(3) 由于客观事物的复杂性和人们认识上的多样性, 采用层次分析法确定重要度系数时, 人们构造出的判断矩阵并不一定具有一致性。若判断矩阵的一致性比较差, 则计算出的特征向量作为排序权重向量的偏差也较大, 从而可能引起排序上的错误。因而, 为保证矩阵具有大体的一致性, 必须对其进行一致性检验。

参考文献

[1]徐邦年.飞行安全评估概论[M].北京:蓝天出版社, 2005

[2]王永刚, 李楠.机组原因导致事故征候的预测研究[J].中国民航大学学报, 2007, 25 (1) :25-28.

[3]杜毅.基于灰色理论的飞行事故和事故症候率预测[J].中国民航大学学报, 2007, 25 (6) :9-10

[4]甘旭升, 张洪才, 程咏梅等.飞行事故的一种自适应模糊神经网络预测方法研究[J].系统科学与数学, 2008, 28 (4) :425-433.

[5]李大伟, 徐浩军, 胡良谋等.基于支持向量基的飞行事故率预测模型[J].数学实践与认识.2010, 39 (8) :124-128.

[6]杨纶标高应仪编著.模糊数学原理及应用[M].华南理工出版社, 2001.

上一篇:Web结构下一篇:卫生人才管理系统