不确定决策

2024-08-27

不确定决策（精选10篇）

不确定决策篇1

1 引言

决策理论是将第二次世界大战后发展起来的系统理论、运筹学、计算机科学等综合运用于管理决策问题，形成的一门有关决策过程、准则、类型及方法的较完整的理论体系。20世纪50年代以前的古典决策理论（或者规范决策理论）基于经济人假设，将经济人获得最大的经济利益（从经济学的角度）作为决策目的，并采用期望值作为决策准则。20世纪50年代以后的决策理论从发展过程和研究范式的角度分为理性决策理论和行为决策理论：理性决策理论假设人们是完全理性的，阐述人们应该采用怎样的逻辑步骤或者模型进行决策；行为决策理论则在理性决策理论的基础上，通过实证的方法研究人们的实际决策过程，描述决策者真实的决策行为，从中归纳出行为特征并从认知和心理方面进行解释，提炼行为变量从而改进理性决策模型。人们决策时通常考虑客观的备选方案，而决策者认知局限性、主观心理因素以及环境对决策者的心理影响等因素使实际决策行为脱离理性决策，传统意义下的理性决策理论无法解释实际的某些决策行为，因此行为决策理论脱颖而出。由于行为决策通常是人们在不确定环境下进行的，因此不确定环境下的行为决策理论研究尤为重要。实际上，Knight(1921）在其文章《风险，不确定性和利润》中将不确定性划分为两种：(1)已知概率分布的不确定性，即通常所说的“风险”，可以用随机变量或随机过程表示；(2)在概率分布未知条件下的不确定性，称为Knight不确定性或在不引起歧义的情况下简称不确定性[1]，后来被Ellsberg(1961）称为“暧昧”（Ambiguity)[2]。按照不确定性的研究发展方向，行为决策理论的发展经历了三个阶段：一是20世纪50年代至70年代中期以von Neumann和Morgenstern(1944）提出的期望效用理论[3]为决策准则的信息判断和选择阶段，此时决策面临的不确定性为风险，行为决策模型为期望效用理论模型。二是20世纪70年代中期至80年代中后期将行为变量嵌入理性决策模型的阶段，主要在面临风险时在期望效用理论体系蹬基础上对某些公理进行替代，提出众多崭新的决策理论模型，解释期望效用理论框架下众多悖论与异象。该时期的决策理论模型统称为非期望效用理论（Non-Expected Utility Theory），并且被拓展到动态情形，称为非期望效用理论动态相容性（Dynamic Consistency）。三是20世纪80年代末至今的暧昧主观不确定情景下现代决策理论研究阶段，该阶段的研究开始转向行为决策模型的构建和检验，行为决策理论的决策准则为暧昧主观期望效用理论（Subjective Expected Utility with Ambiguity）。同非期望效用理论动态相容性相类似，暧昧和暧昧厌恶模型向动态递归发展。本文按照行为决策理论的历史发展脉络对研究文献进行梳理，阐述了行为决策理论三个阶段的理论贡献及研究成果，在此基础上，指出行为决策理论在金融中的应用以及未来可能进一步拓展的研究方向。

2 期望效用理论与行为决策理论的萌生阶段

行为决策理论发展的第一个阶段（20世纪50年代至70年代中期）是信息处理过程的判断和选择的研究阶段。“行为决策”的研究对象通常分为“判断”和“选择”两大类。“判断”在研究中的含义是：人们在估计某一事物发生概率时，整个决策过程是如何进行的；“选择”则意味着：人们在面对多个可选事物的情况下，是如何做挑选的。

行为决策理论萌生于理性决策理论中悖论的提出，如Allais悖论（1953)[4]和Ellsberg悖论（1961)[2]等。1952年，Allais在一次关于von Neumann和Morgenstern作品讨论会中挑战期望效用理论，提出了著名的“Allais悖论”[4]。Ellsberg(1961）设计了著名的双色球和三色球实验，指出在某些情况下决策者的决策行为不遵从理性决策理论中的（主观）期望效用理论。主观概率源于行动的偏好，在主观环境中将概率理论应用到人们的信念和决策，可通过人们在选择行动的过程中表现出来，不需要事前的客观概率。在三色球实验中，Ellsberg设计了一个共90个球的瓮，瓮中有30个红球，以及60个黑球与黄球，其中黑球和黄球各自的数量未知。决策者面临以下四种奖励选择：(1)方案一：摸到红球得到$100奖励，摸到黑球或黄球没有奖励；(2)方案二：摸到黑球得到$100奖励，摸到红球或黄球没有奖励；(3)方案三：摸到红球或黄球得到$100奖励，摸到黑球没有奖励；(4)方案四：摸到黑球或黄球得到$100奖励，摸到红球没有奖励。通过实验发现，奖励的方案一和方案二相比，人们更喜欢方案一，此时摸到红球的概率大于摸到黑球的概率；在方案三和方案四中进行选择，人们更喜欢方案四，此时摸到黑球的概率大于摸到红球的概率。如此决策则与主观概率原则不相吻合，即从人们的决策中不能推断出概率[2]。因此，双色球实验和三色球实验的决策行为不能被Savage(1954)[5]的主观期望效用理论描述，这就是著名的“Ellsberg悖论”[2]。

由于理性决策模型无法解释决策者的某些实际决策行为，研究者开始探索实际的“决策过程”，将研究框架建立在认知心理学的基础上。在这一阶段，von Neumann和Morgenstern(1944）提出的（客观概率）期望效用理论是行为决策理论的主要决策准则。该理论的核心是对彩票的偏好关系施加一系列约束，使偏好关系的代表体现为从状态空间映射到结果的实值函数，即每个决策者都有一个实值的效用函数，称为Von Neumann-Morgenstern期望效用函数。决策者面临的不确定性仅仅体现为风险，即决策者行为产生的结果的概率分布是已知的，并且决策者赋予每个结果一个具体的数值作为某一行动的效用体现。根据效用函数期望值最大的原则，决策者在多个行动间进行选择。该理论的经典之处是效用函数的形式满足概率线性的性质，这被作为偏好关系约束结果下的独立性公理（Independence Axiom）提出[2]。对期望效用理论，Herstein和Milnor(1953)[6]和Jensen(1967)[7]提出不同的公理化体系。当前期望效用理论的发展，通常沿用Jensen(1967）建立在三条公理体系上的期望效用理论框架。他认为，偏好关系是二元关系，满足独立性公理和阿基米德公理（Archimedean Axiom)[7]。后来，Fishburn(1970）证明Herstein和Milnor(1953）和Jensen(1967）分别提出的公理化体系是等价的[8]。

Savage(1954)[5]在Ramsey(1931）提出的主观概率和期望效用理论的基础上[9]，综合了Von Neumann和Morgenstern(1944）的期望效用理论[8]和deFinetti(1937）的主观概率定义[10]，系统化地给出了主观概率期望效用理论的七条公理。同时，Savage将主观概率归结到客观概率，得到与客观概率期望效用理论相同的公式[2]。因此，在经济和金融科学研究提到期望效用理论时一般不再区分客观概率还是主观概率。Anscombe和Auman(1963）沿用了Savage(1954）中的部分假定，给出主观概率的定义并且在不同的框架下提出了相应的期望效用理论[11]。Fishburn(1970）和Fishburn(1982）对从两条线索出发对期望效用理论进行了简洁而又完整的总结。他以von Neumann和Morgenstern提出的风险决策偏好的公理化体系和Savage不确定环境下进行决策的理论为视角，进行了决策偏好的公理和偏好的数值代表方面的证明、概况和总结，系统地阐述了期望效用理论[8,12]。

期望效用理论的诞生，使得投资决策、资产定价和公司财务等方面的分析和研究被纳入期望效用理论的体系和框架，有了明确的判别标准和研究机制。在期望效用框架下金融科学研究突飞猛进，取得骄人的成就：资产组合选择理论（Markowitz,1952）、Modigliani-Miller理论（Modigliani和Miller,1958）、资本资产定价模型（Sharpe,1964;Lintner,1965;Mossin,1966）、有效市场假说（Fama,1970）、Black-Scholes期权定价公式（Black和Scholes,1973）、套利定价理论（Ross,1976）等理论的提出。但是，期望效用理论的公理化体系自形成伊始就出现了其自身无法克服的困难，最为著名的两个例子就是Allais悖论（1953）与独立性公理不相容，Ellsberg悖论（1961）与确定性原理（Sure-Thing Principle）不相容。同时，以期望效用理论为基础的行为决策研究经常出现各种异象，如确定性效应、反射效应、分离效应、共同比率效应、共同结果效应等。因此，期望效用理论应该更新或者放弃独立性公理和确定性原理，形成新的公理化体系进而得到新的客观和主观概率期望效用理论。

3 非期望效用理论与行为决策理论的发展阶段

行为决策理论发展的第二个阶段（20世纪70年代中期至80年代中后期）是行为变量嵌入理性决策模型的阶段。该阶段需要概括行为特征，提炼行为变量，然后将其运用到理性决策的分析框架之中。经过改善或替代后的决策模型不仅考虑客观的备选方案以及环境的影响，而且包含了决策者认知局限性、主观心理因素以及环境对决策者的心理影响等因素，因此产生了普适性更强的模型，传统的理性决策模型成为该模型的特例。以描述性研究为主要内容的行为决策通常是规范性研究的先行阶段，行为决策的描述性研究不仅用来解释决策行为，更重要的是为决策者提供更实用的决策指导和决策工具。因此，与传统的理性决策在建模、应用领域的融合是行为决策逐步走向成熟的一个标志，行为决策已经成为一门独立的研究学科，开始建立基于人们实际决策行为的描述行为决策模型，并在经济、金融和管理等领域逐渐得到应用。

行为决策理论中讨论的偏离传统最优行为的“决策偏差”主要是在这个时期研究发现的。人们在不确定环境下决策的完全理性行为可以用期望效用函数来表示，但是受信念、感知、内在动机、态度等心理层面的影响，人永远不会完全理性，在决策中经常偏离理性决策理论框架下的最优行为。这就促使行为决策理论的研究从期望效用理论延伸至非期望效用理论体系。非期望效用理论可以解释Ellsberg悖论和Schoemaker反例（Schoemaker,1989)[13]等现象。

在这一阶段，非期望效用理论是行为决策理论的主要决策准则。非期望效用理论是在期望效用理论的基础上将人们的信念、知识、感知、态度等心理层面的因素纳入考虑范围，更新或者放弃独立性公理和确定性原理，进而形成一系列新理论的统称。

Edwards(1954）将认知心理学引入决策机制的研究领域，勾画了行为决策理论研究的蓝图[14]，但直到1979年Kahneman和Tversky修正了传统经济学的基本假设，运用认知心理学对经济学进行大胆创新，提出了关于决策偏差的描述性决策框架，行为决策理论才取得重大的突破[15]。继承Edwards的学术思想，Kahneman和Tversky(1979）提出的前景理论（Prospect Theory）标志着非期望效用理论研究的开端，从而引发了行为决策理论研究的热潮。Kahneman和Tversky注意到期望效用理论的前提是经济人为风险规避者，效用是财富绝对水平的函数，权重是发生的概率。他们仔细研究期望效用理论的悖论，并通过大量的实验和观察，发现经济人具有下述行为特征：(1)人们快乐或者痛苦的真正因素不是财富值本身，而是财富的变化值———相对于某一参考值的变化：“获得”或者“损失”；(2)人们只有在面对“获得”时才倾向于“风险规避”，而当面临“损失”时，则倾向于“追求风险”；(3)人们往往尤其注重确定性的后果；(4)人们常常会强调小概率事件而忽视一般或者高概率事件。他们据此归纳出价值函数和决策权重函数，用“价值”和“决策权重”分别替代期望效用理论中的“效用值”和“概率”，得到一个能够更加准确地描述人们在不确定条件下实际决策行为的模型———前景理论。他们发现了许多偏离传统最优行为的决策偏差，如确定性效应、反射效应，锚定效应、后悔理论、过分自信等现象，在总结实验成果的基础上提出了充分展示人类决策行为复杂性和不确定性的前景理论。Kahneman的前景理论对行为决策理论的研究影响深远，他因此获得2002年诺贝尔经济学奖[15]。更进一步，Tversky和Kahnman(1992）认为对于“获得”和“损失”可以取不同的权重函数，从而将前景理论推广到累积前景理论（Cumulative Prospect Theory)[16]。

1982年，是行为决策理论迅猛发展并且收获颇丰的一年，众多影响深远且具有重大意义的非期望效用理论相继被提出：Machina(1982）的光滑效用理论[17];Quiggin(1982）的预期效用理论（Anticipated Utility Theory），后来称为顺序依赖期望效用理论（Rank-Dependent Expected Utility,RDEU)[18];Bell(1983)[19]与Loomes和Sugden(1982)[20]独立提出的后悔理论（Regret Theory）。1985年，Bell在后悔理论基础上又提出失望理论（Disappointment Theory)[21]。以下将对上述理论分别进行介绍。Machina(1982）放弃了期望效用理论体系中的独立性公理，通过增加效用函数关于概率分布的局部Frechet可微性，发展了更一般的光滑效用理论，被称为“广义期望效用理论”。他对效用函数进行修正，将决策者的风险态度与具体抽签相结合，认为针对具体的抽签决策者的风险偏好可以发生改变，从而建立针对风险的个人行为决策模型，就可以解释在原本期望效用理论下无法解释的各种悖论和异象。比如在对Allais悖论的解释中，期望效用理论下Machina三角形内的平行无差异曲线变为“扇形发散（fanning out）”的形式，以至于决策者对小概率事件的改变更加敏感，这是该理论的精彩之处[17]。Quiggin(1982）对期望效用中客观概率进行扭曲，提出了预期效用理论———后来称为顺序依赖期望效用理论。他将概率扭曲后的效用称为预期效用（Anticipated Utility），与期望效用不同的是，预期效用反映经济人的信念和知识，以扭曲函数的形式体现。扭曲函数不仅对某一点的概率进行扭曲，而是改变整个客观概率的分布。在该模型中，结果的权重不仅取决于其客观概率，同时也由该概率下的结果在所有结果中的排列顺序决定，结果有多“好”和有多“坏”会改变决策权重，因此该理论允许极端的结果获得非常高或非常低的权重[18]。Bell(1982)[19]和Loomes、Sugden(1982)[20]指出单因素效用函数不能很好的解释人们的非理性决策行为，进儿将后悔和欣喜两种心理感觉纳入到个人风险决策的偏好关系中，分别独立提出后悔理论。他们放弃独立性公理，建立了非传递的双变量效用函数的表现形式和后悔理论的公理化体系。后悔理论的核心思想是：决策者会对自己所处的现实状况与本可能处于的状况（在过去选择其他备择对象）进行比较，如果决策者自省时发现选择其他备择对象可以得到更好的结果，则内心会感到后悔；反之就会感到欣喜。因此当面临决策时，决策者会回忆之前的经历，并且形成可能面临的后悔或欣喜的预期[19,20]。继Bell(1982）的后悔理论的提出之后，Bell(1985）又提出了失望理论。他认为后悔并不是个人决策中唯一的心理体验，失望和喜悦情绪也应被纳入效用函数。同后悔理论相类似，预期的失望通过效用函数来改变决策者的实际决策行为。通过分析彩票实际结果与之前期望不同所导致的失望情绪对不确定情形下决策的影响，该理论发现决策者愿意为可能出现的失望支付一个高于彩票实际价值的溢价，极力避免产生失望情绪[21]。

Yaari 1987年提出的对偶理论（Dual Theory），是行为决策理论发展阶段金光熠熠的非期望效用理论之一。他定义了生存函数（survival function，又称为decumulative distribution function,DDF），并利用DDF的（广义）逆定义了一种加法运算，提出了对偶独立性公理（Dual Independence Axiom）及其等价形式———直接对偶独立性公理（Direct Dual Independence Axiom）。Yarri又利用了共单调性（comonotonic）的概念，推导出决策者信念继承的原因[22]。Yarri的对偶理论与Quiggin(1982）的预期效用理论[18]遥相呼应：预期效用理论强调扭曲人信念的函数是外生的，效用函数是内生的；对偶理论却认为扭曲函数可以是内生的，并给出扭曲函数的生成过程，强调人的信念和知识的重要性，但效用函数是外生的并且具有线性性。

在非期望效用理论体系下，决策者可以将面临的不确定性视为两阶段彩票（又称复合彩票），即与简单彩票相比，两阶段彩票的第一阶段结果是随机的并且又可视为一张彩票。如果决策行为满足复合彩票还原公理，则表述不确定性的两阶段彩票可被简化为简单彩票。Segal(1990）研究了在没有复合彩票还原公理（Reduction of Compound Lotteries Axiom）的情况下如何考虑两阶段彩票的问题。他认为决策者的行为并不一定符合复合彩票还原公理，而是满足复合独立性公理（compound independence axiom），并利用确定性等价物的概念和顺序依赖期望效用理论确定了动态定价规则。然而，决策者在没有复合彩票还原公理的情况下进行决策有时会出现决策偏差[23]。

已经出版四卷的《数理经济学手册》（Handbook of Mathematics Economics，其中前三卷于1982年出版，第四卷于1991年出版）记录了经济学中的各分支的已被认同的成果和最前沿发展动态，而各章的执笔均为相关领域的领先学者。由于行为决策理论的研究成果显著并日趋重要，因此不确定环境下的期望效用理论（Karni和Schmeidler,1991）被纳入手册第四卷第三十三章，高度概括了期望效用理论、非期望效用理论以及主观概率期望效用理论的内容和发展脉络[24]。

很多情况下，人们面临一系列相互关联的决策，并希望最初形成的最优决策或计划在后续面临决策时继续保持最优性，这就是动态相容性（Dynamic Consistency）。在非期望效用理论动态相容性方面，Kreps和Porteus(1978）最早考虑不确定条件下动态选择行为，强调经济人分辨不确定性的时间价值[25]。Green(1987）运用决策树研究个人套利（Making Book against Oneself）、独立性公理和非线性效用理论，认为如果个人偏好是非线性的，则观察到个人初始财富的局外者可以对这个人进行套利而获得收益[26]。Karni和Safra(1989）研究动态相容性、拍卖揭示和偏好结构，揭示了两种不同拍卖规则的最优投标行为[27]。Machina(1989）总结不确定条件下动态相容性和非期望效用模型[28]。Border和Segal(1994）提供研究动态相容偏好关系的新定义并由此导出近似期望效用理论[29]。Piccione和Rubinstein(1997）研究了不完全信息的决策问题，讨论了心不在焉驾驶员悖论（Paradox of the Absent-mind Driver)[30]。Segal(1997）在决策树中研究动态相容性和参考点[31]。这些研究使得非期望效用理论可以延拓到动态情形。

4 暧昧主观期望效用理论与行为决策理论的实证研究阶段

行为决策理论发展的第三个阶段（20世纪80年代末至今）是暧昧性主观不确定情景下现代决策理论研究阶段。从研究范式的角度不难看出，行为决策理论研究以演绎法为特征的理论研究开始逐渐增多，但实证研究方法还是主要的研究方法，只是实证分析的对象已经不是决策行为，而是基于决策行为规律提出的经济、金融、管理等领域中的一些命题假设。需要重点指出的是，虽然这个阶段的研究开始转向行为决策模型的构建和检验，但模型的构建和检验均建立在对人们实际决策行为的实证分析，在文化背景研究逐渐融入和复杂系统研究方法不断引入的情况下，对实际决策行为进行描述的精确度的要求越来越高。

在现代行为决策理论发展阶段，暧昧主观期望效用理论是行为决策理论的主要决策准则。事实上，早期的主观概率期望效用理论Savage(1954）和Anscombe、Auman(1963）从形式上都回归到客观概率期望效用理论[5,11]，直到1989年，主观概率期望效用理论才有实质性的进展，向暧昧主观期望效用理论过渡。最初的故事起源于Ellsberg悖论，在Ellsberg三色球实验中，他认为决策者倾向于选择已知概率的奖励方案（方案一和方案四），因此方案二和方案三中包含了暧昧。Ellsberg将决策者这种倾向于已知概率的方案而非暧昧方案的偏好定义为暧昧厌恶（Ambiguity Aversion)[2]。

在Anscombe和Auman(1963）的框架下，Schmeidler(1989）提出的Choquet期望效用（Choquet Expected Utility）理论，以及Gilboa和Schmeidler(1989）的最大最小期望效用（Maxmin Expected Utility）理论，使得暧昧被纳入主观概率期望效用理论的研究范畴，主观概率期望效用理论取得突破性进展，产生了暧昧主观期望效用理论[11,32,33]。Schmeidler(1989）利用Anscombe和Auman(1963）定义行动的框架放弃独立性公理，用共单调独立性公理（Comonotonic Independence Axiom）加以替代。他研究了主观概率的定义，同时提出没有可加性的期望效用理论，将主观不确定性称为暧昧，将没有可加性的测度称为容度（Capacity），从而得到Choquet积分（Choquet,1953）基础上的期望效用理论，称为Choquet期望效用理论。Schmeidler利用容度的原因在于两个暧昧事件发生的并集不一定是暧昧的，完全可以由客观概率刻画，这可以在Ellsberg三色试验中得到具体解释：尽管摸到黑球的概率或者摸到黄球的概率是不确定的，但这两个暧昧事件概率相加是2/3，用客观概率能够描述[32]。Wakker(1990）进一步证明了在一阶随机占优条件下，Choquet期望效用理论与顺序依赖期望效用理论事实上是完全一致的[33]。Gilboa和Schmeidler(1989）同样放弃独立性公理，提出确定性独立公理（Certainty Independence Axiom）和不确定厌恶公理，证明了被广泛采用的最大最小期望效用理论，又称为多重先验概率（multiple prior）模型。在面临暧昧时，决策者虽然不能用一个主观概率描述，但可以用一簇主观概率来描述。他们认为暧昧厌恶者会在最悲观的情形下评估不确定事件，即暧昧厌恶者先从每个行动中的一簇主观概率测度中选择一个使效用最小的概率测度，然后选择使这个最小效用最大的那个行动[34]。

继Choquet期望效用理论和最大最小期望效用理论提出之后，关于暧昧的研究不断深入拓展，暧昧主观期望效用理论不断发展。较为著名的静态暧昧主观期望效用理论和模型除了Choquet期望效用理论[32]和最大最小期望效用理论[34]，还有Ghirardato,Maccheroni和Marinacci(2004）的α-最大最小期望效用理论[35],Klibanoff,Marinacci和Mukerji(2005）的暧昧情形决策理论的光滑模型[36]，以及Maccheroni,Marinacci和Rustichini(2006）的变分表示模型（Variational Preference)[37]。Ghirardato,Maccheroni和Marinacci(2004）对暧昧和暧昧态度进行了区分，讨论了非暧昧偏好关系及其特征，给出偏好态度特征的一般表现定理，随后建立α-最大最小期望效用理论的公理化体系。在α-最大最小期望效用模型中α代表暧昧态度。α-最大最小期望效用模型是最大最小期望效用和最大最大期望效用的线性组合，其中最大最大期望效用表示决策者会选择最乐观情形下的期望效用，比重为1-α，最大最小期望效用的比重为α[35].Klibanoff,Marinacci和Mukerji(2005）提出暧昧情形决策理论的光滑模型，效用理论公式是对行动的客观概率测度下von NeumannMorgenstern期望效用在主观概率测度下期望的递增变换。该模型的主要优点在于可以将刻画决策者的主观信念的暧昧和刻画决策者口味的暧昧态度进行分离，其中风险态度由von Neumann-Morgenstern效用函数刻画，暧昧态度由递增变换函数刻画，因此可以运用处理风险态度的方法研究暧昧态度。Gilboa和Schmeidler(1989）的最大最小期望效用模型可以被认为是无限暧昧厌恶下的光滑暧昧决策模型的极限形式[36]。Maccheroni,Marinacci和Rustichini(2006）扩展Gilboa和Schmeidler(1989）的最大最小期望效用理论，在偏好方程中加入了Hansen和Sargent(2000）的暧昧指标函数，提出了变分表示模型。他们用最大最小期望效用表示风险态度，用暧昧指标函数表示暧昧态度，将这两项之和称之为偏好关系的变分表示。决策者应选择一个主观概率测度来最小化偏好关系的变分表示[37]。

另外一些学者也从不同方向入手，对暧昧以及暧昧主观期望效用理论进行研究，拓展期望效用理论，提出各自的行为决策理论和模型。Machina和Schmeidler(1992）研究了概率复杂（probabilistically sophisticated）选择行为特征的稳健性，认为如果决策者的选择行为反应了概率信念（事件由唯一的主观概率来区分），则该决策者是概率复杂的，这种主观概率选择理论偏差的目标是把决策者标的信念（事件的主观概率）和偏好（对风险的态度）分离开来[38]。Epstein(1999）给出不确定厌恶（暧昧厌恶）的定义，指出不确定性厌恶是可追踪的，这种可追踪通过效用函数的可微性来实现[39]。Epstein和Zhang(2001）考察了主观非暧昧事件的主观概率，他们把文献中通常用于定义概率测度的框架从Sigma域扩充到Lambda系，抓住了主观非暧昧事件的本质，从而可以使用它表述主观暧昧事件[40]。Abdellaoui(2002）将独立性公理替换为概率权衡一致性和随机占优条件，得到期望效用理论的顺序依赖的推广，为判断决策者面临风险时的态度提供了理论基础[41]。Nau(2006）给出二阶效用和概率的不确定性厌恶，以区分暧昧概率不确定性的态度和无暧昧概率（不确定性）风险的态度[42]。Chew和Sagi(2008）介绍对不确定来源的态度———条件小世界事件领域的概念，用小世界之间的比较风险厌恶来解释Ellsberg一类现象引发的暧昧厌恶[43]。Seo(2009）扩展Anscombe和Auman(1963）的主观期望效用理论的古典表示，用二阶信念（概率测度信念）刻画偏好，建立了二阶主观期望效用理论来解释Ellsberg悖论这一类现象[44]。Ergin和Gul(2009）提出主观复合彩票理论，发展不确定性选择的Savage类型模型，称为发源偏好（Issue Preference）。他们定义了二阶风险，由此揭示复合彩票的第一阶段，证明发源偏好二阶风险的不确定性厌恶与Ellsberg悖论是行为相容的[45]。Ghirardato和Siniscalchi(2012）考虑当偏好关系满足单调性、Bernoulli性（限定在常数行动上具有仿射效用表示）、局部Lipschitz性时暧昧的局部和全局多重先验表示，并且证明Ghirardato,Maccheroni和Marinacci(2004）的无暧昧偏好关系的先验概率集合可以由Clarke导数之并表示，引进“局部更好偏差”的行为定义[46]。

与非期望效用理论动态相容性一样，最近暧昧和暧昧厌恶模型向动态递归发展。最初的工作起源于Epstein和Zin(1990）用递归顺序依赖期望效用理论研究资产定价[47]。Maccheroni,Marinacci和Rustichini(2006）介绍偏好关系的变分表示的动态理论，即动态变分偏好关系[48]。Caplin和Leadhy(2006）介绍了时变偏好关系并讨论了有限时间随机决策问题，提供了递归最优策略存在性证明[49]。Takeoka(2007）用决策树表示动态（状态空间和信息滤波）模型，引进主观决策树的主观概率[50]。Klibanoff,Marinacci和Mukerji(2009）发展了他们提出的光滑暧昧决策模型，将其扩展到动态版本，对刻画决策者的主观信念的暧昧和刻画决策者的爱好的暧昧态度进行分离，动态相容的偏好关系具有递归表示[51]。Hansen和Sargent(2011）利用连续时间环境中统计探测理论提供关于暧昧稳健性或暧昧厌恶校准的新观点，认为决策者会重复遭遇动态状态转换和参数事前分布的不确定性[52]。

5 现代行为决策理论在金融中的应用

近些年来非期望效用理论正逐渐被用于金融研究并且具有良好的发展前景。Barberis,Huang和Santos(2001)[53],Barberis,Huang和Thaler(2006)[54],Barberis和Huang(2008)[55]应用前景理论和累积前景理论研究资产定价，Epstein和Zin(1990）应用顺序依赖期望效用理论和一阶风险厌恶研究股票溢价之迷等[47]。Wakker(2010）预言，未来十年中顺序依赖期望效用理论在金融科学的研究中将会得到充分的运用和良好的发展[56]。

当前，暧昧主观期望效用理论及其递归推广在金融科学中应用也开始成为热点，主要集中在是市场微观结构和资产定价两个方面。在市场微观结构方面，Easley和O’Hara(2009）考虑暧昧和不参与市场行为的关系、管制的作用，考察了业绩暧昧厌恶的意义和市场管制。经济人决策可能兼顾风险和暧昧，不参与是部分投资者避免暧昧的理性决策引起的[57]。Easley和O’Hara(2010）证明市场微观结构的具体性质如何能够减弱暧昧，导致投资者和发行人的参与[58]。在资产定价方面，Epstein和Schneider(2008）研究暧昧、信息质量和资产定价。当暧昧厌恶投资者处理不确定特质信息时，选取最坏特质的信息评估[59]。Leippold,Trojani和Vanini(2008）在标准幂效用函数的Lucas经济中，研究了在学习和暧昧信息环境下的资产价格。同仅存在学习或者仅存在暧昧的模型相比，他们的模型与实证参数情形的股权溢价、利率、股票收益波动性完全对应[60]。Caskey(2009）考虑具有暧昧厌恶投资者的股权市场的信息，认为错误定价与包括暧昧厌恶投资者的市场是相容的[61]。Gagliardini,Porchia和Trojani(2009）研究简单结构模型中期限结构的含义，认为债券超额收益反映暧昧溢价，不同于仿射收益曲线模型的风险溢价[62]。Bakshi和Skoulakis(2010）研究主观期望是否可以解释资产定价之谜，建立了主观期望资产定价模型[63]。Bossaerts,Ghirardato,Guarnaschelli和Zame(2010）认为对暧昧态度在经济人中是异质的，以此为基础研究了均衡资产价格暧昧和暧昧厌恶的影响与竞争金融市场的投资组合[64]。Illeditsch(2011）研究风险与暧昧对于最优投资组合和均衡资产价格影响，并证明投资者的愿望是对冲暧昧、导致投资组合惯性和超额波动性的主要原因[65]。Ju和Miao(2012）提出区分风险厌恶、暧昧厌恶和动态替代的一般递归光滑暧昧模型，并且运用该模型研究以消费为基础的资产定价模型[66]。

随着非期望效用理论和暧昧主观期望效用理论研究的不断深入，行为决策理论将会得到进一步的拓展和充实，在不确定环境下对人们的决策行为做出更好的理论解释，同时向决策者提供更富现实意义的合理化决策准则。

不确定决策篇2

连续值域决策表的一种属性权重确定方法

结合模糊聚类技术与粗糙集中属性重要性思想,针对连续值域决策表,提出一种属性权重的确定方法.该方法首先将连续值域决策表转化为模糊决策表,然后求出对象之间关于条件属性的相似度矩阵,再采用平方法将相似度矩阵化为等价矩阵,最后根据模糊聚类技术与粗糙集中求属性重要性方法求各连续属性的权重.实例说明了该方法的`合理性和有效性.

作者：刘文军 LIU Wen-jun 作者单位：长沙理工大学,数学与计算科学学院,湖南,长沙,410076 刊名：模糊系统与数学 ISTIC PKU英文刊名：FUZZY SYSTEMS AND MATHEMATICS 年，卷(期)： 22(3) 分类号：O159 关键词：连续值域决策表粗糙集模糊集权重

不确定中的“确定” 篇3

职业投资者,独立证券撰稿人,专栏作家。1997年入市,证券市场技术分析倡导者2004年“中国最具声望的100位证券分析师”之一

股市正在承受来自抑制泡沫与防止衰退的双重考验——既要加大对实体经济通货膨胀的监控,又要防止虚拟市场滋生资产泡沫。

春节后的A股市场给持有小盘股和创业板的买家带来丰厚的利润,甚至可以说阶段性盈利的市值已超越了上证指数3500点。而对于那些同基金一起守候银行、券商、甚至地产股的买家,除了郁闷,更多是沮丧。

产生这种现象的主因是信息背离。市场自2009年11月开始“风格转换”,但迎来的却是小盘股连续6个月的超值收益。而受政策影响,权重股集体走弱。

房地产发商正没有固定资产,上市只能加剧泡沫。处于通胀与经济危机间,在人们更关注资产价格泡沫与资源配置质量是否下降时,其隐藏风险将让投资者更加关注政策动向。这就是A股的政策面影响短期炒作情绪。炒作情绪又影响中期资金供求。供求失衡将带来更多不确定性。

避免危机重现,投资者需要忍受经济减速的阵痛。股市正在承受来自抑制泡沫与防止衰退的双重考验——既要加大对实体经济通货膨胀的监控,又要防止虚拟市场滋生资产泡沫。由此可见,宏观金融资源配置不合理会导致资源错配,并阻碍资本市场有效发展。

对经济过热的担忧和对通货膨胀的顾忌让二季度成为“敏感期”。通货膨胀的超预期表现和CPI超过3%的政策目标,都将加剧管理通胀的预期。实际监测数据也表明,场内资金近期不断轮换,较以往节奏加快,却始终看不到大资金连续作战的风格,仍以社会资金为主导。如果春节后的“蓝筹概念”没有通过炒作加大自身利润空间,站在3200点,短期内很难看到宏观经济数据推动的上升行情。大盘蓝筹股长时间的弱势和政策敏感性,让人们感到支撑炒作蓝筹板块的资金不足。

热点不在大盘蓝筹股,但市场本质还是震荡市。当前大盘刚突破了春节以来形成的“平衡市上沿”——2009年11月上证指数突破3000点反弹到3361点,之后2010年1月底再次跌破3000点,至2890点附近形成的以3000点为轴的一个中心点。近期市场虽然点位向上突破,但时间短,幅度小,中线筹码仍未占有明显优势。3200点既是3000点反弹到3478点连线至3361点套牢密集成交区,又是3478点到2639点形成的三角型上挡趋势线的反压点,大盘一旦反弹到3200点附近,上方压力不可忽视。

2010年大盘始终在围绕箱体运行,3000点是箱体震荡的相对中心。当大盘突破3000点后,操作应趋于谨慎。做到“别人贪婪时恐惧,别人恐惧时大胆”时,人们就有可能把握箱体震荡行情的高、低点。

操作中,投资者应多关注个股机会,而非大盘指数。波段操作要更快——短期行情会因股指期货而加大震幅,拉得太高或太快都会给期货“送礼”。同理,主力资金也不太可能出现在某行业性板块的持续拉升中。股指期货开盘如果急拉过高,对现货就是灾难。但从中期趋势看,明年此时,股指期货成交额很可能追平现货。

目前大盘如期在3200点附近反复震荡,从中期角度看,股市还没有出现中期趋淡的明确迹象。从循环周期的角度看大盘,2月3日的2890点会成为上半年最低点,若有行情也应发生在上半年。投资者不应太关注大盘,而要注重个股盈利机会。

主力参与性不高,缺少持续性,导致短时期市场还没有突破3200点的冲动数据。即使蓝筹短时波动加大,也难免去股指期货和融资融券的直接影响。但人们还可以指望蓝筹股能在箱体转折的关键点位拉动大盘指数——这才能让投资者意识到短线行情背后总有中线机会。

在短线盘面,4月15日起,筹码聚散监测中显示有所发散,持仓系数连续两天小幅下降。4月15日炒作资金总量流出约一百多亿,是资金自3月25日以来首次外流,此种情况应引起投资者的高度关注。

不确定决策篇4

库存控制是供应链管理研究的重要环节,1915年Harris第一次提出经济订购批量模型(EOQ)。EOQ为周期库存模型的研究奠定了基础,很多学者基于该模型开展了相关研究。郑惠莉等(2003)提出了需求和采购价均为时变的EOQ模型,并给出了寻求最佳采购次数及服务水平的算法;张钦等(2002)给出了基于Stackelberg博弈的EOQ模型。

但上述研究没有考虑“需求不确定”,不符合现实情况。基于此,学者们开始从“需求不确定”角度进行深入研究。楼润平等(2008)提出了需求不确定下的安全库存计算公式;钱存华、苏苗泉(2011)提出了基于累积损伤过程的随机需求下订购时间间隔模型;徐鹏、王勇(2011)给出了存货质押融资业务下的经济订货批量模型;蒋昕等(2015)指出存货经济订货批量“基本模型”理论上已经过时,给出了经济订货批量“修正的基本模型”。

然而,已有研究没有考虑需求不确定与缺货损失成本这两种条件同时作用的情况。本文针对需求率不确定条件下单品种多周期最优订货批量和订货点问题进行研究,并得出通解,为企业的随机库存管理提供理论依据和方法。

二、模型建立及求解

本文针对某一中小型零售商的单品种商品的多周期条件下库存管理进行研究。由于较多的外界因素影响,产品需求存在不确定性(本文假设其服从随机分布)。考虑产品的取得成本、产品的库存成本及缺货成本,构建库存管理的总成本为目标函数;通过优化分析,得出该条件下最优订货批量与最优订货点。本文的模型允许缺货,且上一周期剩余的商品可储存一个周期后补充到下一周期售出,作为补充下一周期的商品来匹配需求。

文章涉及的参数说明具体如下:Q表示存货的每次进货量;RL表示订货点,当库存降到此处时订货;TC表示总成本;U表示单位产品的购入单价;F1表示订货一次的固定成本;F2表示固定储存成本;D表示存货的总需求量;Kc表示变动储存成本;Q'表示平均库存;d'表示需求率,由于客户需求的不确定性,假设d'~u(a,b)均匀分布,a、b为常数;d表示需求率期望,由d'决定,这里为(b-a)/2;K表示每次订货的变动成本;CS表示每缺货一个单位损失费用;LT表示订货提前期,发出订单后货物到达所需时间。

目标函数为:

式(1)中:为取得成本,包括订货的固定成本、订货的变动成本和购置成本;为产品的库存成本,与存货数量有关,其中包括固定成本和变动成本;为产品的缺货成本,与缺货量有关。三者之和,就是周期内成总本TC。

求目标函数的一、二阶偏导数:

求目标函数驻点:

令。得方程组,且Q>0,RL>0,故求得驻点:

对驻点进行检验:

因为,则目标函数在驻点处取得极小值。因此Q的取值为Q*,且RL的取值为RL*时,TC取得最优解。

三、算例分析与仿真

假设d'~u(0,160),T=100,K=240,Kc=3,Cs=3,LT=4,因为F1、F2、U均不影响最优解,所以这里不作讨论。通过计算得出:Q*=1134,RL*=628。

Matlab仿真需求如图1所示。图1中横坐标为时间周期,纵坐标为在对应时间内的需求率变化。通过仿真结果不难看出,需求率杂乱没有规则。

图2为累计需求与时间周期的关系,横坐标为时间周期,纵坐标为累计的需求量。由图2可知,尽管需求率没有特定的规则,但是可以看出累计需求与时间正相关。这点为我们利用改进的EOQ来建立模型提供了依据。

应用图1和图2数据,建立模型,设期初库存为一定值,库存量会随着时间而减少,当库存量达到一定值时,提出订货请求,经过一个订货提前期货物到达。图3为Q*=1134、RL*=628时的库存仿真变化图,与传统EOQ库存模型不同的是:库存的下降速率在随机发生变化,在特定的时间库存量降到零以下,但是在传统的EOQ模型中是不会允许缺货的。图3中库存成本仿真结果为3614。将Q*=1134、RL*=628代入式(1),计算结果为3865。由于需求的不确定性,可以将计算结果与仿真结果近似看作相互吻合。

为了模拟现实的决策,本文对订货批量与订货点同时进行仿真模拟,其他参数不变。用Matlab运行160×160次,计算出订货批量、订货点与成本的三维图如图4,即成本为订货批量与点货点的凹图形。得出现实中存在一组与Q*和RL*相似的最优解,为求得最优解提供了可能。

令RL(订货点)不变,控制订货批量,其余参数不变,用Matlab运行1600次,计算并画出成本曲线,如图5。可知成本为订货批量的凹函数,且订货批量为1200左右时成本最小。在订货批量为(400,1200)的区间范围内,成本呈现不断减小的趋势;在订货批量为(1200,2000)的区间范围内,成本呈现不断增加的趋势。所以从图5可以得出,企业可以适当调节订货批量,使其订货批量满足图5中的最优解,则可最大限度地节约企业的成本。

仍令订货点不变,控制订货批量,改变K(每次订货的变动成本),其余参数不变,用Matlab运行1600次,计算并画出三种不同K的库存成本曲线,如图6所示。从图6中的仿真结果可以看出:(1)每次订货的变动成本与总成本呈现正相关关系,每次订货的变动成本越高,则总成本越高;(2)每次订货的变动成本越高,则目标函数的最优解Q*越大。

令Q订货批量不变,控制订货点,其余参数不变,用Matlab运行1600次,计算并画出成本曲线,如图7所示。从图7中可以看出,成本为订货点的凹函数,且在订货点为900左右时成本最小。在订货点为(400,900)的区间内,成本呈现不断减小的趋势;在订货点为(900,2000)的区间内,成本呈现不断增加的趋势。所以从图7中可以得出,企业可以适当地调节订货点,使其订货点满足图7中最优值,则可到最大限度地节约企业成本。

图8中的仿真训练为:控制Q订货批量不变,改变CS缺货成本并控制订货点变化,其余参数不变。用Matlab运行1600次,得出三种不同缺货成本的库存成本曲线。从图8可以看出:(1)缺货成本与总成本呈正相关关系,缺货成本越高,则总成本越高;(2)缺货成本越高,则订货点越高。

四、结语

本文通过研究缺货成本、变动存储成本和订货成本这三大影响因子,构建基于需求不确定性条件下的库存量设定模型,从而生成多周期下的总库存成本函数。通过优化分析得出,在需求不确定下考虑缺货成本的最优订货批量与订货点,并讨论每次订货的变动成本与订货批量的关系、缺货成本与订货点的关系。研究结果表明:(1)需求不确定的库存管理,存在一对最优的订货批量与订货点,使得库存的总成本最低,且总成本、订货批量、订货点三者为凹函数;(2)缺货成本与订货点呈正相关关系,订货的变动成本与订货批量呈正相关关系。

参考文献

郑惠莉,达庆利.一种需求和采购价均为时变的EOQ模型[J].中国管理科学,2003(5).

不确定决策篇5

D-S理论在不确定性多属性决策中的应用

针对一类具有不确定性主观判断信息的多人多属性决策问题,给出了一种基于Dempster-Shafer证据组合理论的分析方法,通过对不确定性信息进行二次融合,可以将该问题转化为普通的确定性多属性决策问题.最后,针对一个实际投资决策问题,给出了计算结果.

作者：张全樊治平孟军 Zhang Quan Fan Zhiping Meng Jun 作者单位：东北大学工商管理学院,沈阳,110006刊名：系统工程与电子技术 ISTIC EI PKU英文刊名：SYSTEMS ENGINEERING AND ELECTRONICS年，卷(期)：21(11)分类号：N94关键词：多属性决策组合算法投资 +不确定性

不确定决策篇6

多属性群决策问题是将各决策者给出的不同意见进行集结, 从而得到群意见的问题[1]。然而在实际的群决策过程中, 由于决策者自身的知识结构、判断水平以及个人偏好等主观因素的影响, 可能会针对同一个方案 (或同一属性) 给出不同形式的偏好信息。到目前为止, 有关多种形式偏好信息并存的群决策问题已经有了不少相应的解法:如文献[2]在国际上首次提出具有不同形式偏好信息的群决策问题的研究, 并给出了三种不同形式偏好信息的集结方法;文献[3]给出了群决策中具有两种判断矩阵形式偏好信息的集结方法;文献[4]分析了决策者可能给出的六种不同形式偏好信息的转换, 并运用OWA算子集结各决策者偏好信息和方案优选的方法。

本文在研究多属性群决策的过程中, 首先将决策者给出不同形式的偏好信息进行规范化, 将其转换成一致的模糊互补偏好关系, 其次, 根据各决策者的偏好关系, 建立优化模型来求解各方案的排序值, 即排序值越大, 方案越优。

1 问题描述

本文考虑决策者给出决策方案的偏好信息的多属性群决策问题。为了方便叙述, 采用下面的术语来描述多属性群决策问题:

4) 方案集合上的严格偏好关系:决策者认为方案Si严格优越于Sj, 只是在部分方案上表现出严格的偏好关系。

本文的研究在于根据决策者给出的偏好信息, 求出各方案的排序值与排序。

2 提出的方法

2.1 偏好信息的规范化与集结

由于决策者给出评价偏好信息具有不同的表达形式, 因此将其规范化为一致的模糊互补偏好关系[6,7], 方法如下:

2) 方案集合上的严格偏好关系, 他们之间的模糊互补偏好关系可以被看成是绝对的, 即1与0的偏好关系。

3) 基于决策者给出的方案集合上的选择子集, 他们之间的模糊互补偏好关系如下:

采用OWA算子对规范化的模糊互补偏好关系进行集结, 记得到的结果为P= (Pij) m×m。

2.2 优化模型建立与求解

模型 (5-6) 可以转换为如下形式:

3 算例分析

4 结束语

本文提出了一种新的方法来研究不确定偏好信息的多属性群决策问题, 通过建立模型来评估各方案的排序值。在这种方法中, 将多名决策者给出的不同形式的偏好信息分别规范化为模糊偏好关系, 然后采用优化模型来评估相应的排序值, 即排序值越大, 方案越优。该方法具有创新性, 同时丰富了当前解决多属性群决策问题的解决方法, 具有实际意义。

参考文献

[1]陈廷.决策分析[M].北京:科学出版社, 1987:1-120.

[2]Chiclana F, Herrera F, Herrera-Viedma E.Integrating three representation models in fuzzy multipurpose decision making based on fuzzy preference relations[J].Fuzzy Sets and Systems, 1998, 97:33-48

[3]Delgado M, Herrera F, Herrera-Viedma E, et al.Combining numerical and linguistic information in group decision making[J].Information Sciences, 1998, 107:177-194.

[4]王欣荣, 樊治平.一种具有不同形式偏好信息的群决策方法[J].东北大学学报:自然科学版, 2003, 24 (2) .

[5]S.J.Chen and C.L.Hwang, Fuzzy Multiple Attribute Decision Making:Methods and Applications, Springer-Verlag, New York, 1992[Z].

[8]Ma J, Fan Z P, Huang L H.A Subjective and objective integrated approach to determine attribute weights[J].European Journal of Operational Research, 1999, 112 (2) :397-404.

[6]张全.复杂多准则决策应用实务[M].辽宁科学技术出版社, 沈阳:2011, 11.

不确定决策篇7

一、基本假设

假设在信息对称的寡头市场上有两家企业准备进行升级投资，两家企业面临共同的市场环境和客户群体，且生产同质产品。其中A企业为市场原有企业，已经进入了升级后的市场，但拥有进一步扩大升级范围的扩张期权。B企业为市场新入企业，尚未进入升级后的市场，因而拥有升级的投资期权。先执行期权的企业为领先者，后执行期权的企业为追随者。两家企业年利润Pi可以表示为：

其中：Di(a,b）表示i企业的不同决策产生的利润函数（i=1表示A企业，i=2表示B企业）中确定的部分。a=1表示A企业不执行升级投资的扩张期权，a=2表示A企业执行升级投资的扩张期权；b=1表示B企业执行升级投资的投资期权，b=0表示B企业不执行升级投资的投资期权，具体如表1所示。

假设市场竞争将会影响到企业利润，也就是说其中一家企业执行期权会影响到另外一家企业收益。同时，假设两家企业均为风险中性，两者的贴现率为无风险利率。并进一步假定企业只面临市场的不确定性，没有升级投资的不确定性，也就是说企业升级投资必然会成功。Y(t）表示为市场需求的随机变动，服从几何布朗运动：

其中：α为期望利润率，σ为期望利润率方差。

二、模型构建与均衡分析

由于A企业与B企业为非对称的，两者的博弈的竞争格局也是非对称的。因此可以将模型划分为A率先执行扩张期权和B率先执行投资期权的两种情况。

1. A企业率先执行升级投资的扩张期权。

A作为已经部分实施升级投资的企业，率先进一步执行升级投资的扩张期权，B为追随者。用F(YF）来代表B企业决策后所产生的结果。首先求解追随企业的价值，再计算领导企业的价值。假设追随企业B持有期权且卖空n份价格为P2的基础资产，则该组合价值为F(Y)-nYD2(2,0）。在经过很短的时间dt后，投资组合总收益为：

对dF展开得：

将（2）、（4）式代入（3）式中，为了消除dz带来的影响，

取样，将（3）式简化为：(2[1]α[2]Y∂[2]∂Y2[2]F+αY∂∂YF)dt。

在无套利情况下有：，由此发现追随企业B满足微分方程：

该方程通解形式为：,(A1,A2均为常数）。

依据边界条件F(0)=0可知A2=0，所以方程解的形式为。

如果追随者B企业此时执行期权，利润收入为：，对F(YF)求导可得：

其中：I表示两家企业同时执行升级投资期权时的总投资成本，与方程的通解相对应，即：

，求导可得：

解得：

追随企业的价值为：

此时领导企业的贝尔曼方程为：

获得领导者价值为：

2. B企业率先执行升级投资的投资期权。

依据期权博弈求法，仍然先计算追随者的价值。用上面的方法计算追随企业A的微分方程为：

解得：

因此，追随者的价值为：

再求解领导企业B的价值。当Y<YF时，追随企业A不执行扩张期权，同理可得贝尔曼方程：

领导企业B的价值表示为：

3. 两家企业r均衡分析。

博弈过程中的A、B两家企业，是否选择率先执行升级投资期权的标准就是企业价值的高低。因此可以设定函数：HA(Y)=F(YAF)-F(YAL);HB(Y)=F(YBF)-F(YBL）。进一步，将（12）、（15）两式代入HA(Y）即可获得其所对应的函数表达式，同理将（7）、（17）两式代入HB(Y）也可获得其所对应的函数表达式。当HA(Y)>0时，A企业选择持有期权；反之A企业率先执行升级投资的扩张期权。当HB(Y)>0时，B企业选择持有期权；反之B企业率先执行升级投资的投资期权。在市场需求较低时，HA(Y)>0、HB(Y)>0，两家企业都选择持有期权，不想领先进行升级投资，此时出现两家企业均保持现状。在市场需求提高到一定程度后，HA(Y)<0、HB(Y)>0,A企业率先执行升级投资的扩张期权，而B企业仍然选择持有期权。在市场需求旺盛时，HA(Y)<0、HB(Y)<0，两家企业都选择执行升级投资的期权，采取升级投资活动。

三、案例分析

A、B为江苏省内两个大型纺织服装企业。其中，A集团是中国精毛纺、高支薄型精纺生产基地，主营精毛纺呢绒、高档男装和女装的生产和销售。公司董事会决议以自有资金3.07亿元投资利用特种纤维开发生产高档面料的升级项目。B股份公司是集纺纱、染色、整理、织造、印染、制衣于一体的纺织企业，主要产品为色织布、纱线、衬衣三大系列。2010年B公司在招股说明书中提出计划募集资金用于高档特种纤维纱线生产线项目，总投资22 946万元，建设投资20 599万元，流动资金2 347万元，建设期14个月，回收期5.71年。投产之后年棉纱生产能力达4 000吨，年营业收入20 932万元，年利润总额4 630万元。

1. 变量分析。

根据2008年1月至2010年6月沪深A股纺织指数收盘价取对数算得纺织行业的收益波动率σ为14.946%，企业预期收益率为22%。取项目建设期国内五年期的存款利率r=3.6%为无风险利率，以上海证券市场5～10年期同类公司企业债的利率水平7%为资金成本率i。在企业做出不同升级决策时，其利润函数的固定值为：D1(2,0)=2.947亿，D1(1,0)=2.267亿，D2(2,1)=2.523亿，D1(1,1)=1.888亿，D2(1,1)=0.463亿，D2(1,2)=0.347亿。

根据，解得正根β1=17.682。

在A为领导者的模型中，先求得阈值。

B企业为追随者，利润函数为：

A企业为领导者，利润函数为：

在B为领导者的模型中，先求其阈值：

A企业为追随者，利润函数为：

B企业为领导者，利润函数为：

2. 两家企业均衡分析。

处在博弈过程中的A、B两家企业，选择做领导者还是追随者的重要标准是企业价值在两种策略中的高低，企业必将选择价值高的策略作为自己的决策选择。根据上文的公式可以计算出A、B两家企业的最优决策区间，具体见表2。

根据案例的模型设定，企业年利润Pi可以表示为：P(t)=Y(t)Di(a,b),(i=1,2）。由于Di(a,b）是利润函数中确定的部分，而Y是利润函数中非确定的部分，因此企业升级投资博弈策略的根源是非确定部分Y的变动。

在Y∈（0,8.563）时，市场需求较低，两家企业都不愿意率先升级，而持有手中升级期权做追随者，此时出现两家企业都等待的状况。在Y∈（8.563,15.670),A企业将选择做领导者并率先执行升级投资期权，B企业选择做追随者，这是因为B企业作为市场新进入者，在市场需求不是非常旺盛的情形下选择做追随者的收益大于成为领导者，而A企业却可以通过成为领导者扩张市场上的势力。在Y∈（15.670，+∞），市场需求比较旺盛，两家企业选择成为领导者或追随者区别不大，企业在进行升级投资决策时会结合自己的实际情况，而不是对方的行动。

四、结论

本文构建了基于期权博弈的不确定环境下企业升级投资的寡头决策模型，给出了不同情境下两家企业的收益函数，在对收益函数比较分析后得到两家企业各自的最优期权决策区间。研究发现，在市场波动较大、市场需求低迷环境中，不确定性σ的上升均会提高企业升级投资的临界值，因此企业会倾向于持有期权，企业升级投资的意愿降低。反之，当外部市场环境比较稳定、兑现期权的机会成本下降时，企业将停止等待，尽快执行持有的升级投资期权，此时企业将尽早实施升级投资计划。

在两个企业博弈的寡头市场环境中，多重随机需求冲击在企业升级投资的期权决策中起关键作用。在市场需求不足的情景下，出于自利考虑，两个寡头企业均不会执行升级投资期权；当市场需求逐步提升后，市场原有企业将率先执行升级投资的扩张期权，扩大升级投资规模，而市场新入企业将继续持有升级投资的投资期权；而当市场需求进一步旺盛后，新入企业才会选择执行升级的投资期权。

参考文献

[1] .梅姝娥,成燕.企业能力对企业技术市场进入时机选择的影响.科学与经济,2009;3

[2] .郭晓丹,宋维佳.战略性新兴产业的进入时机选择:领军还是跟进.中国工业经济,2011;5

[3] .阿维纳什·迪克西特,罗伯特·平迪克.不确定条件下的投资.北京:中国人民大学出版社,2002

不确定决策篇8

关键词：闭环供应链,回收渠道,鲁棒优化,不确定性

近年来, 随着经济的快速发展, 资源紧缺和环境污染已经成为制约人类社会发展的主要问题。闭环供应链因其具有节约资源消耗和减少环境污染的特点, 引起社会各界的普遍关注。

闭环供应链是指在产品整个生命周期中, 同时考虑正向供应链以及回收再利用的逆向供应链活动所设计和管理的供应链[1]。近年来, 针对闭环供应链管理, 国内外的许多学者进行了研究。文献[2]中对不同回收渠道下闭环供应链的成员进行了博弈分析。在文献[3]中, Savaskan等研究了双边垄断的闭环供应链回收渠道决策问题。文献[4]中, 邱若臻和黄小原研究了制造商和供应商同时从事废旧品回收的闭环供应链Stackelberg主从对策模型。但这些研究大部分都是在确定环境下进行的, 很少考虑不确定性对闭环供应链的影响。

本文主要研究市场需求不确定环境下闭环供应链回收渠道的决策问题, 并对不同回收模式进行比较分析。

1 问题的描述

本文考虑由一个制造商和一个零售商组成的闭环供应链系统。闭环供应链的回收渠道分为三类:制造商负责回收 (M模式) ;零售商负责回收 (R模式) ;第三方负责产品回收 (T模式)

1.1 符号意义

本文中符号的意义如下。

mc:为新产品的生产成本;rc:为再制造成本;w:为批发价;p为销售价格;d为市场需求;q为零售商的订购量;α为制造商获得单位回收产品时给予回收方的价格补偿;λ (0≤λ<1) :回收率;I为回收方对废旧品回收的固定投资, 由文献[5], 有I=Bλ2, B为规模参数;v为单位产品残值收益;s为单位产品缺货损失;πij (i=M, R, T, j=M, R, T) ::j模式下i的期望利润函数。

1.2 模型假设

本文模型中用到如下假设:

(1) 假设新产品与再制造产品的质量并无差异, 销售价格也一样。

(2) cm>cr, 使用新材料的制造成本大于使用废旧品再制造的成本。令∆=cm-cr, 且∆>α。

(3) 0≤λ<1要想回收全部的旧产品几乎是不可能的, 所以在现实中回收率一般是<1的。

(4) 市场需求求d是不确定的, 其分布F属于具有均值µ和方差σ2的某一类分布Φ。

2 三中回收模式下的回收模型

2.1 制造商直接回收—M模式

在该回收渠道中制造商负责制造产品和回收废旧品, 零售商负责销售产品。制造商和零售商的期望利润函数如下:

这里考虑一种鲁棒决策, 即寻求最坏分布下的利润达到最大。

2.2 零售商回回收收模模式式——RR模模式式

在该模式中, 零售商不仅销售新产品, 还负责回收废旧产品。制造商负责制造新产品。该模式下制造商和零售商的期望利润函数为:

寻求最坏分布下的利润达到最大

式 (11) 等价于求解如下问题:

2.3 第三方回收模式—T模式

该模式下第三方负责回收废旧产品, 制造商负责生产新产品, 零售商负责销售新产品。该模式下制造商、零售商和第三方的期望利润函数为

可得:

3 三种回收模式的比较分析

对三种回收渠道下模型进行比较分析, 可以得出以下结论。

(1) 与M模式和T模式不同的是, R模式下订货量除了与销售价格、批发价格、单位产品残值收益以及单位产品缺货损失有关外, 还与制造商获得单位回收产品时给予回收方的价格补偿和回收率有关。

(2) 在所有参数相同时, 制造商在M模式下获得的利润最大, 制造商会选择直接回收。

(3) 在M模式和T模式下, 当p+s>2w-v时, *q>µ, , 零售商将订购比期望需求更多的产品;当p+s=2w-v时, *q=µ, 零售商将订购与期望需求相等的产品;当p+s<2w-v时, *q<µ, , 零售商订购量要比期望需求小。在R模式下, 当p+s>2 (w-αλ) -v时, q*>µ, , 零售商将订购比期望需求更多的产品;当p+s=2 (w-αλ) -v时, *q=µ;当p+s<2 (w-αλ) -v时, *q<µ。这有利于调节零售商订购产品过多或过少的问题。

4 结语

本文用鲁棒优化的方法研究了在市场需求不确定的情况下闭环供应链的决策问题。并对三种回收渠道下的模型进行了比较分析。为管理者在回收渠道的决策方面提供了理论依据。

参考文献

[1]费威.再制造闭环供应链研究综述[J].管理学研究, 2009, 7 (5) :99-104.

[2]熊文, 周石鹏.闭环供应链回收渠道的选择[J].物流科技, 2008 (6) :105-107.

[3]Savaskan R C, Van Wasssenhove L N.Reverse channel design:the case of competing retailers[J].Management Science, 2006, 52 (1) :1-14.

[4]邱若臻, 黄小原.具有产品回收的闭环供应链协调模型[J].东北大学学报:自然科学版, 2007, 28 (6) :883-886.

不确定决策篇9

关键词：不确定多属性决策,西部,国际物流枢纽城市

0 引言

随着经济全球化与国际贸易的迅猛发展,国际型物流枢纽城市在全球物流运作体系和产业组织中发挥了越来越重要的作用。当前重点建设西部国际物流枢纽城市既有利于国家西部贸易的发展,又能带动物流枢纽城市及辐射地城市的经济增长,并避免因各地重复建设而带来的资源浪费及提高现有资源利用率,实现枢纽城市与辐射地城市紧密合作、共同发展的目标,使西部区域成为国家发展经济建设中的重要载体、国际贸易交流的新中心[1]。

由于物流枢纽城市选择的主客观因素受多方面影响,存在复杂性和不确定性,加之人类思维的模糊性,每个候选城市的评价指标权重很难具体量化。鉴于此,本文拟就评价指标的权重为区间数的物流枢纽城市选择问题给出适合的数学模型和解决办法,使选择结果更加可信,协助决策者在现有的多个选址方案中找出最优方案。

1 西部国际型物流枢纽城市选择评价指标体系的建立

为了使选择的评价指标准确有效,结合前人构建评价指标体系的思路将物流需求因素层、物流供给因素层以及物流发展因素层作为一级指标,它们是决定物流体系设计方案优劣的主要因素。再选取相关发展情况因素作为二级指标[2],如图1所示。

2 不确定多属性决策模型的建立

不确定多属性决策模型以综合考虑评价指标权重及指标值,从而更多的保留了评价信息,使评价结果真实可靠。通过求解该模型即可获得各方案属性权重信息完全未知或部分未知的多属性决策方案排序,从而可以从中选出最优城市作为国际物流枢纽[3]。

(1)设X={x1,x2,…,xn}为选择方案集,即候选城市分别代表x1,x2,…,xn;同时,设G={f1,f2,…,fn}为评价属性集,fi即为评价指标体系下的二级指标,aij=fi(xj)是选择方案xj在属性下的fi属性值。

(3)决策矩阵A中一般是各决策属性的属性值,为消除由于不同量纲下统计数据对决策结果带来的偏差影响,需要对决策矩阵A进行规范化处理,得到规范化矩阵R=(rij)m×n[4]。

定义3:称μ(xj)为xj(j∈N)选择方案的满意度,若,(j∈N),对于每个选择方案xj来说,其满意度μ(xj)越大越好。但是选址方案的优劣需要在统一的标准下才能判断,因此各选址方案的综合属性值必须来自同一各属性权重向量ω={ω1,ω2,…,ωm}T,为此建立多目标优化模型:maxμ=(μ(x1),μ(x2),…,μ(xn))。

3 实例分析

将7个城市作为建设西部国际型物流枢纽城市的候选方案,根据上述模型,带入数据计算。

(1)设X={x1,x2,…,xn}为选择方案集,即X={西安,兰州,乌鲁木齐,重庆,成都,贵阳,昆明};同时,设G={f1,f2,…,fn}为评价属性集,G={国内生产总值,人均GDP,进出口贸易总额,高速公路营业里程,铁路营业里程,国际航班总数,区位优势,物流产值,物流发展潜力}={GDP,PG,C,R,T,P,S,I,L1,L2}。见表1所示。

(2)用专家咨询法确定部分权重信H为0≤ω1≤0.15,0.1≤ω2≤0.3,0.15≤ω3≤0.3,0≤ω4≤0.15,0.05≤ω5≤0.15,0.15≤ω6≤0.4,0≤ω7≤0.1,0≤ω8≤0.1,0≤ω9≤0.1,0≤ω10≤0.1。根据表1建立矩阵A。

再利用优化模型计算ω={ω1,ω2,…,ωm}T的最优解。得到:ω*={0,0.3,0.15,0,0.05,0.3,0,0,0.1,0.1}T。将权重带入计算,各候选城市方案xj的综合属性值分别:z(x1)=0.4162,z(x2)=0.0877,z(x3)=0.5807,z(x4)=0.4126,z(x5)=0.8032,z(x6)=0.1906,z(x7)=0.3835。对上述计算结果进行排序,在这七个候选城市中选择成都市为西部国际型物流枢纽城市。

4 结语

本文建立西部国际型物流枢纽城市选址评价指标体系,并在此基础上建立了不确定多属性决策模型,以区间数的形式考虑评价指标权重使评价结果客观可靠。通过实例验证了将不确定多属性决策模型应用到物流枢纽城市决策问题中的可行性,并为选择提供了科学合理的依据。

参考文献

[1]陈宁,张慧.打造浙中国际物流枢纽的思路和对策研究[J].物流工程与管理,2013,35(4):17-19.

[2]吴迎学,龙爱翔.多级模糊综合评判在物流中心选址中的应用[J].Forest Engineering,2004,20(5):16-19.

[3]汪博.不确定多属性决策模型在物流中心选址中的应用[J].物流技术,2006(10):30-32.

[4]李峰.区域物流中心选址模型研究[D].东北大学,2008.

不确定决策篇10

(一) 背景

多指标、多层次决策就是把多个描述被评价事物不同特征且量纲不同的指标, 转化为无量纲的相对的评价值, 并综合这些评价值, 以便得出对该事物一个整体评价。针对多层次不确定决策的评价方法模型, 探讨其在实际问题中的应用, 不仅是一个理论问题, 更是一个有重大应用前景的问题。

(二) 多层次决策问题基本概念和实际意义

多层次决策是指在多个指标间相互矛盾、互相竞争的情形下所进行的决策。是在若干个可供选择的方案中确定最佳方案的分析过程。在社会生产生活的研究控制中我们所面对的系统决策问题常常是多指标多层次的, 比如, 我们在进行产品生产决策时, 既要考虑如何使生产系统的产值达到最大值, 同时又要确保生产出高质量产品, 而又使生产成本尽可能低。这多个目标之间既相互作用又相矛盾, 这就使决策过程变得复杂, 决策者通常很难作出决策。这类具有多个目标的决策就称为多层次决策。

二、层次分析法

(一) 定义及基本原理

层次分析法在20世纪70年代中期由美国数学家萨蒂 (T·L Saaty) 正式提出, 是一种定性和定量结合的系统化、层次化的分析方法。层次分析法, 是将一个复杂的决策问题作为一个系统, 将被评价方案分解为若干目标或准则, 进一步可分解为多指标及若干层次, 通过定性指标模糊量化方法算出展次单排序和总排序, 以作为多指标多层次方案优化决策的系统方法。层次分析法 (AHP) 是一种定性分析和定量分析相结合研究复杂问题的问题系统方法。利用较少的定量信息, 将复杂的问题利用数学思维简单化, 使人们容易理解。

(二) 层次分析法步骤

1.建立多阶梯 (一般不低于三阶梯) 。

2.构造判断 (成对比较) 矩阵。公式2-2称为判断矩阵。 (见表1)

3.层次单排序及一致性检验。

(1) 计算一致性指标CI (consistency index)

其中, 为判断矩阵的最大特征值

(2) 查找一致性指标RI (见表2)

(3) 计算一致性比例CR (consistency ratio)

当CR<0.01时, 认为判断矩阵的一致性是可以接受的, 否则应当对判断矩阵进行修正。

4.计算权向量并做一致性检验。求出A的最大特征值, 对应的特征向量W。经归一化处现后即被认为足同一层次各因素相对于上一层次W素要性的排序权值, 称此过程为单次单排序。

(三) 层次分析法在消费行为选择中的应用实例分析

当今信息化时代, 每个人拥有一部属于自己的智能手机已经成为必然。现在市场上的手机品牌层出不穷, 选择的余地也很大。从消费者自己的角度出发可以用一种非常实用的决策分析方法———AHP层次分析法, 来分析一下我对于选择手机的决策。把定性的问题定量化分析。本文就以购买苹果或者是小米手机为例。这里取了功能、价格、外观3个维度进行分析。价格层面, 现在一部5s差不多在4 000元左右, 小米3在1 700元左右。外观上小米更个性化和多变, 但是就功能而言, 苹果的系统更为先进, 而小米的米优系统通过自主开放创新被称为最快的系统。下面, 就对这两个品牌手机进行选择。

1. 建立模型

如引言中所说, 将功能、价格、外观三个维度, 运用AHP分析分别填入表格, 就得到了以下模型。

2. 成对比较

如果对三者进行比较, 将不容易得到这个权数值, 此时可以两两成对相比, 这样得到权数比较简单, 而且也比较准确。

(1) 功能与价格之间的比较

对于学生而言, 价格便宜的吸引力更大一些。但也不能完全忽略了功能, 所以可以将两者的比重设定为3:1。

(2) 功能与外观之间的比较

相对于外观而言, 一般人对于实用性的要求更加高一些, 所以可以将功能和外观的权重比定为5:1。

(3) 价格与外观之间的比较

如前面所言, 价格是是消费者最看重的特质, 而外观在基本上都差不多的情况下又恰恰是在这三者里面消费者比较不重视的, 所以可以将这两者的比例定为7:1。

3. 得出权数

第一步:计算各列的总和

将每一列的数值相加, 得出总和。

第二步:各个值除以该列的总和

第三步:计算各列的平均值

这些平均值, 通称为优先向量 (Priority Vector) , 简称PV值, 填入表格后就得到下表:

第四步:计算出Level-1的权数值分别为0.643、0.283、0.074

第五步:开始演算Level-2的「价格」权数值

依据刚才的第1—3步, 而进行演算: (1) 计算各行的总和。 (2) 各个值除以该行的总和。 (3) 计算各列的平均值。于是, 计算出权数 (即PV值) 如下:

第六步:开始演算手机的「功能」权数值

依据刚才的第1—3步, 而进行演算:计算各行的总和, 并且各个值除以该行的总和, 然后计算各列的平均值。于是, 计算出PV值如下:

第七步:开始演算手机的「外观」权数值

依据刚才的第1—3步, 而进行演算:计算各行的总和, 并且各个值除以该行的总和, 然后计算各列的平均值。于是, 计算出PV值如下:

于是计算出Level-2的权数值:

第八步:开始进行评估

买苹果对「价格」的贡献度为0.50, 而「价格」对总目标的贡献度为0.643, 所以买苹果透过「价格」对总目标的贡献度为:0.50*0.643=0.322。买苹果对「功能」的贡献度为0.75, 而「功能」对总目标的贡献度为0.283, 所以买苹果透过「功能」对总目标的贡献度为:0.75*0.283=0.212。买苹果对「外观」的贡献度为0.833, 而「外观」对总目标的贡献度为0.074, 所以买苹果透过「外观」对总目标的贡献度为:0.833*0.074=0.063。于是可算出:

买苹果所表现的理想度为:0.322+0.211+0.063=0.596。依据同样的程序, 可算出买小米的情形:

*买小米透过「价格」对总目标的贡献度为:0.50*0.643=0.322。

*买小米透过「功能」对总目标的贡献度为:0.25*0.283=0.071。

*买小米透过「外观」对总目标的贡献度为:0.167*0.074=0.011。

于是可算出:买小米所表现的理想度为:0.322+0.071+0.115=0.404。两者相比, 苹果优。

4. 成对比值的一致性检验

Step-1:基于上一小节的第三步所计算的总和及PV值, 就可逐步计算并检验出一致性了。例如上一小节的第三步所计算的总和及PV值为:

Step-2:计算最大值, 其公式为:各行总和与各列PV相乘之和。于是可算出:

Step-3:计算一致性指标 (Consistency Index) , 简称CI, 其公式为:

其中的n值就是选择准则的个数, 例如上图的n值为3。所以可算出:

Step-4:计算一致性比率 (Consistency Ratio) , 简称CR, 其公式为:

其中的RI代表随机一致性指标, 经查表可得到CI值为0.58。所以可算出:

Step-5:判断一致性:如果CR值小于0.1时, 表示具有相当的一致性, 所以上述例子是具有一致性的。反之, 如果CR值大于0.1时, 表示呈现显著的不一致性。由于0.083小于0.1, 所以是符合一致性的。

所以, 综上分析可得, 消费者在面临苹果和小米手机时候选择苹果手机更广泛一些。这也就不难理解苹果手机畅销的原因了。通过对消费者消费选择这种主观判断的定量客观化可以很快做出选择。

结语

层次分析法 (AHP) 是一种定性分析和定量分析相结合的研究复杂问题的系统方法。它利用较少的定量信息, 将复杂问题利用数学思维简单化, 使人们更容易理解。层次分析法使用系统性的分析方法简洁实用, 所需定量数据较少。

参考文献

[1]刘宝碇, 赵瑞清, 王纲.不确定规划及应用[M].北京:清华大学出版社, 2003.

[2]邢文训, 谢金星.现代优化计算方法[M].北京:清华大学出版社, 1999.

[3]刘宝碇, 赵瑞清.随机规划和模糊规划[M].北京:清华大学出版社, 1998.

[4]高金伍.不确定多层规划的模型与算法[D].北京:清华大学, 2004.

[5]hitchcock, F.L.The Distribution of a Product from Several Sources to Numerous Localities.J.Math.Phys[J].1941, 20:224-230.

[6]Michalewicz, Z.Genetic Algorithm+Data Structure=Evolution programs, 3rd edition, Springer-Verlag[M].New York, 1996.

[7]Michalewicz, Z and G.A.Vignaux and M.Hobbs.A non-standard genetic algorithm for the nonlinear transportation problem[J].ORSA Journal of Computing, 1991, 3 (4) :307-316.

[8]Gen, M and Y.Li.Spanning tree-based genetic algorithm for bicriteria fixed charge transpor-tation problem[J].In Proceeding of the Congress on Evolutionary comprtation.pp.2265-2271 washington, DC, 1999.

[9]Haley K B.The solid transportation problem[J].Operational Research, 1962, (11) :446-448.

【不确定决策】推荐阅读：

不确定环境下如何决策09-13

不确定事项06-19

不确定估计06-20

区间不确定08-13

不确定环境08-31

测试不确定度06-02

不确定度计算07-23

低不确定度08-28

扩展标准不确定度06-09

合成标准不确定度06-14