大数据信用峰会

2024-09-28

大数据信用峰会（共4篇）

大数据信用峰会篇1

2016年5月25日, 中国大数据产业峰会暨中国电子商务创新发展峰会 (以下简称, 数博会) 在贵阳启幕, 中国国务院总理李克强出席开幕式并发表致辞。

以“大数据开启智能时代”为主题的数博会, 由国家发展和改革委员会、工业和信息化部、商务部、中央网络安全和信息化领导小组办公室、贵州省人民政府主办。本届数博会共吸引官、产、学、商等2万余名海内外嘉宾到会, 共同探讨大数据领域未来的发展趋势。

围绕“国际水平、行业引领、专业平台”的三大功能定位, 为期五天的数博会将举办中国智慧城市数据安全与产业合作高峰论坛、云计算与大数据融合发展等68个论坛, 涵盖经济和社会发展、产业与应用、技术与趋势、安全和隐私保护、电子商务五大板块。

期间, 数博会展览会将分别从大数据分析与应用、数据中心和配套产品、智能制造及设备、互联网创新应用、电子商务五大板块集中展现全球高端技术和数据的最新应用。展览会吸引包括高通、戴尔、富士康等全球大数据领域顶尖企业在内的参展企业和机构300余家。

除展会和论坛外, 2016中国国际电子信息创客大赛暨“云上贵州”大数据商业模式大赛、痛客大赛也将在数博会期间举行。

为方便专业观众和普通市民共享数据盛宴, 2016数博会设立专业公众日和公众开放日。25日、26日为“专业观众及媒体日”, 旨在为广大参展商、采购商和专业人士营造良好的洽谈交流环境。27日至29日为“公众开放日”, 市民可前往参观, 了解大数据知识、体验大数据技术。

大数据信用峰会篇2

李克强在致辞中说,当今世界,信息化浪潮席卷全球,大数据、云计算、物联网等蓬勃发展,使互联网时代迈上一个新台阶。今天的中国要把握住世界科技革命的历史机遇,按照创新、协调、绿色、开放、共享的发展理念,加快创新型国家建设,着力推进结构性改革尤其是供给侧结构性改革,推动信息化与实体经济深度融合发展,不断提升全要素生产率,努力保持经济中高速增长、迈向中高端水平。

李克强表示,要推动新经济发展和传统产业转型升级,必须坚持改革开放,使中国经济发展方式从过度依赖自然资源转向更多依靠人力资源开发。自然资源是有限的,但人力资源是无限的,蕴藏着无穷的创造力,是实现可持续发展的最大资源。我们坚持创新驱动发展战略,制定实施网络强国战略、国家大数据战略、“互联网+”行动计划、《中国制造2025》等,出台了一系列重大举措,在促进创新和更好发挥人力资源优势方面的效应正在显现。以大数据为代表的创新意识和传统产业长期孕育的工匠精神相结合,使新旧动能融合发展,并带动改造和提升传统产业,有力推动虚拟世界和现实世界融合发展,打造中国经济发展的“双引擎”。

李克强指出,要发展共享经济,让更多的人有平等创业就业的机会,使广大人民更好分享改革发展成果。共享经济不光是在做加法,更是在做乘法,会让创业创新门槛更低,成本更小,速度更快。近三年,我们大力推进简政放权和商事制度改革,激发了人们的创业创新热情,催生了一批新技术、新产业、新模式。这些企业今天还是“小个子”,未来就可能产生一些“小巨人”,甚至享誉世界。企业家精神和工匠精神有机结合,可以使产品品质和企业效益都有提升,更好满足消费者对产品和服务的需求。共享经济不仅人人都可参与,而且人人都可受益。我们要大力加强信息基础设施建设,尤其要加快农村和老少边穷地区基础设施建设步伐,缩小“数字鸿沟”,促进扩大就业和减少贫困人口。

李克强表示,要通过简政放权放管结合积极培育发展大数据等信息网络产业。依靠改革推动发展,这方面需要市场主导,政府也大有可为。要打破“信息孤岛”和“数据烟囱”,推动政府信息共享,提升政府效能,让企业和群众办事创业更方便。除涉及国家安全、商业秘密、个人隐私以外的数据,都应向社会开放。充分利用信息化手段完善市场监管,形成线上线下一体化监管格局,实现“人在干、数在转、云在算”。利用大数据等技术为民谋利、解民所忧,促进形成公平普惠、便捷高效的民生服务体系。

李克强强调,要在开放和发展中实现信息安全。强化信息网络和数据安全治理,建立和完善数据流动与利用监管立法,构建信息基础设施安全保障体系。依法依规打击信息滥用、侵犯隐私、网络诈骗、盗取商业秘密等行为,加强知识产权保护,保障公民的信息安全权益,净化网络空间。

李克强最后表示,当前世界经济复苏乏力,信息产业等新经济快速发展,给世界经济增长带来亮光和希望。中国信息化发展方兴未艾。欢迎各国企业和创业者来华投资兴业,鼓励东部高新技术产业特别是与大数据相关联的衍生产业向生产成本较低、可以获得更高效益的中西部地区转移发展。我们将营造更加公平、透明、可预期的投资环境,保障企业合法权益,提供更好的公共服务。

大数据时代电子政府信用模型构建篇3

目前, 大数据已经成为新一代信息技术的重要组成部分[1], 随着信息社会的形成和信息技术与传统行业的渗透, 大数据不但被越来越多的IT企业重视, 也成为了社会学、经济学和管理学等学科的研究热点。

大数据有四大特征。 (1) 数据量大 (Volume) 。由于信息科学与技术自身的指数函数增长特点, 导致经过几十年的技术与实践积累, 目前数据容量存储方面, 与前十年及之前若干年相比, 已经表现出指数函数的突飞猛进的增长, 几乎是天文数字级别的容量。信息技术发现初期, 数据的存储容量非常有限, 存储单位是K和M, 随着硬件技术的发展和大规模集成电路摩尔定律的支撑, P、E甚至Z级别的存储设备的数据库管理系统已经诞生。为大数据时代的到来, 做好了物质支持和技术保障。 (2) 数据类型繁多 (Variety) 。多类型的数据对数据的采似曾相识处理能力提出了更高的要求。随着互联网时代的到来和物联网技术的日臻成熟, 无论是政府, 还是公众与企业, 都是自媒体和新媒体的受众。而且, 新技术与设备的应用, 时时刻刻都在产生数据, 都在记录数据, 而这些数据的来源是非常多样的。 (3) 数据价值密度相对较低 (Value) 。大数据时代, 不再单纯强调数据的因果性, 大数据时代更加依赖对相关性的分析。 (4) 处理速度快, 时效性要求高 (Velocity) 。

2电子政府信用模型构建

2.1电子政府的内涵

电子政府名称是来自英文E-government[2]。欧美国家最高的电子政府是从办公自动化开始的, 随着互联网的发展, 政府又纷纷在互联网上开通网站, 从事政务公开和网上办事等业务, 从而提高效率和减少成本。关于电子政府的认识, 与大数据等新兴信息技术类似, 各国政府、研究机构和学者, 从不同角度和层次都有不同的理解秋解读。联合国给出“电子政府是政府的一项永久性承诺, 通过对服务、信息与知识的高效便捷、成本合算的传递, 来增进公共部门与个人公民之间的关系”。

2.2电子政府信用

电子政府的信用也可以从不同的角度来进行理解。例如, 从伦理学、经济学、信息学等层面来理解。再如, 从组织和关系的方面来解读。该文认为, 电子政府的信用是建立在大量数据基础之上的, 电子政府的信用本质上是信息和利益相关者的信用。因此, 可以认为电子政府信用是信息技术及其产品、设施和网络的信用, 同时还包括信息利益相关者的信用。其中, 前者主要包括三个方面。第一, 是大数据时代, 海量数据的采集与存储的硬件设备及其操作系统。例如, RFID射频识别技术、视频监控技术、二维码技术等等。第二, 是数据采集与传输过程中起支撑作用的网络设备与协议。例如IPV6协议, 泛在网络, 4G移动网络技术等等。第三是各种数据挖掘和信息处理软件系统。例如云计算中心、APP智能应用、跨平台操作系统等等。后者主要包含电子政务中涉及电子政务面对三个实体关系:政府对政府 (Government to Government, G2G) 、政府对企业 (Government to Business, G2B) 和政府对公众 (Government 2 Citizen, G2C) 。在电子政务中, 政府如何在虚拟的网络空间中保证自身信用, 还有, 电子政府的交道并享用政府公共电子服务的企业和公众的信用。

2.3电子政府信用模式

基于电子政府信用的量化和可操作性的考量, 在确定性、无二义性和大数据特征的原则下, 可以基于数据链路的认识将电子政府信用的模型归类为信息资源信用、信息传输信用、信息挖掘信用、信息应用信用、信息人信用。如图1所示。

信息资源反映的是电子政府的硬件环境, 其信用包括信息基础硬件设备。例如核心交换机接路由器、防火墙、上网行为管理、应用服务器以及相应的配置策略信用。同时, 涉及到光纤宽带运营商、通信企业和数据中心提供商的信用。

信息传输信用是指电子政府的数据传输和交换链路。其信用除包含电话、传真等传统网络外, 也包含政务内网信用、政务外网信用、VPN专网信用、移动数据网信用等等。

信息挖掘主要是指处理速度更快的数据挖掘, 在互联网+时代, 主要是集中在云计算和巨型计算机等等。常见的云计算有三种:基础设施即服务 (Infrastructure as a Service , Iaa S) 、软件即服务 (Software-as-a-service, Saa S) 和平台即服务 (Platform- as-a-Service, Paa S) 。三者的主要服务对象分别对应电子政务中的政府、公众和企业。因此信息挖掘信用也即涉及这三种云服务的计算软件和硬件。

信息应用是对数据向信息的转换的结果及对信息的进一步使用的过程。将信息通过应用软件提交给个人或组织机构, 从而形成经济效益或社会效益。该信用主要涉及应用软件的信用。

信用人信用, 是指所有在电子政府中工作的人员、与电子政府交互的公众或企业所涉及的信用。在打造电子政府信用的过程中, 信息人是决定性力量。如果信用人失信, 必然导致电子政府的权威下降甚至消失。

3结语

大数据时代, 政府、公众和企业的信用状况记录本身就是一种重要数据。在电子政府的建设中, 如何保障电子政府信用, 防止失信状况发生, 是一个越来越重视的课题。该文基于大数据的特征以及数据信息链路和信用相关人的分析, 给出一种电子政府信用模型, 对于推动政府信用体系建设和电子政府推进, 提供了一种新的技术路线和参考。

摘要：大数据时代的到来, 推进了电子政府的进一步发展。通过分析大数据的内涵与4V特征 (Volume, Variety, Value和Velocity) , 该文基于大数据的特征以及数据信息链路和信用相关人的分析, 给出一种电子政府信用模型, 对于推动政府信用体系建设和电子政府推进, 提供了一种新的技术路线和参考。

关键词：大数据,电子政府,电子政务,信用,经济信息

参考文献

[1]何军.基于云计算技术的大数据下企业危机管理系统研究[J].科技管理研究, 2014 (21) :159-164.

大数据金融及信用风险管理篇4

在常见的金融风险(市场、信用、流动性、营运)中,有着相对完善的、能够有效应用大数据分析并进行管理的,就属于信用风险。所谓信用风险是指在商业活动中由于借款者(债务人)未能满足合同要求而给贷款者(债权人)带来经济损失的风险。由于信用风险是以借款者还款能力和还款意愿为基础,因此,计算出借款者的资产价值多少,未来现金流的大小,和还款意愿强弱是度量信用风险的关键。按照借款者类别,信用风险基本可以分为几类①:①大中型企业信用风险;②小微型企业信用风险;③个人/消费者信用风险。

管理好这三类信用风险,不但是贷款商业银行,贷款者的立身基石,也是投资于固定收益债券类投资者的成败关键。对它们的分析和建模,虽然都依赖对于大量数据的整理和概括,但其方法论和实际技巧,都大相径庭。

大中型企业的信用分析,主要基于理性预期假设(Rational Expectation Hypothesis)和期权定价理论(Option Pricing Theory)。其基本前提就是:

(1)企业的违约决策,是有效的,即其管理人会在违约有利的情况下理性地做出违约的决定;

(2)违约的可能性及损失率,是由企业的资产、负债、波动性、利率水平、及破产成本等因素决定的,而且可以由传统的Black-Sholes-Merton期权定价模型来进行预测,具体而言:①企业的杠杆率越高,违约率也越高;②企业的波动性越大,违约率也越高;③无风险利率越高,违约率一般较低;④违约的损失率(Loss Rates),和企业的行业特性高度相关:固定资产占比越低,损失率越高。

在西方,由于大中型企业可以在市场上融资,因此,企业信用等级评估是投资关注的重要指标。信用评级也主要是基于资产、债务等财务信息。不论是市场熟知的KMV的EDF模型,还是彭博的DRSK模型都是围绕企业资产价值、偿还债务能力来计算信用风险。但由于第三方信用评级机构的收入来自与信用债务的发行方,因此第三方信用评级机构的公正性得到市场怀疑,特别是2008年席卷全球的金融危机更是将第三方信用评级机构推向舆论中心②。图1显示了EDF模型中基于数据而计算债务到期时公司价值的分布图。

对于那些还不够大,无法利用债券市场融资的中型企业,邓白氏(Dun&Bradstreet)信用分数是这些企业在银行取得贷款的重要指标。具有80年历史的邓白氏是西方商业征信市场的最主要提供商。到2012年底,邓白氏的全球信用数据已经覆盖200多个国家的2.2亿家公司。邓白氏利用通过多种方式和渠道收集的商业信息,如公司规模、历史、法律诉讼、财务信息、还款历史等来计算企业,在今后12个月里破产和重组的概率,以及违约的可能性(即信用风险)。

无论哪种方法,信用风险的高低是取决企业融资成本大小的关键。不管是在资本市场上融资,或者是银行直接融资,信用风险评估是贷款评审的必备程序。而评级机构,则是左右企业融资成本的关键。所以每个评级机构,都有高度专业化的量化金融团队,对企业进行风险分析、建模、和评级。一些有能力的贷款机构或投资机构也常常设立自己的量化研究团队,一方面为解决第三方评级机构对外并不公开的评级黑匣子流程,使得信用风险度量更加有把握;另一方面也是可以通过市场对信用风险的价格错配而谋求套利机会。

对于小微企业(micro business。美国富国银行定义小微企业为年收入不足2百万的企业③),由于缺乏资产,信用风险更多地是与企业所有人的信用和资产相挂钩。小微企业商业贷款是企业主个人贷款的延伸。富国银行小微企业商业贷款是以商业信用形式来发放。商业信用上限为3万美元。对于超过3万美元上限的贷款额度,企业必须展示出商业需求和职业经验。因此,小微企业贷款大多为信用贷款。信用风险建模和个人并无太大区别。

对于消费者个人的信用风险建模,则主要基于在大样本上的计量经济建模。其基本假设就是在相同条件下,个体会与大样本中的相似,个人做出相似的行为选择。比如,两个相似的消费者,拥有的共同特性:

①相同的收入;②相同的教育程度;③相同的负债水平;④相同的信用分数;⑤相同的消费习惯;⑥其他的可量测变量。

那么模型假设一般认为两个人在同样的经济环境下,比如:

①房价下跌;②失业率上升;③离婚、或其他家庭变化。

会做出相似的违约决定。当然,这只是统计意义上的相似,即观测到百分之一的对象违约,那么我们对于一个相似消费者在类似情况下违约的可能性的预测也是百分之一。模型误差,统计误差肯定是存在的,因此,保持大样本是统计模型的基本要求。以房屋按揭贷款为例,在建立违约模型的时候,经常要运用以下这类维度的大数据:

(1)按揭记录:①以千万,甚至以亿计的按揭贷款记录;②每个按揭贷款可能有150-200个数据项,比如。

(2)按揭类型:包括:①贷款利率;②贷款目的(购房、再融资、提现);③固定或是浮动利率;④还本付息年限及计划。

(3)贷款人记录,包括:①信用记录/信用分数;②家庭收入及财产记录;③其他负债;④自住或投资。

(4)抵押品记录,包括:①房价;②房租收入;③房价波动性;④房产所在地。

(5)上十亿级别的每月还款/违约观测记录。每月的观测记录,包括:①还款额度;②违约与否;③累积违约金额;④预付记录,等等。

(6)每月的其他相关时域变量,比如:①房价变化;②利率变化;③失业率变化,等等。

当然,收集到了这些数据,只不过是信用风险分析建模的第一步。我们还需要用于以下的计量经济学、大数据分析、计算机仿真、应用数学等技巧,比如:

①数据清洁、整理、采样、样板数据重构;②模型选择、估计、校准(Model Selection/Estimation/Calibration);③预测及计算机模拟;④对于模型驱动变量的灵敏度分析。

本文特别强调数据的采样和清理。由于数据的体量很大,以及非结构化的特征,完全收集到调查群体的每一位、每一项数据是不可能的,而且数据的准确性也不能完全保证;更为重要的是,数据并不是越大就越好。因此,进行数据调查设计和抽取,将数据进行标准化、标签化、结构化,有利于分析其便利性和有效性。特别是对实时跟踪的一些市场动态数据,如果跟踪的数据过于庞大和复杂,则容易产生数据不一致、维度过高、模型无解、延时等问题。

在消费者金融业,商业银行及类似的大型金融机构(比如美国两房、三大评级机构、五大投资银行)已经雇佣了数以千计的经济学家、统计学家、计算机科学家及数学家们,开发了多年的基于大数据的模型,如以上所提到的按揭贷款违约模型、信用卡模型、信用评分模型。

以美国KDS(KD Scientific)公司为例。KDS是一个位于加州San Jose的金融工程公司。其主要客户为高盛、摩根斯坦利等华尔街投资公司、富国(Wells Fargo)等大型商业银行,以及资产管理公司①(包括对冲基金)。目前,它所拥有的消费者数据达2000TB。KDS系统为金融公司提供了证券期权和期货定价、资产抵押债权、消费者预期、违约以及损失模型的风控的全面分析。随着计算机技术的发展,大数据的存储并不是问题,但是对大数据的运算却面临很大的挑战。当多维的非结构化或者半结构化数据集中在关系型数据库中时,运算、分析会耗时过长。KDS早就有了自己开发的专利(图2,图3显示其处理海量数据专利的数据排序UBX,以及UBX系统构架),利用2000多个CPU+GPU节点的计算集群,通过运用其高性能的大数据挖掘和云计算的专利平台,以及系列数学模型,如量子场论、微分几何、流行拓扑、复频域分析等,实现对数据的特征量化,从而达到结合科学的分析、模拟、风控的最优化决策。

图4显示了KDS对美国按揭抵押债权的客户分析界图面。对于客户所选的每一个选项,KDS后台的计算平台利用UBX系统和其他特配技术与用户即时反馈。比如,在每月第五个工作日,美国最大的按揭贷款公司,房利美、房地美、吉丽美就会向市场公布最近一个月的提前还款数据。由于两房和吉丽美控制着全美10万亿按揭资产证券化市场的90%(以2013年新发行的按揭占比计算),因此,其每月发布的数据对债券交易市场有重要意义。利用上述技术,KDS可以在25秒内计算出各种类型按揭的提前还款率,对于从事按揭债券套利的交易员来说,能在几十秒内完成以TB为基础的大数据综合分析,为他们领先于竞争对手洞悉按揭市场变化,及时调整仓位和交易策略赢得了时间。

2对大数据的误解

大数据不是解决信用风险的万能钥匙。数据是基础,开发挖掘数据才是关键。即便大数据可开发功能是如此强大,我们也不能说大数据就是万能的。比如,基于大数据估计个人房屋按揭信用模型并没有帮助投资者防范席卷全球的金融危机。主要有两个基本原因:

(1)计量经济学模型(或任何基于历史数据的预测模型),都假设在相同条件下,人们会做出相同的行为选择,通常是正确的。但在模型中没有被捕获的变量(即所谓潜在变量Latent Variable隐性变量),可能某时某地发生改变,从而改变人们的行为。像新的抵押贷款产品,人们对拥有自有住房的看法等等。这种影响是很难单独被传统数据抓获。而大数据的技术,不可能产生一个系统地展现方式。同时,人、市场行为会发生突变,使得在正常情况下的常态行为模式发生转变。比如,债券和股票的关联度通常为负,这也是投资多元化的基础之一。但在危机爆发时,如2008年,市场会在恐慌下抛弃任何证券,包括债券和股票,而转向持有现金。这时债券和股票的相关度会突然从负数变为1。传统的负相关假设不再成立。这种突发事件如何从大数据中体现出来,同时在短时间内改变投资仓位和投资方法,没有很好的解决方案。再比如,房贷借款者在还款违约时并不会马上卖房还债,但在经济危机下,房屋借款者同时失去工作,而社会就业环境又极度困难,当大数据中缺乏类似环境时,这种模式的变化就不甚明了。

(2)预测不仅需要模型,也需要输入,假设:未来的利率如何变化,房价增长率如何,在很多时候,没有一个好方法来事先判断假设的合理性。例如,在2007年美国房产价格巅峰之时,还假设房屋价格将持续保持长期的4.2%年增长率(当时美国房价已经保持了10年的持续高速增长),当时从表面上看是一个非常合理的假设。但实际上看,这个假设不但是完全没有用的,甚至是非常有害的。在美国当时,大数据的应用已经是非常普遍了。但基于历史的数据,以及缺乏市场风险的传导机制的理解,使得对假设的合理性缺乏判断。

随着互联网的普及,数据挖掘技术的深入,大数据分析在消费者信用风险中将会起着越来越重要的作用。在消费者信用评估中,还款意愿与还款能力是基本。如果能够很好地把握贷款者的收入、债务,以及还款习惯,那么个体的信用评估就会相当准确。在这个基础上,其他数据,即个人上社交网站的频度,社交群体可信度①等起的作用并不大。最近国内信用大数据圈里的常常谈起美国的Zestfinance。这是一家基于大数据运用于个人信用评分的公司,成立于2009年。国内不少热衷者认为,这个公司将颠覆传统个人信用评分方式。Zestfinance公司利用了上千个来源于不同地方的与信用相关或不相关的数据变量,从个人财务状况到对社交网站的使用量,对个人违约风险做出评估。这些数据量远远超出传统信用模型。但对于从事过个人信用模型开发的专业人士来说,Zestfinance公司仅仅会对传统模型有改进作用。ZestFinance创始人在最近的中国之行中也自己说道,Zestfnance服务于无信用评分或信用评分很低的小众人群,由于美国二级数据批发商极多,Zestfinaince本身也很少在互联网上收集数据,基本上是通过购买得到这些基本数据。而Zestfinance所能购买的到的数据银行也可以得到,只是银行依靠自己第一手信贷数据已经能够进行对借款者的信用评估②。由此可见,传统的个人信用评级方法并没有被撼动,更不会被Zestfinance所颠覆。但是,Zestfiance开启了一扇大门,促使传统评级方法不但在理念上,在方式方法上也要有相应改善。因此,了解大数据的局限性,才能更好地发挥其在金融风控中作用。

注释

1在本文,我们跳过政府主体,包括地方债。事实上,政府在融资中同样存在信用风险问题。对政府信用分析方法与企业、个人虽然有不同,但差别并没有根本区别。

2例如,在投资银行雷曼兄弟2008年9月15日倒闭前一天,穆迪、标普、惠誉三个主要第三方评级机构均给出雷曼兄弟A的评级。

3美国银行业主要是根据企业人数来定义企业规模。小微企业的雇员人数低于100人。

4管理4万多亿美元的中国外汇管理局也是客户之一。

5美国历史上最大诈骗案,麦道夫骗局中,麦道夫(他本人做过纳斯达克的主席)的社交圈非贵即富。然而相信他可靠的投资者损失了600亿美元,不可谓不惨重。

【大数据信用峰会】推荐阅读：