空间统计

2024-09-23

空间统计（精选9篇）

空间统计篇1

空间统计学是以具有地理空间信息特征的事物对象的相互作用以及他们的变化规律为研究对象, 将统计学和现代图形计算技术相统一, 通过直观的可计算的方式, 来揭露空间数据中所隐含的空间模式、空间分布以及空间的相互作用等一系列的数据特征。自1950年国外学者由此引出空间的相关测量维度, 在空间测量领域有了新的开始, 在上世纪90年代, 通过对该领域的研究和发展, 开始使用应用软件进行测量, 并且该软件的问世, 逐步得到应用计量经济学领域的认可推广使用。在21世纪初期, 在国际上空间统计学的理论和测量方法已逐渐被完善和成熟, 应用软件的种类也逐渐增多。经过不断的发展, 空间统计学已被社会各界所认知, 其不断发展的动态, 为该领域的发展带来前所未有的创新。本文将对空间统计学研究的发展进程做进一步阐述, 对空间统计学的产生背景、空间数据的主要特点、空间统计学的主要内容等结合国内外学者对此的相关研究理论以及其发展的历程做出进一步浅析。

一、空间统计学产生的背景

在空间中存在现象之间不同距离、不同方向、不同成分的相互影响和相互作用, 随着科学时代的进步, 以往传统用以描述地理对象的相关数据统计、分析方法等已经起不到很好的指导作用, 此时就需要崭新的科学有效的分析方法来解决空间对象变化以及空间数据的关系等一系列的问题, 20世纪60年代Matheron提出了空间统计学的理论, 无论是对空间数据研究领域还是在统计学分析领域都具有重大改革意义。

二、空间数据的主要特点

1. 空间数据的依赖性

空间数据具有较强的依赖性, 在区域的基础上空间数据依靠聚集的方式存在, 往往边界的空间数据不足以体现样本数据的整体特征。

2. 数据的异质性

空间数据在不同的条件下, 受自然因素和社会经济因素等外界客观条件的影响体现出不同独特的内在性质, 即异质性。具体表现在空间数据在全局方面变化存在差异, 而局部变化则相一致。

3. 空间单元的可联系性

空间数据在整个测量过程中, 易受空间组织单元存在形式的影响, 测量维度受划区效应以及尺度效应的影响, 这些都会影响到空间单元之间的联系, 只有认真分析各个单元之间的关系, 才能更好地进行空间数据的统计。

4. 数据的不确定性

空间采集数据样本时, 受多种因素共同影响, 采集结果具有不确定性, 即数据误差的存在, 也被该领域称作空间误差, 具体包括建模误差、数据测量误差、数据采集误差等。作为影响数据的重要因素之一, 对空间数据的分析、预测等环节, 都会产生重要的影响。

三、空间统计学的主要内容

空间统计学在传统的经典统计学的基础上演变发展而来, 和传统的统计学相联系但又存在区别, 空间统计学将传统的经典统计学与现代图形的合成技术相结合, 致力于通过直观数据和图形显示展现出空间数据中所隐藏的空间各组成部分、空间的主要分布以及他们之间相互作用的联系。空间统计学运用其自身的独特性处理具有地理位置属性的相关的空间数据, 由于其处理数据的准确性和直观性目前被地理学、矿物勘探、森林学等众多领域被广泛应用。空间统计分析的主要内容具体分为以下几个方面:

1. 探索性空间数据分析

与以往传统的统计学分析方法不同, 探索性数据分析忽略理论性的假设, 利用传统统计学的原理和图形等直观的测量技术相结合和对空间数据的全面了解和深入分析空间整体结构的布局、空间的分布状况以及数据间的相互影响等诸多因素, 对样本数据进行分析探讨, 为实施可行性计划方案提供理论支持。

2. 确认性数据分析

此分析方法通常被应用在空间数据分析的第二个阶段上, 以传统的回归分析为基础, 根据数据的分析结果建立理论模型, 通过系统的分析与确认对模型进行校验, 未检验的理论结果受空间数据的多重影响可能是空间的也能可能是非空间的, 但最终模型的确认与校准都要根据空间数据不断完善来完成。

3. 空间面板理论数据分析

该研究方法把数据分析和数据的时间维度相结合, 通过数据分析锁定空间位置, 同时考虑时空时间特殊性, 把空间效应也纳入了空间统计分析的研究体系, 使得模型的校验结果更具准确性。

四、结论

综上所述, 空间统计学经过多年的发展和完善, 目前在各领域中被广泛的应用, 并被社会大众所熟知和认可, 在科技突飞猛进的今天空间统计学无论在理论层面还是在实际应用领域都具有巨大的发展潜力, 在国内外空间统计分析方法也被广泛的推广, 但在其应用的过程中也逐渐暴露了一些数据上的缺陷。例如, 空间数据对空间边界的依赖性过强, 受多种因素影响空间统计数据的不确定性, 另外空间统计学的发展最大的制约因素就是, 目前我国国内参考的文献少之又少, 缺少关于空间统计数据的相关参考书籍, 和用于数据分析的汉化软件, 在此方面的缺陷极大的制约了空间数据统计的推广和实际应用。所以空间数据统计在我国的数据分析领域还有很大的发展和完善的空间。

参考文献

[1]GJG Upton, B Fingleton-Chichester:Wiley, 1985.

[2]陈斐, 杜道生.空间统计分析与GIS在区域经济分析中的应用[J].武汉大学学报 (信息科学版) , 2002, (04) .

空间统计篇2

统计信息与空间信息按地理格网集成的方法研究

统计信息是区域可持续发展中的重要信息资源,涵盖了人口、农业、工业、经济等各类数据.采用GIS技术,有效地实现统计信息与空间信息的集成管理是区域可持续发展的重要保证.本文在分析了GIS中常用的.集成方法基础上,提出了通过统计信息的“空间化”实现两者集成的方法,并以人口为例,详细论述了通过“空间化”实现人口数据与空间数据的集成过程.通过这种集成,可以高效地利用GIS的分析功能实现统计信息的管理、分析、显示.

作者：赵荣董春 ZHAO Rong DONG Chun 作者单位：中国测绘科学研究院,北京,100039刊名：测绘科学 ISTIC PKU英文刊名：SCIENCE OF SURVEYING AND MAPPING年，卷(期)：200732(4)分类号：P208关键词：统计信息集成空间化技术

空间统计篇3

关键词：有机碳密度；地统计学；空间变异；GIS；空间相关性

中图分类号：S153.6 文献标识码：A 文章编号：1674-1161（2014）02-0019-03

碳循环是全球环境变化问题的研究重点，而土壤呼吸作用产生的碳尤其是有机碳是全球碳循环总量的重要组成部分。土壤有机碳大部分集中在土壤表层，其动态变化对大气CO2浓度、土壤质量及土地生产力有非常重要的影响，直接影响土壤肥力和作物产量。

昌图县位于辽宁省铁岭市北部，属中温带亚湿润季风大陆性气候，地势平坦，土质肥沃，年平均气温6～7 ℃，年平均降水量600 mm，是辽宁省的产粮大县之一，也是全国著名的农业大县、商品粮生产基地。昌图县的主要土壤类型为棕壤、草甸土和黑土。分析当地土壤有机碳的空间变异特性，全面系统地了解昌图县土壤有机碳的密度，对指导昌图地区的生产实践和区域建设具有重要意义。

1 材料与方法

1.1 样品采集与分析

根据昌图县土壤类型分布特点及土壤系统分类采样原则，于2012年在昌图县采集70个样点（0～20 cm土层）的样品，并记录野外样点位置，根据土壤剖面特征进行土层描述。土壤系统分类的采样原则为：重要性原则（农林牧业利用价值大）、主要性原则（分布广，面积大）、独特性原则（分布面积虽小但类型独特）、均匀性原则（全县各地尽量均匀）。

土样经风干处理后，采用干烧法（元素分析仪）测定有机质含量；采用环刀法测定容重；过筛后称定砾石质量。

土壤有机碳密度（T0）通常是指单位面积土体中所含有的有机碳质量，是表征土壤质量及陆地生态系统对全球变化贡献大小的量度指标。对共分为m层的某土壤剖面来说，T0计算公式为：

T0 =Σmj=1（1-δ%）ρjcjdj/100 （1）

式中：cj表第j层中土壤有机碳平均含量，g/kg；ρj为容重，g/cm3；δj%为砾石的体积分数；dj为厚度，cm。

1.2 研究分析方法

分别利用Excel和SPSS 13.0进行试验数据的基本处理和描述性统计分析，采用GS+7.0统计软件和域法进行半变异函数拟合和特异值识别，选用ArcGis9.3地理信息系统软件完成土壤有机碳克里格插值的空间分析。

2 结果与分析

2.1 土壤有机碳描述性统计

对昌图县的70个土壤样本数据进行一般描述性统计，数据基本符合正态分布，结果见表1。

由表1可以看出，表层土壤（0～20 cm）的有机碳密度在0.55～3.41 g/kg之间，平均含量为1.97 g/kg；从反映离散程度的变异系数可以看出，有机碳密度表现出强变异性，变异程度较大。考虑到特异值对样本数值的影响，采用域法识别特异值，确定样本数据中无特异值出现。

2.2 土壤有机碳半变异结构分析

在多种因素的共同作用下，土壤性质具有空间分布的非均一性或空间变异性，且它们彼此不是相互独立的，而是在一定范围内存在空间自相关性。地统计学的核心是根据样本点确定研究对象（土壤性质的某一变量）随空间位置变化的规律，以此推算位置点的属性值。检验结果表明，土壤有机碳密度变量服从正态分布，故进行变异函数模型拟合，得到如图1所示的半方差函数理论模型。

一般认为，块金值（C）代表随机变异的量，如施肥、耕作措施、种植制度等各种人为活动引起的变异。基台值（C0+C）代表变量空间变异的结构性方差，即由土壤母质、地形、气候等非人为因素引起的变异，是系统内总的变异。块金系数[C0/（C0+C）]则是块金值与基台值的比值，表示随机部分引起的空间异质性占系统总变异的比例。按照区域化变量空间相关程度的分级标准，块金系数<25%时，变量具有强烈的空间相关性；块金系数在25%～75%之间时，变量具有中等空间自相关；块金系数>75%时，变量的空间自相关性微弱，变异主要由随机变异组成，不适合采用空间插值的方法进行空间预测。根据变异函数理论模型得出的相应参数见表2。

由表2可以看出：昌图县表层土壤有机碳密度的理论变异函数符合线形模型，块金值与基台值之比为15.18%，土壤表层有机碳密度的空间相关性较强，表明昌图县土壤有机质具有较强的空间相关性，区域性因素引起的变异占较大比例。究其原因，可能是昌图作为农业大县，土地利用、施肥、管理等随机因素对表层土壤造成一定程度的人为干扰。

在农业活动中，农民为提高粮食产量，常常大量使用肥料，导致土壤中的有机碳含量增加。另外，耕作能改变土壤结构，增加土壤生物的呼吸速率，从而使土壤中的有机碳含量减少。

2.3 土壤有机碳空间分布特征

采用ArcGis9.3地理信息系统软件中的地统计模块，分析土壤有机碳密度的空间分布特征，完成土壤有机碳克里格插值的空间分析。克里格插值法（Kriging）也称空间局部估计法或空间局部插值法，它建立在半变异函数理论及结构分析基础上，根据待估样点（或待估地块）有限邻域内若干已测定的样点数据，在认真考虑样点的形状、大小、空间相互位置关系以及它们与待估样点间的空间位置关系，半变异函数提供的结构信息后，对待估样点进行线性无偏最优估计，最终得出待估样点某些属性（或性状）的空间分布插值图。

图2是昌图县表层土壤有机碳密度的空间分布插值图，显示了不同级别养分含量的分布状况。

从图2可以直观地看出，昌图县南部和东部土壤的有机碳密度较高，多在1.98～2.70 g/kg之間；西北部有机碳密度较低，维持在1.26g～1.78 g/kg之间。总的来看，昌图县土壤有机质分布呈现东南部向西北部递减的规律。

3 结论与讨论

从经典统计学分析结果来看，昌图县表层土壤有机碳密度表现出强度变异，可能是日益增强的人类活动所致。地统计学分析结果表明，昌图县表层土壤有机碳密度的空间变异函数可以用线性模型进行拟合，表层土壤有机碳密度的空间相关性较强。Kriging插值图直观地描述了昌图表层土壤有机碳密度的分布格局。总的来看，有机碳密度呈现从东南部向西北部递减的规律，这与昌图的农田利用状况息息相关。

同时，研究存在以下问题：1）仅对深度0～20 cm的土层进行分析，不能全面细致的说明问题。若想计算有机碳的储量，则需采集剖面0～100 cm的土样。在今后的研究中，需要进行深层次的样品采集。2）表层土壤有机碳密度受人为因素影响很大，要获得更为准确详实数据，需在更多的地点进行土样采集，且采样点位也需进行进一步确定；3）对土壤有机碳含量的研究内容不够全面，拟在将来做更为深入的研究。

参考文献

[1] 潘根兴.中国土壤有机碳库及其演变与应对气候变化[J].气候变化研究进展，2008，4（5）：282-289.

[2] 金峰，杨浩，赵其国.土壤有机碳储量及影响因素研究进展[J].土壤，2000（1）：12-17.

[3] 薛正平，杨星卫，段项锁，等.土壤养分空间变异及合理取样数研究[J].农业工程学报，2002，7（4）：86-91.

[4] 雷志栋，杨诗秀.土壤特性时空变异性初步研究[J].水利学报，1985（9）：10-21.

[5] 陈彦，吕新.基于GIS和地统计学的土壤养分空间变异特征研究——以新疆农七师125团为例[J].中国农学通，2005，21（7）：389-

391.

空间统计篇4

空间统计 (spatial statistics) 是最近四十年发展起来的针对空间数据进行统计分析的统计学方法和工具, 尤其是地理信息系统 (Geographical Information System, GIS) 近十年来快速发展, 其集成数据的强大功能日益引人关注, 应用领域也不断拓宽, 逐渐超越单纯的地理研究, 被广泛应用于公共卫生、环境监测、区域经济等研究, 对所有与空间有关的数据进行统计分析。空间统计也正在超越只针对大体量空间的研究局限, 开始关注微小体量空间的统计关系描述, 这使针对人体不同位置和区域的统计学研究变得可能。

美国埃默里大学的杜波依斯.波曼 (F.Dubois Bowman) 在研究人脑时, 就运用空间统计的方法分析了由正电子发射断层扫描 (PET) 和功能磁共振 (fMRI) 提供的大量神经影像学数据, 因为“包括PET和fMRI在内的功能性神经影像学仪器在识别与实验性刺激和精神分裂症相对应的特定脑部位有着重要作用”。由PET和fMRI产生的数据不仅具有复杂的空间相关性, 而且还可通过重复扫描具有时间相关性, 这样通过调整响应数据可以引出一个已知的或独立的协方差结构。即使不理会来自脑扫描的图像信息单位 (voxels) 之间空间相关性的时间序列, 传统的图像信息单位分析方法也可对脑部活动有精确的分析。研究者“提议用一种二阶段的空间-时间模型去估计和测试定位活动, 这个二阶段模型是用空间的自回归分析去捕捉神经作用群之间的相关性”, 这里的神经作用群是指被“数据-驱动群分析” (data-driven cluster analysis) 这种分析方法定义的神经作用群。研究者“用最大似然法去估计其空间自我回归分析模型的参数”, 以“避免出现假设检验的第一种错误”即弃真错误, “探测出定点和区域的活动, 提供了脑部功能性联系信息, 建立了一种可以在空间上很流畅地显示每个人脑部活动的地图框架”[1]。

2 空间统计应用于中医学研究

传统统计学作为一种量化研究方法在中医学中的应用日益重要, 使中医学有可能从单纯的定性描述进入到定量描述阶段, 也使统计背后的逻辑规则与中医学的经验规则通过撞击可能产生积极的结果, 这是统计学应用于中医学研究后最值得关注的变化。当然, 目前统计学在中医学中的应用, 主要借鉴西医使用统计学的情形, 以及对传统统计学使用的情形, 并不包括统计学本身的新进展以及统计学应用的新进展。统计学对可重复性验证的要求以及“个体不能说明整体”的思想原则对中医学的“辨证论治”原则是一种挑战, 这种挑战的意义是什么, 还有待观察。

迄今还未见到空间统计应用于中医研究的报告和例证, 究其原因, 可能与统计学在中医的应用滞后于西医有关, 也与中医在空间量化方面的困难有关。

中医学在应用统计学上的滞后是不合理的, 也是可以改变的。统计学在中医学中的应用滞后也有一些好处, 比如有一个成熟的西医应用模型可以参照, 有一些应用的消极面可以避免等。但应用滞后也会产生统计学应用于中医研究的基础性问题, 这些基础性问题如果没有得到重视和解决, 其消极面在具体应用中会不断显现出来, 最后的累积效应会颠覆中医应用统计学的合理性基础。所以基础性问题是需要在应用之前就予以重视和讨论的, 特别是当这些问题不能借助西医的经验来解决时。比如, 统计学的适用性问题, 就涉及到中西医的差别, 即中医“辨证治疗”和西医“辨病治疗”的差别。归结到统计学, 就是如何看待个体与整体关系的问题。这个问题的讨论, 并不一定会否定统计学在中医研究中的合理性, 反而能帮助我们厘清统计学在中医的适用域, 即厘清在哪个层面上完全可用, 在哪个层面上有限可用, 在哪个层面上不可用或禁用。这个基础性问题可以和西医对照讨论, 也可以单独讨论。中医学在很多方面可以绕过西医, 直接和统计学对话。不仅可以让中医学对统计学更为敏感, 在应用前充分考虑具体统计学方法的基础性假设, 和统计学的最新成果保持同步, 其在应用中形成的应答可以反过来促进特定统计学的发展和深化。惟其如此, 中医统计学作为学科才名符其实, 而不是西医统计学的简单套用。空间统计在应用于中医之前, 这样的讨论也是必要的。空间统计在西医学研究中的应用还不够成熟, 但这不应该成为中医不去使用空间统计方法的理由。正因为西医学使用空间统计不够成熟, 才使得中医学有可能不受其应用模式的限制, 找到自己独特的适应性模式。

另一方面, 中医在空间量化方面的困难, 也可以随着研究的深入而不断克服。由于中医不是建立在形态学基础上的, 所以很容易得出中医不宜运用空间统计方法进行研究的结论。中医的脏腑藏象系统不是一个形态学结构, 更接近一个功能性结构, 所以直接套用空间统计的方法来研究“五脏六腑”, 可能确实“驴唇不对马嘴”。如果考虑到这个功能性结构描述的人体是一个实实在在的实体空间结构, 功能性结构和形态学结构虽然不能用对号入座的方式来强行对应, 但探寻二者复杂的对应关系也是有意义的。探寻特定的形态学结构如何整合成一个功能性结构, 或者描述特定功能性结构对应的形态学结构, 可以成为中医空间统计研究的一个方向, 而且空间统计的长处是通过不同数据的图层叠加集成发现和推断它们的统计关系。此外, 中医空间量化虽有困难, 但并不代表中医无空间量化的可能。考虑到中医是一个多层次多侧面的理论和实践体系, 所以未必不能找到可以适用的层次和侧面。比如, 从宏观层面看, 中医的健康观源于天人合一的和谐观, 既有人体内环境的和谐, 也有人体外环境的和谐。而中国国土广阔, 地理环境差异很大, 这种差异作为外环境对人体内环境的影响, 应该是中医关注的重点。这个地理环境自中医的基础理论建构完成以来, 已经历二千多年的变迁, 在近几十年的现代化过程中变迁尤为剧烈, 已呈现足够长的历时性。所以, 人体外环境是一个宏大的时空系统, 需要一个精确的时空模型来加以描述和推断, 空间统计当仁不让。从人体内环境来看, 虽然脏腑藏象系统是一个功能性结构, 经络存在与否尚有争议, 但对腧穴的存在和精确定位有着广泛认同。至少腧穴是一个可以空间量化的空间对象。中医的空间统计运用完全可以从腧穴的定位开始, 建立一个空间坐标系。这样, 中医完全有可能沿着自身方向而不是模仿西医的方向, 来建构一个中医空间统计学模型, 并绘出人体活动的可视性四维地图。

3 空间统计应用于中医学研究的三种可能方向

空间统计应用于中医学研究至少存在三种可能的方向:

(1) 以腧穴为定位基础的中医化研究。腧穴定位只是确定了空间数据的参考坐标系, 相应点位上属性数据的获取则可能有多种途径。以腧穴为定位基础的中医化研究, 就是从纯粹中医的角度, 假定连接腧穴的是不同于西医的任何一种循环系统的经络, 通过声、光、电、磁、波等测量手段, 从腧穴和循经线路上获取数据, 以此为基础建立关于腧穴、经络乃至脏腑、藏象系统的数学模型, 对它们之间复杂的相关性进行统计分析, 最后绘出从腧穴到经络再到脏腑和藏象系统的人体四维地图。这一路径在过去的几十年里积累了一定的实验研究成果, 近年来还有人尝试了用同步辐射X射线成像和光谱学技术来研究穴位点化学元素富集状况[2]。

(2) 以腧穴为定位基础的中西医整合研究。仍然以腧穴定位来确定空间数据的参考坐标系, 但不假定连接腧穴循环系统的性质, 或假定经络的物质基础是神经节段, 但整体连接是经络特有的, 以多种测量手段去广泛获取点位及区域数据, 然后在这些数据的基础上建立模型, 并把这个模型还原成人体四维地图。中西医整合研究不完全等同于中西医结合研究, 它中性地看待关于经络的多元假设, 然后在数据分析中对假设加以取真或弃假。

(3) 以腧穴为定位基础的西医化研究。仍然以腧穴定位来确定空间数据的参考坐标系, 西医化的研究角度则主要体现在对连接腧穴循环系统的看法上, 认为经络并非一个独特的循环系统, 而是假定它就是神经系统或血管系统或它们的复合系统[3]。属性数据的获取可以广泛依赖西医在神经系统和血管系统上的测量手段, 以此建立从腧穴到神经和血管再到各器官乃至全身系统的人体数学模型, 并把这个模型还原成可视的人体四维地图。

参考文献

[1]F.DUBOIS BOWMAN.Spatio-temporal modeling of localized brain activity[J].England:Biostatistics, 2005, 6 (4) :558-575.

[2]闫晓辉.穴位物质基础的同步辐射X射线成像和光谱学研究[D].上海:复旦大学, 2007.

空间统计篇5

地统计 (Geostatistics) 又称地质统计, 是在法国著名统计学家Matheron G大量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础, 借助变异函数, 研究既具有随机性又具有结构性, 或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性, 或空间相关性和依赖性, 或空间格局与变异有关的研究, 并对这些数据进行最优无偏内插估计, 或模拟这些数据的离散性、波动性时, 皆可应用地统计学的理论与方法。

气象站点是有限的, 而且只能代表一定区域内气象要素的分布情况, 对广大非气象站点所在区域内气象要素的分布情况只能通过推算求得。随着现代生态学和全球变化科学的发展, 迫切需要高时空分辨率、空间栅格化的气象要素数据。近年来, 基于地理信息系统 (GIS) 技术, 利用地面观测的气象资料研究气象要素栅格化方法, 已成为国内外生态学、地学研究的重要任务之一[1,2]。

20世纪80年代, 以傅抱璞、翁笃鸣、卢其尧等为代表的学者通过数值统计模拟方法 (如分离综合法、统计模拟法、回归余项法、小地形温差估算法等[3,4,5]) 获得了非气象站点所在区域内气象要素的空间分布情况。20世纪90年代以来, 随着GIS技术在我国国内的迅速发展和应用, 在GIS应用软件中提供了许多空间插值方法, 为研究气象要素的空间分布提供了解决途径[6,7,8,9]。常用于气象要素空间插值的方法有反距离权重法 (Inverse Distance Weighing) 、多项式插值法 (Interpolating Polynomials) 、克里格法 (Kriging) 、样条插值法 (Spline) 等[10,11,12,13]。

本文利用3种方法对黄土高原南部地区139个台站的气温和降水进行了空间插值, 并利用交叉检验法对结果的精度进行了评估。这3种方法分别为:径向基函数插值法 (Radial Basis Function) 、普通克里格法 (Ordinary Kriging) 和反距离权重插值法 (Inverse Distance Weighing) 。

2 数据来源与方法

2.1 数据来源

气象资料为黄土高原南部地区139个气象台站年均气温、年均降水量数据及黄土高原南部地区范围的矢量数据。其中, 黄土高原南部地区气象台站的空间分布见图1。

2.2 径向基函数法 (Radial Basis Function)

径向函数是指峰状型的函数, 如高斯函数:

undefined

式中, x、x0为n维的向量, ‖x-x0‖=

undefined。

径向基函数 (Radial Basis Function) 插值法 (Multiquadric方法) 采用的插值函数为[6]:

undefined;[ (x-xj) 2+ (y-yj) 2+c2]1/2, j=1, 2, …, n。

式中, c为常数, 一般取1。将n个点 (xi, yi) 的实测值fi代入上式建立联立方程:

undefined

式中, fi为气象站点气象要素值, n为用于气象要素插值的气象站点数目。求解此线性方程组可获得待定系数aj (j=1, 2, …, n) , 将这些值代回插值函数式, 即为通过各实测数据点且处处连续光滑的曲面方程。在数据点数量不大的情况下, Multiquadric法计算简单。近20年间该方法在水文测量、大地测量、地质及采矿、地球物理等领域得到广泛应用, 效果良好。

2.3 普通克里格法 (Ordinary Kriging)

普通克里格法是利用区域化变量的原始数据和变异函数的结构特点, 对未采集样点的区域化变量取值进行线性无偏最优估计的一种方法。使用公式表示为[14]:

undefined

式中, Z为待估计的气象要素栅格值, λi为赋予气象站点气象要素的一组权重系数, n为用于气象要素插值的气象站点数目, (xi) 为气象站点气象要素值。为满足无偏性和最优性两个条件, 通过建立以下克里格方程组来确定权重系数。

undefined

式中, C (υi, υj) 为气象站点之间的协方差函数, C (υi, V) 为气象站点与插值点之间的协方差函数, μ为拉格朗日乘数。

2.4 反距离权重法 (Inverse Distance Weighing)

逆距离权重法是对采样点进行线性加权来决定输出的栅格值, 加权与距离成反比, 输入点离输出栅格越远, 它对输出栅格的影响越小。使用公式表示为[15]:

undefined

式中, Z为待估计的气象要素栅格值, Z (xi) 为第i (i=1, 2, …n) 个气象站点的气象要素值, n为用于气象要素插值的气象站点数目, di为插值点到第i个气象站点的距离, p为距离的幂。

2.5 数据处理

利用地理信息系统软件ArcGIS 9.3的空间分析模块 (Spatial Analyst) 和地理统计模块 (Geostatistical Analyst) [14,15]提供的3种插值方法:径向基函数插值法、逆距离权重法和普通克里格法, 并且在插值的过程中针对不同数据提供了最优参数, 选择最优参数的唯一标准是在交叉检验中得到最小的均方根误差。属性数据的处理采用Excel 2000。主要工作为:将139气象站点的经度、纬度和年均温与年降水量数据在ArcGIS中生成点shp文件, 分别使用3种空间插值方法 (径向基函数插值法、逆距离权重法和普通克里格法) 生成年均温栅格图和年降水量栅格图, 并使用交叉检验法检验插值精度。

2.6 检验方法

采用交叉检验 (Cross-validation) 法对年均温与年降水量的空间插值结果进行精度检验。即假设某一个气象站点的气温 (降水量) 未知, 用其他所有气象站点来估算该气象站点的气温 (降水量) , 通过计算所有139个气象站点的实际气温值 (降水量) 与估算值之间的误差来评判空间插值方法的精度。一般用平均绝对误差、均方根误差作为检验精度的标准。前者反映了样本数据估值的总体误差或精度水平, 后者反映了样本数据的估值灵敏度和极值。

3 结果分析

3.1 不同插值方法预测回归方程与误差检验

通过比较径向基函数、反距离权重和普通克里格的均值 (Mean) , 标准平均值 (Mean Standardized) , 均方根预测误差 (Root_Mean_Square) , 平均标准误差 (Average Mean Error) , 标准均方根预测误差 (Root_Mean_Square Standardized) , 见表1。从表1可见, 3种空间插值方法对研究区域气象要素进行统计内插的效果都比较好。对气温来说, 径向基函数法最好, 其次是反距离权重法和普通克里格法最好;对降水来说, 普通克里格法最优, 均方根法预测误差最小, 由此可见普通克里格法的精度较高。

3.2 不同插值方法气象要素预测值空间分布

图2 (见封二) 与图3 (见封二) 分别为黄土高原南部地区年平均温度和年降水量的插值结果。由图2、图3可知:①年平均温度范围为4.605—14.548℃, 10℃以上的地区主要分布在关中平原西南部, 天水市的东南部, 河南省的三门峡市和洛阳市、荥阳县、巩县, 山西南部的大部分地区。年平均温度是指一年中最热月份和最冷月份的平均温度之差。影响气温变化的因素较多, 主要有经纬度位置、太阳辐射强度、大气状况、下垫面性质等。本文温度较高的地方主要分布在研究区的南部, 其一是因为低纬度地区气温的年较差幅度小于高纬度;其二是因为大部分城市分布在南部, 使大量的废弃颗粒存在于空中, 增强了大气对地面的保温作用。②年降水量范围在264.125—884.903mm之间, 降水量多的地区主要包括关中平原、天水市、山西东部和河南省的洛阳市、荥阳县、巩县。降水量用来表征某地区降水的多少, 受地理位置、大气环流、海陆位置、下垫面性质、人类因素的综合影响, 该研究区降水量多的地区植被覆盖度较高, 水分充足, 空气中的水分容易凝结产生降雨;而降水少的地区空气中水分含量较少, 不易成云致雨。

4 结论与讨论

空间统计篇6

图像检索是计算机视觉中非常重要的部分,其目的是构造自动处理某些信息的机器系统,用以代替人类完成分类和辨别的任务。目前图像识别检索的研究主要涉及物体表面形状检索、尺寸与面积的检测以及色彩的检索等方面。颜色是物体重要的外在特性,具有对物体本身的尺寸、方向、视角等依赖性小、鲁棒性高等优点,因而在图像识别中占有重要地位,对彩色图像的处理己经成为当前图像处理领域重要的研究课题[1],如:近年来,国内外对农产品品质自动检索、彩色印刷及纺织品中的彩色图样的检索研究中,都采用了基于图像的颜色检索技术。

1 图像检索技术一般算法

1.1 颜色空间

在计算两幅图像的相似度时,通常要提取它们的颜色特征在特定的颜色空间进行比较。颜色空间的目的是按照某种标准利用基色表示颜色,常用的有RGB、HSI、HSV等。RGB颜色空间的相似不能代表颜色的相似。例如,查询图像上RGB颜色是(200,150,0),图像库图像的RGB颜色是(200,200,0),这两幅图像在RGB颜色空间上很相似,但在颜色上差别很大(黄色和绿色)[2]。HSI和HSV颜色空间则没有这个方面的问题,它们很适合人们肉眼的分辨,较好地反映人对颜色的感知和鉴别能力[3,4]。故在此采用HSI颜色空间。通过(1)-(3)公式[4],可以将图像从RGB颜色空间转换到HSI颜色空间。

1.2 颜色量化

一幅图像的颜色种类通常非常的多,如果直接计算相似度,会消耗很大的特征存储空间。实验表明,增加颜色直方图的维数可以有效地提高检索的精度,但当维数增加到一定程度时,检索的精度提高很小而且可能下降[5]。但如果对颜色进行适当的量化后再计算,计算量会少许多,且计算效率得到提高。颜色量化是指将H,S,I 3个分量按人的颜色感知进行非等间隔的量化,然后对颜色模型的大量分析和计算。故在此对HSI颜色空间进量化,把色度量化成8个空间,把饱和度分成3个空间,把亮度分成3个空间,即颜色空间被分成72区间。具体量化值如下:

1.3 图像描述

图像有多种描述方式,颜色直方图就是其中之一。颜色直方图描述了图像颜色在颜色空间上的分布。常见的直方图有两种:统计直方图,累加直方图。

借助图像特征的统计直方图可以描述图像。图像特征的统计直方图是一个一维离散函数,如公式(7)所示。在公式中k代表图像的特征取值,L是特征可取值个数,nk是图像中具有特征值为k的像素的个数,N是图像像素的总数。颜色直方图有许多的优点:对图像进行旋转之后,它的颜色直方图不发生改变;颜色直方图容易提取,且比较容易计算两个直方图之间的相似度。

图像特征的累加直方图是一个一维离散函数,计算公式如(8)所示。公式中k代表图像的特征取值,L是特征可取值个数,nk是图像中具有特征值为k的像素的个数,N是图像像素的总数。累加直方图能增加直方图的鲁棒性[4]。

1.4 图像分块

两幅图像的颜色直方图相似,两幅图像的内容可能不相似,这主要是由颜色的空间分布不同引起的。一般来说,图像可分为主体部分和背景部分,如果不进行分块,那么背景部分的颜色信息就会混入到主体部分。通过对图像进行分块,提取各个区域的直方图,就可以获得图像的空间分布信息。

传统的分块方法将图像分成m*n部分,这样并没有突出图像的重要信息,故在此采用另外一种分块方法进行分块。首先,将图像分成8×8区域,如表1所示。其次,将图像的64个区域重新组合成12个区域。R1={I1},R2={I8},R3={I57},R4={I64},R5={I2,I3,I4,I5,I6,I7},R6={I9,I17,I25,I33,I41,I49},R7={I58,I59,I60,I61,I62,I63},R8={I16,I24,I32,I40,I48,I56},R9={I10,I11,I12,I18,I19,I20,I26,I27,I28,I29,I36,I37},R10={I13,I14,I15,I21,I22,I23,I28,I29,I30,I31,I36,I37},R11={I28,I29,I34,I35,I36,I37,I42,I43,I44,I50,I51,I52},R12={I28,I29,I36,I37,I38,I39,I45,I46,I47,I53,I54,I55}。其中,R1、R2、R3和R4是最不感兴趣的区域,R9、R10、R11和R12是图像的主体部分。R9、R10、R11和R12都包含图像的中心部分I28、I29、I36和I37。这种重叠方式的分块方法突出了图像的主体部分的颜色信息,有利于提高检索精度。

1.5 统计直方图

对HSI空间进行量化后,H的取值范围为[0,1,…,7],S的取值范围为[0,1,2],I的取值范围为[0,1,2]。通过公式(9)将HSI合成为一维特征矢量,使H,S,I三个分量在一维矢量上分布开来。在公式(9)中,色调H取的权重为9,饱和度的权重为3,亮度的权重为1。由于色调包含了绝大多数的信息,将色调的权重取大一些,将饱和度和亮度的权重取小一些。根据公式(9),得到G的取值范围为[0,1,…,71]。

图像颜色特征的表达方式有许多种,本文采用统计直方图技术进行特征描述。通过3.3,将图像分成12个区域。通过公式(7),提取这12个区域的统计直方图。这样,一幅图像就可以得到12个72维的颜色直方图,如公式(10)和图1所示。

1.6 图像之间的相似度

计算图像之间的相似度是图像检索非常重要的一步。因为得到图像特征的直方图之后,需要计算直方图间的相似度量,根据它对图像进行排序,检索出相似度最高的图像。常见的直方图的相似度量方法有直方图相交法、欧式距离法、相关系数法。

1.6.1 直方图相交法

HQ(k)和HD(k)两幅图像某一特征的统计直方图,两图像之间的匹配值P(Q,D)可借助直方图相交来实现。

1.6.2 欧式距离法

直方图间的距离可使用一般的欧式距离函数ME(Q,D)来衡量。欧式距离越小,图像之间越相似。

1.6.3 相关系数

相关系数在-1到1之间,-1表示两幅图像互不相关,1表示两幅图像完全一样。

1.7 相似度评价

检索率(recall)定义为检索结果队列中检索到的目标图像数与数据库中全部的目标图像数之比,如公式(9)所示。在公式(9)中,R代表查询结果中与查询图像相关的目标图像数,F表示表示图像库中与查询图像相关的目标图像总数[6]。

精确度(precision)定义为检索结果队列中检索到的目标图像数与检索结果队列中所有的图像数之比,如公式(18)所示。在公式(18)中,R代表查询结果中与查询图像相关的目标图像数,X代表检索结果返回的图像总数[6]。

假设Q代表查询图像,P代表数据库中的图像,通过公式(8)得到HQ和HP。本文采用相关系数法(13)先将HQ和HP对应区域的相似度计算出来,再将它们加权求和,如公式(19)所示。由于R1、R2、R3和R4是最不感兴趣的区域,R5、R6、R7和R8是图像的次感兴趣区域,R9、R10、R11和R12是图像的主体部分,故在(19)中取不同的权重w1、w2、w3。

2 算法实现

该文算法的大致流程如图2所示。其中,特征库预先在后台处理,具体流程如图3所示。

3 实验结果

该文选取1000幅图像组成数据库,这个数据库由10类图像组成,每类有一百张图片,包括花卉、人物、海滩、建筑、汽车、恐龙、大象、马、雪山、美食等。为了测试本文算法的效果,从花卉中选取10幅图像进行检索。本文固定查询返回的图像为13幅,根据公式(18),计算出精确度。

改文对图像进行重叠方式分块,R1、R2、R3和R4是最不感兴趣的区域,R5、R6、R7和R8是图像的次感兴趣区域,R9、R10、R11和R12是图像的主体部分。因此,赋予w1较小的权重,赋予w3较大的权重。由表2可知,当w1、w2、w3选取不同的权重时,检索效果不一样,当w1、w2、w3分别为0.025、0.045、0.18时,实验效果最好。

实验中综合图像的颜色和空间进行图像检索,其查询结果如图4所示。由实验结果可知,上述方法对图像的背景变化具有一定的鲁棒性,而且在图像的颜色及空间特征的相似性上具有较好的检索率。

4 结论

本文给出了一种基于HSI颜色空间统计直方图进行图像检索的方法,使用符合人类特性的HSI颜色空间并将空间量化为72种具有代表性的颜色。为了克服全局直方图丢失颜色空间信息的缺点,使用重叠方式分块方法将图像分成12个区域并突出图像的主体部分。统计图像12个区域颜色直方图,并根据相似度计算方法计算查询图像和数据库图像对应区域的相似度。最后根据各块子区域的重要性进行加权求和,得到最后的检索结果。

摘要：给出了一种对图像的特征进行提取、分析并识别出一定形状及色彩差别的方法,主要目的是提取图像的颜色变化。首先是对采集到的彩色图像进行预处理,包括:图像的滤波、目标图像的定位等;然后采取了相应的图像颜色空间和识别算法,包括:图像颜色空间的变换、颜色量化、图像特征提取、识别算法。计算机仿真结果表明,该算法可行,并取得了较好的效果。

关键词：颜色空间,颜色量化,特征提取,识别算法

参考文献

[1]JingChang.S Ravi Kumart.Image indexing Using Color Correlo-grams 1063-6919/97 1997 IEEE.

[2]汪慧兰,赵海峰,罗斌.基于局部颜色空间特征的图像检索[J].计算机技术与发展.2006,16(1):76-79.

[3]钱瑛,须文波.基于颜色空间特征的图像检索[J].江南大学学报(自然科学版).2007,6(2):159-162.

[4]王剑峰,肖国强,江健民.基于HSI色彩空间累加直方图的图像检索算法[J].计算机工程与科学.2007,29(4):55-58.

[5]杨关良,李忠杰,徐小杰.基于颜色-空间的图像检索算法[J].工程图学学报.2005,(3):50-53.

空间统计篇7

空间信息统计(地质统计学)是从地质采矿学科中创立起来的。它不仅可以研究数据的随机性,同时还研究数据的空间相关性。一般来说,自然界中与空间位置有关的数据都具有随机性和空间相关性。随着人们对空间信息统计方法的认识的不断深入,它已被广泛应用到地球科学、资源勘查、环境科学、土木工程、交通工程、气象学、农业学、林业学、信息处理等多种学科。本文运用地质统计学原理,对城市地表水的水质的空间分布状况进行计算机模拟,为水环境保护提供理论依据。

1 空间信息统计学原理

空间信息统计学的核心内容包含两个部分:一是变差函数;二是克立格估值。

1.1 实验变差函数计算

设(xi,yi,zi)(i=1,2,…,n)为一组观测值,其中xi,yi为第i个观测点上的坐标,zi为变量在第i个观测点上的观测值。称下列公式:

$γ^{*} (h) = \frac{1}{2 Ν (h)} \sum_{i = 1}^{Ν (h)} [z (x_{i}) - z (x_{i} + h)]^{2} (1)$

为实验变差函数。式中:γ*(h)为实验变差函数值;xi为观测点的坐标,在二维空间中它代表(xi,yi);z(xi)为i点上的观测值;z(xi+h)为距i点的距离为h的那一点的观测值;h为两观测点之间距离,称为滞后距;N(h)为相距为h的点对的数目。

最小的滞后距称为基本滞后距。在实际计算中不同的滞后距一般是成倍增加的。对不同的滞后距h,公式(3)可以算出相应的实验变差函数值γ*(h)。对每一滞后距hi,把诸点[hi,γ*(hi)]在h～γ*(h)图上标出,所提到的图形称为实验变差函数图,或实验变差图。实验变差函数具有方向性,按照某一方向取滞后距h,可得该方向上的实验变差函数[1]。

1.2 理论变差函数模型

在实际应用中,运用最小二乘法原理将实验变差函数点[hi,γ*(hi)]拟合成理论变差函数模型。常用的理论变差函数模型是球状模型。球状模型变差函数的数学表达式为[1,2]

$γ (h) = {\begin{matrix} 0 & h = 0 \\ C_{0} + C (\frac{3}{2} \cdot \frac{h}{a} - \frac{1}{2} \cdot \frac{h^{3}}{a^{3}}) & 0 ＜ h \leq a \\ C_{0} + C & h ＞ a \end{matrix} (2)$

式中:a为变程;C0为块金值;C为拱高;C0+C为基台值。球状模型变差函数的如图1。

从球状模型理论变差函数图1上我们可以看出:变差函数在0～a(变程)范围内,γ(h)随h的增大而增加,因此a变程反映了变量相关性的范围;当h>a时,变差函数γ(h)就不再单调增加了,而是稳定在基台值C0+C附近,说明变量的变化性与距离无关了,这就反映了变量的随机性特征。基台值C0+C反映了变量变化性的大小;块金值反映了变量连续性优劣。

1.3 克立格估值与克立格方差

该估值方法是南非采矿工程师克立格(D G Krige)首次提出来的,故称为克立格估值[3]。设观测点上的观测值为{Zi,i=1,2,…,n}。用已知点上的数值来预测(估计)未知点上的值称为估值。通常采用的线性估计式为

$Ζ_{0}^{*} = \sum_{i = 1}^{n} λ_{i} Ζ_{i} (3)$

式中:Z*0为未知点上的估计值;λi为权系数。显然估计值精度优劣完全取决于λi的确定。克立格估值的权系数λi是在“无偏”和“方差最小”的前提下导出的,所以它是一种最优线性无偏估计量(The Best Linear Unbiased Estimator)。

(1) 无偏性条件。

设Z*0为某一点的估计值,Z0为该点上的真实值,估计总会有偏差的Z*0-Z0,但我们总可以使这偏差值的数学期望满足无偏性条件:

$E (Ζ_{0}^{*} - Ζ_{0}) = 0 (4)$

(2)方差最小性条件。估计值与真实值之差应满足:

$var (Ζ_{0}^{*} - Ζ_{0}) = \min (5)$

满足上述两条件的估计值称为最优估计。根据最优估计的条件可以导出求克立格估值权系数λi的方程组,简称克立格方程组:

${\begin{cases} \sum_{j = 1}^{n} λ_{j} γ (x_{i}, x_{j}) + μ = γ (x_{i}, x_{0}) \\ \sum_{j = 1}^{n} λ_{j} = 1 \end{cases} i = 1, 2, \dots, n (6)$

克立格方差σ $_{Κ}^{2}$ 则可表示为:

$σ_{Κ}^{2} = E [(Ζ_{Κ}^{*} - Ζ_{0})^{2}] = \sum_{i = 1}^{n} λ_{i} γ (x_{i}, x_{0}) + μ (7)$

其中:x0为未知点(待估点)坐标,在二维空间中它表示(x0,y0);xi为观测点(已知点)坐标,在二维空间中它表示(xi,yi);γ(xi,xj)为观测点i与j之间的变差函数值;γ(xi,x0)为观测点i与待估点之间的变差函数值;μ为拉格朗日乘数;Z*K为用克立格方程组求出权系数得到的估计值,简称克立格估计值。

2 城市地表水质参数空间变异性分析

水质参数是与空间位置有关量,它既有随机性又有相关性。因此用空间信息统计方法研究水质参数空间的变化性可以得到相关性及随机的特征,同时在未知点上也能得精度较高的估计值。笔者对我国南方某城市区取水数据进行了研究。选取了136个水样点数据,对水样中氨氮(NH+4-N)、总磷(TP)、高锰酸盐指数(COD)的含量进行了分析研究,求得了变差函数参数,并绘制了克立格等值线图。

2.1 实验变差函数

(1)数据采集。

笔者在研究区域内,选择了136个水样收集点,经分析测试得到136个水样点的氨氮(NH+4-N)、总磷(TP)、高锰酸盐指数(COD)含量数据。每个水样点上的坐标为(xi,yi)(i=1,2,…,136),含数值为(zi)(i=1,2,…,136)。

(2)变差函数计算。

将分析测试得到的水样点的氨氮含量数据,根据公式(1),分别对东西方向和南北方向[3,4,5],对每一个hi可以求得实验变差函数数值γ*(hi)。对于本研究实例hi取为(50,100,150,200,250)。在求得实验变差函数值数据对[hi,γ*(hi)]的基础上,运用最小二乘法,将实验变差函数点拟合成理论变差函数模型,得到相应的理论变差函数参数(见表1)。

表1中的变程(a)是指变差函数值在某一常数上下摆动或趋于稳定时的间隔距离,用来表征各个水质参数的空间自相关范围,对于不同方向上的距离数值而言,超过这个值,各个水环境指标的含量在此方向上不具有空间相关关系,可以把其含量当作是相互独立的随机变量;反之,则当作区域化变量处理。从表1中可以看出,3个水质指标均在一定范围内存在空间相关关系,只是不同因子在不同方向上的相关性略有差异。块金值(C0)通常表示由实验误差和小于实验取样尺度引起的变异,即随机部分引起的空间变异性,基台值(C0+C)表示系统内的总变异。对于研究区河流而言,各水质参数的空间变异性如何,可用块金值(C0)与基台值(C0+C)之比描述,其反映的是空间变异成分中随机因素和河流空间结构本身谁占主导作用。由表1的计算结果得出的这个比值都小于0.5,说明都是空间结构本身引起的变异要大于随机因素引起的变异,一定程度上,这也与各河段自身的空间分布格局有关。

2.2 水质的计算机模拟

为了更准确和直观地描述地表水NH+4-N含量分布,在建立了理论变差函数的基础上,可以对研究数据进行克立格估值[6]。克立格估值是一种最小方差无偏估计,根据克立格估值原理,用公式(6)给出的克立格方程组,对参数136个水样点数据,进行克立格法估值。

图2至图4分别给出了氨氮(NH+4-N)、总磷(TP)、高锰酸盐指数(COD)含量分布的等值线图。

从上图2上可以看出, 该地区NH+4-N的含量的变化趋势明显,在中中间部位北方偏高,南方偏低。北方的中间NH+4-N的含量出现特高值,NH+4-N污染情况比较严重。究其原因,是该区域内工业企业废水以及居民生活污水的无序排放等因素造成。西南和东南的两个小“山包”,分别反映的是污水处理站的位置,和居民集中居住区。根据分析和研究结果,直观显示NH+4-N的含量分布规律,为环保部门,确定治理措施、治理顺序,提供可靠的理论依据。

从图3中可以看出,研究区的南北部和中心部位都有TP含量较高区域,尤其是西南部。这些TP含量较高反映了城市的高新区和工业园区,区域内工业企业密集,污水排放,对河流水质的危害较大。中间部位为古城区,说明生活污水对区域内河流的影响也不容小视。

从图4中COD含量的空间等值线分布图可以看出,整个研究区的中东部河流COD浓度的分布比较均匀,其值基本都处在《地表水环境质量标准》的Ⅳ类和Ⅴ值之间。而研究区的西部河流的COD含量明显高于上述部位。根据实地调查发现,主要是该地区由于污水管网不够完善,导致河道受生活污水的影响严重;加上一些城市建设工程对河道的影响,使得河道滞留及污泥淤积严重,河水中含有大量的有机物,导致了河流的COD浓度高于其他地区。

3 结语

(1)空间信息统计学是研究与空间位置有关变量(区域化变量)空间变异性的有效工具和方法,变差函数及其参数能够对区域化变量的空间分布的结构性特征进行定量描述,从而揭示区域化变量的空间变化规律。

(2)运用空间信息统计学对地表水水质量进行三维立体模拟,可以直观显示水质的空间变化规律,有助于分析研究区河流受污染的异常区域及主要污染来源,从而可以针对不同的研究区域给出相应的河水污染防治办法。

(3)本文仅对水质的氨氮含量指标进行了分析,对于水质的其他指标同样能进行空间信息统计分析。如果配合GIS、GPS等辅助手段确定和记录取样点的位置,这可以研制出水样的管理信息系统,或绘制水样水质参数的分布图和评价图等系列图件,进而为水环境管理提供咨询服务。

参考文献

[1]孙洪泉.地质统计学及其应用[M].江苏徐州:中国矿业大学出版社,1990.

[2]孙洪泉,康永尚,杜惠之.实用地质统计学程序集[M].北京:地质出版社,1997.

[3]邢君,孙洪泉,李维涛.岩土性质的空间信息统计分析[J].岩土工程技术,2004(1):5-7.

[4]张征,赵俊琳,王红旗,等.水环境污染物迁移参数空间变异性分析原理与方法[J].北京师范大学学报(自然科学版),1994,34(4).

[5]袁郑明,陈同斌,陈煌,等.北京市郊土壤的空间结构及分布特征[J].地理学报,2003,58(3).

空间统计篇8

旅游空间结构是一定区域内旅游要素组织在空间上的投影,是旅游要素相对区位关系和分布的表现形式。它是在长期旅游发展过程的累积结果,旅游空间结构是否合理直接影响到旅游目的地能否健康、持续发展[1]。目前,有关旅游空间结构的研究主要表现在四个方面。①研究对象众多,包括旅游地(区)空间结构、旅游业空间结构、旅游客源地空间结构等,其中最重要的和关注最多的是旅游地(区)空间结构。②研究内容丰富,主要集中在两个方面:一是空间格局分析,主要研究空间分布、空间差异化和空间关系;二是时间演变研究,主要研究空间结构构建和空间结构演化问题。③研究理论广泛,主要有点—轴理论、核心—边缘理论、中心地理论等理论。但多是人文学、社会学理论方法,运用地学方法定量研究有待进一步深入。④研究方法多样,在旅游空间定量研究方法中,根据统计分析方法的运用情况分为基础统计分析(均数、频数、相关分析)、复杂统计分析(回归分析、因子分析、聚类分析等)[2]。无论是哪种统计分析都是在大量取样的基础上对样本点进行相应的数据分析,确定其空间结构。但经典统计学所采取的样本缺乏空间信息,地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的缺陷[3]。因此,引入地统计学理论,通过空间插值来研究旅游空间形态、空间等级、空间格局与空间关系,已成为研究旅游空间结构的一个全新视角。

1 地统计学理论

地统计学(Geostatistics)又称地质统计学,由法国统计学家Matheron G在大量理论研究的基础上逐渐形成的一门新的统计学分支[3]。经过不断完善和发展,目前普遍接受的概念为:“地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。”我国于20世纪70年代末开始引入地统计学,其研究方兴未艾,尤其在地统计学的应用方面,给予了极大关注,研究成果显著。

1.1 理论基础[4,5,6]

地统计学的理论基础是区域化变量理论,主要研究那些分布在空间并显示出一定结构性和随机性的自然现象。区别于经典统计学方法的最大特点是:地统计学所研究的变量是区域化变量,考虑样本的空间位置和方向,能区别不同空间格局的差异。它不仅可研究空间分布数据的结构性和随机性、空间相关性和依赖性、空间格局与变异,还可对空间数据进行最优无偏内插,以及模拟空间数据的离散性与波动性。当一个变量呈现为空间分布时,就称之为“区域化变量”。这种变量常常反映某种空间现象的特征,用区域化变量来描述的现象称之为区域化现象。随机函数概念列入地质统计学,用于处理既有结构性又有随机性的地质特征。一个随机函数表述为:①在任意点x处z(x)为一个随机变量;②点x1、x2处的随机变量z(x1)、z(x2)通常是不独立的。第一个特点反映了区域化变量的随机性,第二个特点体现了空间变量的结构性。这两个看似自相矛盾的特征,是区域化变量最显著和最重要的特征。

从地质及矿业角度来看,区域化变量还具有以下几种属性:①空间局限性。区域化变量被限制于一定空间范围内,该空间称为区域化的几何域,是按几何支撑定义的。②连续性。不同的区域化变量具有不同程度的连续性,这种连续性是通过区域化变量的变异函数来描述的。③异向性。当区域化变量在各个方向上具有相同性质时称为各向同性,否则称为各向异性。④区域化变量在一定范围内呈一定程度的空间相关,当超出这一范围之后相关性变弱以至消失,这一性质用一般统计方法很难识别。⑤对任一区域化变量而言,特殊的变异性可叠加在一般的规律之上。

1.2 研究方法

地统计分析的核心就是通过对采样数据的分析、对采样区地理特征的认识来选择合适的空间内插方法创建表面[3],主要包括空间结构分析和空间插值两部分[7]。空间插值研究的本质是通过空间建模来拟合生成充分逼近要素空间分布特征的函数方程[8]。根据地统计学两大研究学派,可将地统计学分析方法分为两种:一是参数地质统计学派形成的简单克立格、普通克立格、泛克立格以及析取克立格等方法,二是非参数地质统计学派形成的指示克立格、概率克立格以及指示条件模拟等方法[9]。

1.3 应用领域

100多年前,地统计学就开始在地质科学中应用,主要是根据地质勘探所取得的大量信息对地质矿产资源进行定量估计和评价。早期的应用基本上属于研究开发性质,随后进入生产实践阶段,为生产所用。地质统计学应用方法基本上属线性地质统计学范围,其他方法涉及得较少[5]。随着地统计学理论的发展,其应用范围已从早期涉及地质、地球物理等领域发展到生态、土壤、气象、水文等领域。

1.4 应用技术

在地统计学软件方面,国内外具有代表性的有长沙有色冶金设计院的矿化模型CAD管理系统、CGES中文地质勘探系统软件、KPX2.0固体矿产勘查评价自动化系统、加拿大的GEOSTAT软件、美国的GS+for windows软件等[10,11]。美国ESRI开创性地将地统计分析工具与GIS 相结合,在其1999 年发布的ArcGIS 8.01 版本中嵌入了地统计分析模块。该模块可很方便地进行空间数据分析、结构分析、半变异函数建模以及表面预测和结果评估,同时它还提供了用确定性方法进行高级表面模拟的工具[11]。

2 在旅游空间结构研究中的应用

经典统计学所采取的样本缺乏空间信息,而地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的缺陷[3],凭借其强大的空间分析能力,有利于旅游空间结构研究的深化。

2.1 在旅游空间结构研究中的应用进展

地统计学应用范围十分广泛,早期涉及地质、地球物理等领域,主要是在矿产储量计算、石油及煤田工作中的应用,目前已涉及生态、土壤、气象、水文等领域,但在旅游方面的应用还很少。随着GIS与旅游的紧密结合,空间分析功能的不断提高,使运用地统计学来研究旅游问题的可能性越来越大。钟士恩、张捷等人计算出全国31个省(市、自治区)的出游力,并采用ArcGIS9.2样条曲线插值法,标出5条中国省际出游力等值线,得出中国省际出游力地域空间形态[12]。这一研究不仅为旅游空间结构问题带来新的方法和工具,而且推动数字高程模型(DEM)模拟的对象由“实体属性表面”向“非实体属性表面”发展、由静态的自然地表向动态的人工地表延伸。

2.2 在旅游空间结构研究中的应用方向分析

地统计学理论要应用于旅游空间结构研究,必须对与旅游空间相关的问题做出合理的解释,而且这种解释能够弥补传统旅游空间结构研究中的欠缺和不足,在一定程度上丰富旅游空间结构研究的广度和深度,对实践具有一定的指导意义。基于旅游区域是全部基本旅游要素,包括特定的旅游主体(旅游者)、旅游客体(旅游资源)和旅游介体(旅游业)的空间载体,本文认为地统计学理论在旅游空间结构研究中有以下三方面的可能性:①旅游市场空间结构。作为旅游基本要素中的主体,旅游者是构成旅游的主体,是旅游三大要素的基本要素。这里旅游市场是指旅游需求市场,即旅游客源市场,某一特定旅游产品的经常购买者和潜在购买者。对区域旅游出游力进行地统计学分析,不仅可描述各区域的出游力地域空间形态,还可反映各区域出游力的空间变异程度及方向。②旅游景点空间结构。作为旅游基本要素中的客体,旅游景点是整个旅游系统中最为重要的组成部分。它是旅游活动实现的场所和旅游资源表现的载体,也是旅游吸引物的重要组成部分,对旅游资源、旅游吸引物空间结构的研究最终要转化为对旅游景点空间结构的研究。选取适当的旅游指标,如选取区域内各景点旅游人数为指标对旅游景点进行地统计学分析,不仅可研究区域内各景点之间的相互作用,加强区域内旅游景点的竞合关系,还对区域旅游发展趋势和方向具有指导意义。③旅游设施空间结构。作为旅游基本要素中的介体,旅游设施是指旅游目的地从事旅游业的人员向游客提供服务时依托的各项物质设施和设备,包括交通运输设施、食宿接待设施、游览娱乐设施和旅游购物设施等。在理论上,旅游设施与旅游景点在数量和空间位置上具有较强的追随关系。通过地统计学空间格局分析,可根据半变异函数变程、曲线趋势等进行验证这种关系是否存在,并为旅游基础设施和服务设施的配置提供一定的依据。

2.3 在旅游其他方面的应用

除了直接应用于旅游空间结构研究之外,地统计学分析还可间接反映旅游发展中的其他问题。如旅游生态环境的研究,通过对旅游地生物种群进行地统计分析,可得出生物种群分布格局,反映出旅游地生态环境在各种尺度上的状况,有助于旅游地进行相应的保护与开发。Fernandez以喀斯特洞穴为例,对空气温度和二氧化碳浓度进行地统计学分析,建立了洞穴空气温度的时空数学模型。认为从洞口算起,游览影响空间温度的平均距离超过90m,最终找出可向游客开放,并能确定合适的游览日程的潜在领域,对洞穴型景点的环境管理具有指导意义[13,14]。

关于研究的切入点,根据地统计学理论运用的前提条件,要求样本数据的随机性、平稳性以及呈正态分布,以此来寻求地统计学在旅游空间结构研究的切入点。主要包括两个方面:一是绝对量数据,如旅游人数、旅游地的生物种群数量等;二是相对量数据,如出游力、旅游竞争力等。运用绝对量数据对旅游空间结构进行地统计学实证分析将是作者下一步研究工作的重点。

3 结论

一切由经济因素引起的现象,在地理空间上都是呈连续分布的。旅游作为一种经济活动,势必会在空间上形成某种规律,运用地统计学方法可很好地揭示这种规律,不但为旅游空间结构研究带来新的方法和工具,而且推动数字高程模型(DEM)模拟的对象由“实体属性表面”向“非实体属性表面”发展,由静态的自然地表向动态的人工地表延伸。未来地统计学将在旅游研究中进一步发挥作用,如在量化旅游空间关系、旅游空间相互作用、预测旅游空间结构发展趋势等方面仍有很大的发展空间。地统计学理论在旅游空间结构研究中的应用尚在起步阶段,期待相关领域的专家能将各自研究与地统计学理论相结合进行深入的探讨,对旅游空间结构中各种关系采取地统计学分析研究,或基于地统计学分析反映旅游发展中其他方面的问题,必将深化对旅游现象的认识。

摘要：在总结现有旅游空间结构理论和方法的基础上,介绍了地统计学理论基础、研究方法、应用领域与应用技术,探讨地统计学理论在旅游空间结构研究中的方向与领域,以期丰富旅游研究的理论与方法。

空间统计篇9

我国烤烟种植面积居世界第一，且生产统一，管理相对集中。该文分析了山东诸城烟区植烟土壤养分的空间分布特征，揭示其变异规律，使其可视化，便于精细管理，充分发挥烟田土壤生产潜力，提高烟叶品质。

1 材料与方法

1.1 研究区概况

诸城隶属山东省潍坊市，属暖温带季风区半湿润气候，四季分明，土壤条件良好，水、热、光资源丰富，年均无霜期232 d，平均气温13.2℃，平均降雨量750 mm，全年太阳辐射总量509.6 kJ/cm2，年平均日照时数2 574.3 h，日照率58%，非常适宜生产优质烟叶。

1.2 样品采集与分析

于起垄前在诸城烟区进行土壤样品的采集工作，依据诸城市烟田分布规律图，遵循均匀分布的原则，基于GPS定位，以网格点为中心，在半径5 m的圆形区域内多点(10个点)混合取样，取样耕层深度0～20 cm，用四分法取1 kg土样带回实验室，取样间隔100 m，共采集样品384个。土壤样品风干、研磨及过筛后，分别测定土壤的有机质、水解氮、有效磷和速效钾(均采用常规化学分析方法)。

1.3 研究方法

检测数据采用域法识别特异值，即平均值加减3倍标准差，在此区间以外的数据均定为特异值，然后分别用正常最大值和最小值代替。数据经典统计分析使用Microsoft Excel 2010以及DPS 7.05软件，并对数据进行正态性检验;地统计分析及其模型的拟合使用GS+5.3;养分趋势效应分析及插值空间分布采用ArcGIS 9.3软件。

2 结果与分析

2.1 土壤养分的描述性统计分析

对采集的384个土壤样品的有机质、水解氮、有效磷和速效钾含量进行了描述性统计分析，结果见表1。可以看出，有机质含量分布在6.47～28.11 g/kg，平均为12.510 5 g/kg。水解氮、速效磷、速效钾的平均含量分别为81.274 2、34.023 6、168.311 0 mg/kg，变化幅度分别为46.70～151.10、4.50～101.80、66.25～693.75 mg/kg。从变异系数分析，各养分含量均存在不同程度的变异，变异范围在18.54%～48.89%，其中有效磷变异最大，达48.89%。水解氮变异系数最低，为18.54%。从变幅来看，有效磷和速效钾变幅较大，极差达到97.3和627.5，变幅相差近8倍。按照变异系数的大小一般分为3级[7]，<10%为弱变异，10%≤CV≤30%为中等变异，>30%为强变异。因此，有机质和水解氮含量为中等变异;有效磷和速效钾含量为强变异。其中，以速效磷的变异程度最大，这可能与磷肥的使用及土壤中的化学反应有关，土壤中磷利用率低，移动慢，易残留，因而磷分布不均，变异较大。

按土壤养分平均含量进行分级(表2)，诸城植烟土壤有机质和水解氮含量相对偏低，有效磷和速效钾含量较高。

注：有机质平均值～中值的单位是g/kg。

注：引自《全国第二次土壤普查技术教程》。

2.2 土壤养分的空间变异特征

根据函数公式以及GS+软件分析，选择拟合度最好的模型来描述4种主要养分的空间结构，得到如图1所示的半方差函数图以及表3所示的变异函数理论模型参数。

可以看出，水解氮和有机质的决定系数较小，模型的拟合度较低，空间变异结构性较差，趋于以小区域块状变异为主，渐变性分布不明显，小范围内高低起伏。一般认为，块金值(C0)代表随机变异的量，C为偏基台值，是非人为、区域因素引起的变异;C0+C为基台值，表示系统内总的变异，块金系数(C0/(C0+C))，表示由随机因素引起的空间异质性占总的空间异质性的程度，可以反映系统变量的空间相关程度。按照其分级标准[8]，<25%说明变量具有强烈的空间相关性;25%～75%说明具有中等空间自相关;>75%时变量的空间自相关性微弱，变异主要由随机变异组成，不适合采用空间插值的块金系数方法进行空间预测。由表2可知，水解氮的块金系数为16.86%，具有强烈的空间相关性。

2.3 土壤养分含量趋势效应分析

由于受多种因素的影响，土壤性质的空间分布常呈明显的趋势效应特征。一般把趋势效应[9]分为0(没有趋势效应)、常量(区域化变量沿一定方向呈常量增加或减少)、一阶(区域化变量沿一定方向呈直线变化)、二阶或多阶(区域化变量沿一定方向呈多项式变化)。图2中，x轴指向正东方，Y轴指向正北方，Z轴表示各样点测定值的大小;左后投影面上的深色线表示东西方向的全局性趋势效应变化，右后投影面上的深色线表示的是南北方向的全局性的趋势效应变化。可以看出，土壤有机质和速效钾含量存在明显的二阶趋势效应，表现为由西向东和由北向南呈多项式变化趋势。水解氮在东西方向上无趋势效应，南北方向上成多项式趋势效应。有效磷呈现明显的一阶趋势效应。

2.4 土壤养分的空间分布格局

根据所得的半方差函数模型，利用普通Kriging最优内插法，绘制诸城植烟土壤主要养分含量空间布局插值图(图3)。可以看出，土壤有机质、有效磷、速效钾呈现明显的空间分布格局，有机质整体含量偏低，只有西南部和东部含量较高。水解氮含量普遍分布在78.99 mg/kg左右，只有西北部和东部含量较高。土壤有效磷含量从东到西、从南到北分布格局较为明显，总体呈西南部较低，东北部较高的趋势。土壤速效钾在西部和北部局部大多数地区都出现较低含量的分布，多在110～115 mg/kg，中东部含量相对较高，但大都保持在173～198 mg/kg。总的来看，土壤有机质、水解氮、速效磷和速效钾含量分布都呈现出一定的规律性。

3 结论与讨论

地统计学已经被证明是分析土壤性质空间分布特征及其变异规律最有效的方法之一，其优势在于借助半方差函数和Kriging插值法可以对空间变量的空间变异和格局进行分析和预测，并结合已知样点的信息对未知点进行最优无偏内插估计和模拟，弥补了经典统计学忽略空间方位的不足，此外地统计学估计出的参数比用经典统计学方法估计的更为精确，可有效降低系统误差[10,11,12,13]。

(1)从经典统计学分析来看，诸城烟区植烟土壤养分含量均服从正态分布，其有效磷和速效钾含量为强度变异，有机质和碱解氮含量为中等变异。

(2)地统计学分析结果表明，诸城烟区植烟土壤养分的空间变异函数均可以用半方差函数模型较好的拟合。其中，土壤水解氮具有强烈的空间相关性;土壤有机质、速效磷、速效钾的空间相关性为中等。

【空间统计】推荐阅读：

统计2统计调查06-05