GB/Z 33451-2016 地理信息 空间抽样与统计推断

GB/Z 33451-2016 地理信息 空间抽样与统计推断
积分0.00
特惠
积分0
VIP全站资料免积分下载
立即下载
同类资料根据编号标题搜索
文档
仅供个人学习
反馈
标准编号:GB/Z 33451-2016
文件类型:.pdf
资源大小:3.2M
标准类别:其他标准
资源ID:223285
VIP资源

GB/Z 33451-2016标准规范下载简介:

内容预览由机器从pdf转换为word,准确率92%以上,供参考

GB/Z 33451-2016 地理信息 空间抽样与统计推断

用更大的样本量或得到精度较低的估值,甚至有偏。给定统计推断模型,样本的不同空间布设,将得到不同精 度的估计,选择其中估计误差最小的布设作为最优空间抽样方案。因此,空间统计模型与空间布样模拟结合, 可用于空间抽样优化,此时,在讨论空间抽样问题时,统计推断模型亦可用作空间抽样模型。 3.1.34 报告单元 reportingunit 用户希望知道的估值单元, 示例:报告单元可以是多个,多个报告单元组成报告层。例如,行政单元、自然单元、格网单元或用户感兴趣的其他 任意空间单元。每个报告单元的报告内容是估计值及其方差。 3.1.35 抽样总费用totalsamplingcost 抽样总的费用预算。可以人为给定,也可以根据抽样精度要求,由抽样模型计算得到。 3.1.36 抽样基本费用basicsamplingcost 抽样组织实施所需的公共费用或固定费用,与各样本单元费用一起组成总费用。 3.1.37 单个样本费用costpersamplingunit 获取一个样本单元值所需要的费用。 3.1.38 空间抽样与统计推断的三一准则trinityprincipleof spatialsamplingandstatisticalinference 抽样估值精度由总体特征(况)、样本布设方式()、统计模型(亚),以及三者之间的匹配关系所决 定,简称空间抽样三一准则(况,3,)。在空间抽样调查实践中,根据调查总体特征选择合适的样本空 间布设或抽样模型,并对调查得到的样本数据进行再次分析以选择最合适的统计推断模型。 3.1.39 空间抽样分辨率spatialresolutionofsampling 空间抽样单元(3.1.2)的尺寸,又称抽样单元尺度

报告单元reportingunit

空间抽样分辨率spatialresolutionof sampling 空间抽样单元(3.1.2)的尺寸,又称抽样单元尺度

MH/T 6116-2018 航空座椅镁合金结构可燃性的油燃烧器试验方法下列符号适用于本文件。 C 抽样总费用(3.1.35); 抽样基本费用(3.1.36):

下列符号适用于本文件。 C 抽样总费用(3.1.35); 抽样基本费用(3.1.36):

Ch 第h层中单个样本的抽样费用; Cj 第i、j两点之间的协方差; 空间自相关系数; 第h层的空间自相关系数; A 变异系数(3.1.5); ed 绝对误差限; 相对误差限; r N 总体量,即总体全部样本单元个数; N. 第h层总体量; N. 第r报告单元中的总体量; N.h 第h层在第报告单元中的总体量; 样本量(3.1.14); nA 第h层样本量; n itr 初始迭代样本量; n1 pre 预抽样样本量; P 总体的比例值; pa 第h层样本均值(比例值); pr 第r报告单元估计均值(比例值); P pre 预抽样目标比例; 2 样本方差(3.1.17); Sa2 第h层样本方差; Spre 预抽样方差; 用户期望方差; W. 第h层权重; w; 第i个样本的权重; Whi 第h层中第i个样本的权重; Y 总体(3.1.1); y 第i个样本值; yhi 第h层中第i个样本值; ,2 总体离散方差; 0%2 第h层的总体方差; 拉格朗日系数。

4地理信息的抽样方法和统计模型

4.2简单随机抽样方法

从总体中抽取n个抽样单元构成样本,使n个抽样单元所有的可能组合都有相等被抽到概率。 当总体各组成部分不存在相关性和异质性时,可以选择该模型;当总体各组成部分存在相关性或

GB/Z334512016

质性时,该模型抽样误差大,效率低。 是否存在空间相关性和空间异质性可分别用Moran'sI统计量(3.1.31)和地理探测器q值 (3.1.32)进行判断

实现过程主要包括四个步骤: a)对总体量为N的单位进行从1到N连续编号,做到不重不漏; 按照随机数生成方法获得n个1到N之间的样本单元号,随机数的产生方法按照 GB/T10111一2008中的方法进行; C 按生成的样本单元号取出相应的样本; d)估计总体的均值及其方差

实现过程主要包括五个步骤: a) 计算抽样间距:k=「N/n1(式中,符号门表示对数字向上取整); b) 将N个单元按某种顺序依次编号为1,2,..,N; c) 从1至k个单元编号中随机抽出一个单元编号,随机数的产生方法按照GB/T10111一2008 中的方法进行; d) 每隔k个单元编号抽出一个单元编号,直到抽出"个单元。如果对空间对象进行抽样,需要 在二维方向上进行抽取; e)估计总体的均值及其方差

实现过程主要包括五个步骤 a) 计算抽样间距:k=「N/n1(式中,符号门表示对数字向上取整); b)将N个单元按某种顺序依次编号为1,2,..,N; c) 从1至k个单元编号中随机抽出一个单元编号,随机数的产生方法按照GB/T10111一2008 中的方法进行; d) 每隔k个单元编号抽出一个单元编号,直到抽出n个单元。如果对空间对象进行抽样,需要 在二维方向上进行抽取; e)估计总体的均值及其方差

抽样在每一层中独立进行:总的样本由各层样本组成:总体参数则根据各层样本参数的汇总做出估 十。设总的样本量为n,从L个层中所抽取的样本量分别为n1,n2,,nL,则有n1十n2十nL=n。每层 的抽样都是独立地按照简单随机抽样进行的,所得的样本称为分层随机样本。 在总体情况复杂、各组成部分之间差异较大且各组成部分内部变差较小的情况下,该方法的优势比 交明显。适用于存在异质性而不存在自相关性的空间分布对象

实现过程主要包括四个步骤: a)将总体的抽样单元基于某种特征进行分层; 按照一定的样本量分配方法(平均分配、按各层总体单元数分配、按各层离散方差与总体规模 乘积分配等),计算各层内的样本量; c)在每层内进行简单随机抽样或系统抽样:

d)估计总体的均值及其方差

两阶段抽样将总体首先划分为初级单元,然后将初级单元划分为次级单元。首先使用简单随机方 法选择初级单元,然后在选中的初级单元中使用简单随机抽样或系统抽样,选择一定数目的次级单元。 分层抽样随机抽样是一种特殊的两阶段抽样方法,每个初级单元是层,第一阶段是100%抽样,第二阶 段是层内抽样

实现过程主要包括五个步骤: a) 对总体进行初级单元和次级单元划分,首先将总体分为若干个互不交叠但能够完全覆盖总体 的初级单元,然后将每个初级单元划分为若干个次级单元; b) 参考附录A计算样本量n; 用简单随机的方法选择n个初级单元; d) 在选中的每个初级单元中,以简单随机或系统抽样的方式选择m个次级单元; 估计总体的均值及其方差

4.6空间随机抽样方法

以简单随机抽样方法为基础,计算样本量和统计推断时考虑空间自相关性。 为达到给定精度,所需样本量比使用简单随机抽样少。当空间分布对象存在自相关性,但不存在空 间异质性时,该方法抽样效率较高,运用简单。在总体各组成部分比较均匀(或随机)且具有空间自相关 性的情况下,该方法的优势比较明显

实现过程主要包括六个步骤: a)准备包含空间抽样总体的底图,底图包括总体中每个抽样单元的空间位置信息; b)计算空间自相关系数; ) 计算样本量n,计算方法见附录A; d) 随机生成n对坐标数据,每对数据对应一个抽样单元。随机生成算法应使总体N个单元中所 有的n个坐标的组合都有相同的出现概率; e) 按生成的样本坐标取出相应的样本; f) 估计总体的均值及其方差

4.7空间系统抽样方法

以系统抽样为基础,考虑空间自相关性,在第一个样点选定后,以空间距离和分布模式为准则,选定 后续样点。

实现过程主要包括七个步骤!

GB/Z334512016

准备包含空间抽样总体的底图,底图中包括总体中每个抽样单元的空间位置信息; ) 计算空间自相关系数; 计算样本量n,计算方法见附录A; 针对具体对象,按照空间系统抽样模型计算样本量n与估值精度之间的定量关系 随机选定第一个样本点,根据空间坐标以一定距离和模式选定后续样本点,形成如 网的形状,间隔距离的选定要以样本量和抽样区域的面积选定为前提,以达到对抽村 均匀的覆盖; 按样本坐标抽取相应的样本; )估计总体的均值及其方差

4.8空间分层抽样方法

在分层抽样方法的基础上考虑空间自相关性,在给定精度的前提下比分层抽样模型所需的样本量 同一层的对象,在空间上可以是连续的,也可以是不连续的。 在总体各层之间差异较大、内部差异较小且具有空间相关性的情况下,该方法的优势比较明显

实现过程主要包括六个步骤: a)根据知识经验、历史数据、辅助数据进行空间分层。分层原则是层内离散方差最小、层间离散 方差最大; b) 按照空间分层模型计算总样本量; C) 将样本量按权重分配到每层内,可以平均分配、按各层内全部单元数占总体全部单元数比例分 配、按各层离散方差与该层总体全部单元数乘积比例分配等,其抽样有效性按此顺序提高。权 重可依据抽样有效性和参数可获取性选择;若考虑各层空间相关性,抽样效率可进一步提高; d) 在每个层内进行简单随机抽样或系统抽样; e) 计算各层的均值和样本离散方差; f) 各层的均值和样本离散方差分别加权求和,得到总体估计均值及其方差。其中各层权重是各 层抽样单元数占总体抽样单元数的比例,均值计算时的权重是该权重,方差计算时的权重是该 权重的平方。

4.9Kriging抽样方法

利用Kriging模型中样本分布和总体理论估计误差之间的计算关系,将其运用于样本量和估值精 度的抽样设计。 当空间分布对象存在相关性,但不存在空间异质性,并且样本之间空间距离差距不大时,该模型达 到总体最优估计。除了估计总体外,该方法通过优化样本点位置还可以用于空间插值制图的优化

实现过程主要包括四个步骤: a)依据经验、辅助数据、历史数据或者抽样数据,获得空间半变异函数。 b) 依据无偏最优目标,求解线性方程组,获得样本点的权重。 c) 根据样本点权重,对总体参数或样本点参数进行估计。根据理论估计误差的大小判断该组样

实现过程主要包括四个步骤: a)依据经验、辅助数据、历史数据或者抽样数据,获得空间半变异函数。 b) 依据无偏最优目标,求解线性方程组,获得样本点的权重。 c)根据样本点权重,对总体参数或样本点参数进行估计。根据理论估计误差的大小判断该组

本点是否满足精度要求。判断方法包括以下三种: 1)方法1:先进行Kriging空间插值,做出误差分布图。在误差较大的区域,增加样本点。 2)方法2:根据半变异函数空间距离衰减曲线,确定样本间隔, 3)方法3:给定样本量,模拟样本不同的空间分布,用Kriging分别插值并计算各空间点的标 准误差,选取标准误差最小的样本分布(较常采用的是平均标准误差最小和最大标准误差 最小)。可以用空间退火模拟等优化方法选择随机扰动的样本,逐步寻优,直到满足收敛 条件为止,输出样本空间分布。改变样本量,重复以上步骤。由此得到不同样本量条件下 所对应的最优抽样方案供选择。 根据最终选中的样本点估计总体均值及其估计方差

4.10MSN抽样方法

对于同时存在空间自相关性和异质性的空间分布对象,将空间分层抽样的无偏性和Kriging估值 方法相结合,得到异质表面均值估计。根据不同样本空间布局与均值估计结果理论估计误差之间的影 响关系,可通过改变样本布局达到降低标准误差的目的

实现过程主要包括五个步骤: a) 根据层内离散方差最小,层间离散方差最大的原则,将研究区况分解为相对均匀的子区《况 h=1,2,,L}; b) 计算各层和层际空间自相关系数; c) 计算样本量,计算方法见附录A; d) 对于给定的一组样本点,根据MSN模型对总体估计的最优目标和无偏约束,可以得到一组线 性方程,求出每个样本的最优权重; e) 根据样本点权重,对总体参数或样本点参数进行估计。根据标准误差的大小判断该组样本点 是否满足精度要求。模拟样本点不同的空间分布,计算出相应的标准误差,以标准误差最小所 对应的样本空间分布为最优

在样本有偏情况下,由已有数据或协变量计算每两个样本之间的关联系数,即样本与总体、样本 与总体均值(估计目标)之比值,实现有偏样本对总体均值的无偏估计的一种方法。 当有充分的历史数据或者先验信息能够度量出每个样本点相对于目标总体(总量或者均值)的 且能够计算出总体内两两样本之间的协方差时,该模型能显著提高估计的精度

4.11.2 实现步骤

实现过程主要包括三个步骤: a)根据历史时期对总体调查的时间序列数据或者协变量,计算总体内每两个点之间的协方差,以 及样本均值与总体均值之间的比值。 基于样本加权和估计总体均值,加以估值无偏最优药束,目标函数为标准误差最小。由此得到 一组方程,从而求解得到样本最优权重及其他参数的最优估计。 C 将上述所求参数带回样本均值及其离散方差公式,即得总体均值的无偏最优估计值及其方差,

4.12SPA统计推断方法

GB/Z334512016

在调查对象只有一个有效样本点,且同时能获取到与该对象相关性大的相关变量全覆盖数据情况 下,以该相关变量为协变量,通过该单个样本点对总体均值进行无偏估计的方法。 当协变量与调查对象之间具有强的相关性时,该模型可以实现对目标总体的无偏估计

实现过程主要包括三个步骤: 根据历史时期对总体调查的时间序列数据,计算样本点与协变量总体内每个样本点之间的协 方差,以及协变量总体内每两个样本点之间的协方差; b) 基于单点加权值来估计总体均值,以标准误差最优为目标,无偏为约束,求有约束极值问题得 到一组方程,对其求解得到样本点的权重最优估计; c)将上述所求参数带回样本加权均值及其离散方差公式,即得总体均值估计值及其方差

Sandwich空间插值方法

在空间分层抽样的基础上,增加报告单元层(如行政单元、自然单元或其他用户感兴趣的多个 可以一次抽样,多单元、多报告系统同时报告。基本原理见图1所示。 当被调查对象空间分异比较明显,知识分区逼近被调查对象真实分异,样本量小,并且需要按照 的多单元汇报结果的情况下,该模型的优势比较明显

图1Sandwich空间统计与抽样模型图

实现过程主要包括五个步骤: a 根据子层内离散方差最小、层间离散方差最大的原则,利用先验知识或分类算法,对研究区域 进行分层,构成知识层; b) 按照一定的样本量分配方法(平均分配、按各层总体单元数分配、按各层离散方差与总体量乘 积分配等),计算各层内的样本量,计算方法见附录A; c)对知识层进行空间分层抽样; d)计算各个层的均值和方差;

5空间抽样与统计推断基本过程

本指导性技术文件规定空间抽样与统计推断过程分为三个阶段,第一阶段为抽样设计,任务是计算 样本量和生成样本点;第二阶段为实际现场调查并获取样本值;第三阶段为统计推断和结果报告。实际 工作中,可以根据已有工作基础,从这三个阶段的任何一个阶段起步,向后进行。需要抽样调查时,应从 第一阶段起步,顺序进行;若已有样点数据,则直接进人第三阶段;当已有统计报告,则可按第一、二、三 价段顺序评估已有结果报告的可靠性。同时,根据空间抽样与统计推断三一准则,抽样方法需要依据调 研总体的特征进行选取,统计推断模型的选取则需要依据调查总体和调查所得样本进行。

5.2抽样方法选择及相关参数

5.2.1抽样方法选择的条件

根据模型方法的适用条件选取相应的模型。根据调查目标和可获取的先验知识,选择适当的抽 法和统计推断模型。不同抽样方法适用情况见表1,其中目标函数是指估计总体时是否有无偏最 求

表1不同抽样方法的适用条件

注:√表示是;X表示否。

如下模型既可以指导抽样,又可以根据样本进行统计推断:空间分层抽样模型、MSN模型;如下模 型更多地用来进行统计推断:异质表面多单元并行报告的Sandwich模型、具有样本纠偏能力的B SHADE模型和只有单点观测值时进行区域推断的SPA模型

5.2.2确定抽样范围

根据待调查的区域边界确定合适的抽样范围,可以是抽样底图范围的一部分或者与抽样底图范围 重合。

对空间连续分布属性进行抽样调查时,应对抽样底图进行格网化(需要设置格网分辨率),以确定总 12

GB/Z334512016

本量N三抽样区域面积/单个样本面积。 当抽样底图是点数据的情况下,底图所有点的个数即为总体量;当抽样底图是线数据情况下,底图 疲离散化成小的线段(小线段的长度为分辨率),这些线段集合构成总体;当抽样底图是面时,底图被离 散化成小的面域,这些面域集合即为总体。 当抽样底图为格数据的情况下,包括不规则多边形的行政单元或规则的遥感像元,格的个数即为总 本量,无需设置分辨率

5.2.4选择取值类型

选择样本的取值类型:尺度值或比例值

5.3第一阶段抽样设计

5.3.1确定抽样底图

抽样底图界定样本点抽取的区域范围。抽样底图应提供抽样样本的基本信息,包括样本点的空间 信息和属性信息,栅格图和矢量图均可作为抽样底图

5.3.2探索性分析总体统计性质

寸象在空间分布上的主要特征,从离散方差、自相关性、分层特征等方面,获取总体多维特征,为抽样模 型选择、样点布设和参数获取提供依据

根据选定的抽样模型、掌握的模型参数、抽样精度和费用要求计算样本量。不同模型的参数要求和 样本量计算方法见第6章

是地理坐标,则要求给出投影坐标系统,并将其转化为适合于野外定位设备使用的坐标,以利于野外的 实际调查和数据采集

5.4第二阶段数据采集和获取

基于样本点的布局图,通过野外调查或遥感影像获取数据。获得的数据应包括时间、地点、坐标、数 据类型和值

5.5第三阶段统计推断和结果报告

5.51探索性分析样本统计性质

分析样本数据的空间分布规律和空间趋势,判断是否存在空间自相关性(可用Morans「统计量 或半变异函数。MoransI统计量从0到1(一1)反映空间自相关性从无到最大正相关(负相关),可以 通过Z值的大小来判断其显著性)和空间异质性(可用地理探测器q值,q值从0到1反映空间异质性 从无到最大)等

5.5.2选择统计推断模型

根据第一阶段的抽样方案及第二阶段获得的样本值,通过空间数据探索性分析,若未发现与抽样

GB/Z334512016

点,能满足期望精度时的最小样本就是最终得到的样本,即样本量及样本的空间布局在模拟时同时 确定。 抽样过程中,因抽取的样本点位置不可达或样本点的数据值缺失等原因,故应根据实际情况扩大样 本量的比例,即按照一定比例增加样本,以满足需求。抽取不同量的样本,具有不同的精度,精度的计算 见附录A,与计算样本量的方法是一一对应的

统计推断结果报告中应包括表3中的基本内容,具体形式可参见附录B中各模型的统计推断 报告:

表3统计推断阶段的报告内容

GB/Z334512016

GB/Z33451—2016

GB/Z334512016

B.1典型空间抽样和统计模型

以某县有林地覆被面积的抽样调查为例,介绍本指导性技术文件陈述的几种典型空间抽样和统计 方法(空间随机模型、空间分层模型和Sandwich模型)应用的主要过程。应用实例采用了该县有林地覆 披的栅格数据(2697460个栅格单元GB 50211-2014 工业炉砌筑工程施工与验收规范,空间分辨率是1km")作为抽样底图和抽样范围(图B.1)。其中, 空间数据描述了每个像元的坐标信息,属性数据为每个抽样单元(像元)的有林地面积值。由于本附录 中的应用实例所用数据均为栅格数据,故无需设置分辨率,总体量为像元个数2697460;取值类型均设 置为尺度值

图B.1某县有林地覆被的栅格数据抽样底图(栅格分辨率1km²)

B.1.1空间随机模型

抽样得到该县有林地面积的估计值,使其当显著性水平为0.05时的绝对误差限不超过86

B.1.1.1第一阶段抽样设计

首先,对总体统计性质探索性分 根据以前的调查结采,该: km²栅格单元尺度有林地面积的离散棕准差约为1.5×10 km。结合本案例的需求说明.故参数设

GB/Z334512016

故实际总的样本量n。:84;扩大10%后抽取出的样本量:93。 最后,抽取样本点。利用计算机伪随机数生成方法从2697460个像元中随机抽取93个样本像元 (包括经纬度坐标)WS/T 500.17-2016 电子病历共享文档规范 第17部分:一般护理记录,并按照经纬度坐标将其布局在抽样底图中(图B.2)

B.1.1.3第三阶段统计推断和结果报告

©版权声明
相关文章