kikita & Maps

GIS,spatial and artificial intellegence learning and share

为了表示连续的表面,ArcGIS 提供了多种表示、存储函数表面的数据格式,主要是以下四类,其中包括10.1带来的新类型:LAS Dataset。

我们可以借助于ArcGIS的3D分析扩展,对这些函数表面数据进行三维的显示、分析等。但是需要注意的是,这些数据并不是真正意义上的真三维,这是我们常说的2.5D。因为这些数据在某个XY坐标对对应的位置上,只能存储一个Z值,而真正的三维实体是在某个位置上有一系列的Z值。这种三维实体,ArcGIS中是以Multipatch存储和表示的。

1.Raster

这是最常见的一种栅格表面数据格式,通常是浮点型的连续栅格。

2.TIN

3.LAS Dataset

4.Terrain Dataset

四种格式,在各种GDB中的支持情况:

ArcGIS 中,ArcScene 与 ArcGLobe 是两种3D数据可视化以及分析的组件或者说环境,它们二者有什么样的区别,如何根据自己的应用去选择呢?
以下是对这二者的对比信息总结:

1. 许可

都需要 3D Analyst License 才能启动。

2. 坐标系统

ArcScene - 使用第一个加入ArcScene的数据的坐标系统,当不同坐标系的数据加入时,进行动态投影,这点同ArcMap。通常使用平面坐标系(投影坐标系)。
ArcGlobe - WGS 1984 Cube Projection *,当不同坐标系的数据加入时,进行动态投影。

  • 那神马是立方体投影(cube projection)?
    也就是将地球投影到各面都是正方形的六面体上。如下图:

需要说明,这种投影,经线和纬线都是直线;在纬度 +45° 和 -45° 之间,东南西北方向是准确的,比例尺是正确的;在极面上,由中心确定的方向是真实的。
但是这种投影不适合制图,仅适用于ArcGlobe。

3. 内存管理与缓存机制

ArcScene - 将所有数据加载到内存中,必要的时候使用虚拟内存。也因此,ArcScene通常用来展示小场景、小数据量。
ArcGlobe - 通常专用于超大型数据集,缓存过程中会建立索引并将所有数据组织为各个切片和细节层次。

4. 数据类型的支持

ArcGlobe支持terrain数据,但是ArcScene不支持。
ArcScene中不支持Annotation。

接收雨水的区域以及雨水到达出水口前所流经的网络被称为水系。流经水系的水流只是通常所说的水文循环的一个子集,水文循环还包括降雨、蒸发和地下水流。水文分析工具重点处理的是水在地表上的运动情况。“水文分析”工具用于为地表水流建立模型。

盆域分析(Basin):创建描绘所有流域盆地的栅格。

填洼(Fill):通过填充表面栅格中的汇来移除数据中的小缺陷。

流量(Flow Accumulation):创建每个像元累积流量的栅格。可选择性应用权重系数。

流向(Flow Direction):创建从每个像元到其最陡下坡相邻点的流向的栅格。

水流长度(Flow length):计算沿每个像元的流路径的上游(或下游)距离或加权距离。

汇(Sink):创建识别所有汇或内流水系区域的栅格。

捕捉倾泻点(Snap pour point):将倾泻点捕捉到指定范围内累积流量最大的像元。

河流连接(Stream link):向各交汇点之间的栅格线状网络的各部分分配唯一值。

河网分级(Stream Order):为表示线状网络分支的栅格线段指定数值顺序。

栅格河网矢量化(Stream to Feature):将表示线状网络的栅格转换为表示线状网络的要素。

分水岭(Watershed):确定栅格中一组像元之上的汇流区域。


了解水系的术语,如下图:

以下流程图显示的是从数字高程模型 (DEM) 中提取水文信息(如分水岭边界和河流网络)的过程:

现在就以手中的这个DEM为例来依次使用工具集中的工具,来学习这部分功能:


一、流向(Flow Direction)

流向工具的输出是值范围介于 1 到 255 之间的整型栅格。从中心出发的各个方向值为:

例如,如果最陡下降方向位于当前处理像元的左侧,则将该处理像元的流向编码将为 16。

如果像元的 z 值在多个方向上均发生相同变化,并且该像元是凹陷点的一部分,则该像元的流向将被视为未定义。此时,该像元在输出流向栅格中的值将为这些方向的总和。例如,如果 z 值向右(流向 = 1)和向下(流向 = 4)的变化相同,则该像元的流向为 1 + 4 = 5。可以使用汇工具将具有未定义流向的像元标记为凹陷点。


二、汇(Sink)

汇是指流向栅格中流向无法被赋予八个有效值之一的一个或一组空间连接像元。汇被视为具有未定义的流向,并被赋予等于其可能方向总和的值。

汇工具的输出是一个整型栅格,其中每个汇都被赋予一个唯一值。汇的编号介于 1 到汇的数量之间。


三、填洼(Fill)

通过填充表面栅格中的汇来移除数据中的小缺陷。

凹陷点是指具有未定义流域方向的像元;其周围的像元均高于它。倾泻点相对于凹陷点的汇流区域高程最低的边界像元。如果凹陷点中充满了水,则水将从该点倾泻出去。

TIPS:有关填充的Z限制

要填充的凹陷点与其倾泻点之间的最大高程差。如果凹陷点与其倾泻点之间的 z 值差大于 z 限制,则不会填充此凹陷点。

默认情况下将填充所有凹陷点(不考虑深度)。


四、流量(Flow Accumulation)

创建每个像元累积流量的栅格。流量累积将基于流入输出栅格中每个像元的像元数。

高流量的输出像元是集中流动区域,可用于标识河道。流量为零的输出像元是局部地形高点,可用于识别山脊。

流量工具不遵循压缩环境设置。输出栅格将始终处于未压缩状态。

通过上面的填洼,求流向,得到如下流量图,看到了河道:


五、河网分级(Stream Order)

河网分级是一种将级别数分配给河流网络中的连接线的方法。此级别是一种根据支流数对河流类型进行识别和分类的方法。仅需知道河流的级别,即可推断出河流的某些特征。

河网分级工具有两种可用于分配级别的方法。这两种方法由 Strahler (1957) 和 Shreve (1966) 提出。在这两种方法中,始终将 1 级分配给上游河段。

Strahler 河流分级方法:

在 Strahler 法中,所有没有支流的连接线都被分为 1 级,它们称为第一级别。当级别相同的河流交汇时,河网分级将升高。

因此,两条一级连接线相交会创建一条二级连接线,两条二级连接线相交会创建一条三级连接线,依此类推。但是,级别不同的两条连接线相交不会使级别升高。例如,一条一级连接线和一条二级连接线相交不会创建一条三级连接线,但会保留最高级连接线的级别。

Shreve 河流分级方法:

Shreve 法考虑网络中的所有连接线。与 Strahler 法相同,所有外连接线都被分为 1 级。但对于 Shreve 法中的内连接线,级别是增加的。例如,两条一级连接线相交会创建一条二级连接线,一条一级连接线和一条二级连接线相交会创建一条三级连接线,而一条二级连接线和一条三级连接线相交则会创建一条五级连接线。

因为级别可增加,所以 Shreve 法中的数字有时指的是量级,而不是级别。在 Shreve 法中,连接线的量级是指上游连接线的数量。


六、栅格河网矢量化(Stream to Feature)

栅格河网矢量化工具使用的算法主要用于矢量化河流网络或任何表示方向已知的栅格线性网络的栅格。

该工具使用方向栅格来帮助矢量化相交像元和相邻像元。可将两个值相同的相邻栅格河网矢量化为两条平行线。

这与栅格转折线 (Raster to Polyline) 工具相反,后者通常更倾向于将线折叠在一起。下图是两者的对比:


七、河流连接(Stream link)

向各交汇点之间的栅格线状网络的各部分分配唯一值。

“连接”是指连接两个相邻交汇点、连接一个交汇点和出水口或连接一个交汇点和分水岭的河道的河段。


八、水流长度(Flow Length)

水流长度工具的主要用途是计算给定盆地内最长水流的长度。该度量值常用于计算盆地的聚集时间。这可使用 UPSTREAM 选项来完成。

该工具也可通过将权重栅格用作下坡运动的阻抗,来创建假设降雨和径流事件的距离-面积图。

   


九、捕捉倾泻点(Snap pour point)

捕捉倾泻点工具用于确保在使用分水岭工具描绘流域盆地时选择累积流量大的点。

捕捉倾泻点将在指定倾泻点周围的捕捉距离范围内搜索累积流量最大的像元,然后将倾泻点移动到该位置。


十、分水岭(Watershed)

确定栅格中一组像元之上的汇流区域。


十一、盆域

创建描绘所有流域盆地的栅格。

通过识别盆地间的山脊线,在分析窗口中描绘流域盆地。通过分析输入流向栅格数据找出属于同一流域盆地的所有已连接像元组。通过定位窗口边缘的倾泻点(水将从栅格倾泻出的地方)及凹陷点,然后再识别每个倾泻点上的汇流区域,来创建流域盆地。这样就得到流域盆地的栅格。

以下是盆域分析示例:


That’s all.

在实际工作中,由于成本的限制、测量工作实施困难大等因素,我们不能对研究区域的每一位置都进行测量(如高程、降雨、化学物质浓度和噪声等级)。这时,我们可以考虑合理选取采样点,然后通过采样点的测量值,使用适当的数学模型,对区域所有位置进行预测,形成测量值表面。插值之所以可称为一种可行的方案,是因为我们假设,空间分布对象都是空间相关的,也就是说,彼此接近的对象往往具有相似的特征。

ArcGIS的空间分析中,提供了插值(Interpolation)工具集,如下:


1. 反距离权重法(IDW–Inverse Distance Weighted)

此方法假定所映射的变量因受到与其采样位置间的距离的影响而减小。

幂参数:

IDW主要依赖于反距离的幂值。基于距输出点的距离,幂参数可以控制已知点对内插值的影响。幂参数是一个正实数,默认值为 2,一般在0.5至3之间取值。随着幂值的增大,内插值将逐渐接近最近采样点的值。指定较小的幂值,将对距离较远的周围点产生更大影响,会产生更加平滑的表面。由于反距离权重公式与任何实际物理过程都不关联,因此无法确定特定幂值是否过大。作为常规准则,认为值为 30 的幂是超大幂,因此不建议使用。此外还需牢记一点,如果距离或幂值较大,则可能生成错误结果。

障碍:

障碍是一个用作可限制输入采样点搜索的隔断线的折线 (polyline) 数据集。一条折线 (polyline) 可以表示地表中的悬崖、山脊或某种其他中断。仅将那些位于障碍同一侧的输入采样点视为当前待处理像元。

注意事项:

(1)因为反距离权重法是加权平均距离,所以该平均值不可能大于最大输入或小于最小输入。因此,如果尚未对这些极值采样,便无法创建山脊或山谷。

(2)此工具最多可处理约 4,500 万个输入点。如果输入要素类包含 4,500 万个以上的点,工具可能无法创建结果。

工具执行截图:

2. 克里金法(Kriging)

克里金法假定采样点之间的距离或方向可以反映可用于说明表面变化的空间相关性。克里金法是一个多步过程;它包括数据的探索性统计分析、变异函数建模和创建表面,还包括研究方差表面。该方法通常用在土壤科学和地质中。

3. 自然邻域法(Natural Neighbor)

可找到距查询点最近的输入样本子集,并基于区域大小按比例对这些样本应用权重来进行插值。该插值也称为 Sibson 或“区域占用 (area-stealing)”插值。

4. 样条函数(Spline)

使用二维最小曲率样条法将点插值成栅格表面。生成的平滑表面恰好经过输入点。

5. 含障碍的样条函数(Spline with Barriers)

通过最小曲率样条法利用障碍将点插值成栅格表面。障碍以面要素或折线要素的形式输入。样条函数法工具所使用的插值方法使用可最小化整体表面曲率的数学函数来估计值。

6. 地形转栅格(Topo to Raster)

将点、线和面数据插值成符合真实地表的栅格表面。

依据文件实现地形转栅格(Topo to Raster by file)

通过文件中指定的参数将点、线和面数据插值成符合真实地表的栅格表面。通过这种技术创建的表面可更好的保留输入等值线数据中的山脊线和河流网络。

7. 趋势(trend)

使用趋势面法将点插值成栅格曲面。趋势表面会逐渐变化,并捕捉数据中的粗尺度模式。

以上是插值工具的简单说明与比较,这些工具的背后都有庞大的理论基础和复杂的算法,需要进一步学习整理和补充。

通过多元统计分析可以探查许多不同类型的属性之间的关系。

有两种可用的多元分析:分类(监督分类与非监督分类/Supervised&Unsupervised))和主成分分析/Principal Component Analysis  (PCA)。

ArcGIS 提供了如下工具:


一、波段集统计工具(Band Collection Statistics)

栅格波段必须具有一个公共交集。如果不存在公共交集,则会出现错误,且不会创建任何输出。

如果栅格波段的范围不同,统计数据将以所有输入栅格波段的共同的空间范围来计算。默认情况下,像元大小为输入栅格的最大像元的大小;否则,将取决于栅格分析环境设置。

此工具计算每个图层的基本统计测量值(最小值、最大值、平均值和标准差),如果勾选协方差和相关矩阵,还可以得到这两个值。

二、创建特征(Create Signature)

创建由输入样本数据和一组栅格波段定义的类的 ASCII 特征文件。该工具可创建将用作其他多元分析工具的输入参数的文件。

该文件由两部分组成:

1) 所有类的常规信息,例如图层数、输入栅格名称和类别数。
2) 每个类别的特征文件,由样本数、平均值和协方差矩阵组成。

三、编辑特征(Edit Signature)

通过合并、重新编号和删除类特征来编辑和更新特征文件。

输入特征重映射文件是 ASCII 文件,其每一行有两列值与之对应,以冒号分隔。第一列是原始类 ID 值。第二列包含用于在特征文件中更新的新类 ID。文件中的所有条目必须基于第一列以升序进行排序。

编辑特征文件的写法是固定的,如下:

只有需要编辑的类才必须被放入特征重映射文件;任何在重映射文件中不存在的类将保持不变。

要合并一组类,原类 ID:新类 ID。

要删除类特征,使用 -9999 作为该类第二列的值。

要重新编号,将类 ID 重新编号为某个不存在于输入特征文件中的值。

示例:

1
2
3
4
2 : 3
4 : 11
5 : -9999
9 : 3

上例将使用 3 合并类 2 和 类 9,使用 11 合并类 4,并将删除类 5。

四、树状图(Dendrogram)

构造可显示特征文件中连续合并类之间的属性距离的树状图。

有关其工作原理,详见:http://help.arcgis.com/zh-cn/arcgisdesktop/10.0/help/index.html#/na/009z000000q6000000/

五、最大似然法分类(Maximum Likelihood Classification)

最大似然法分类工具所用的算法基于两条原则:

1) 每个类样本中的像元在多维空间中呈正态分布
2) 贝叶斯决策理论

TIPS:工具中有几个参数需要注意:

reject_fraction:将因最低正确分配概率而得不到分类的像元部分。

默认值为 0.0;将对每个像元进行分类。共有 14 个有效输入:0.0、0.005、0.01、0.025、0.05、0.1、0.25、0.5、0.75、0.9、0.95、0.975、0.99 和 0.995。

a_priori_probabilities:指定将如何确定先验概率。

  • EQUAL — 所有类将具有相同的先验概率。
  • SAMPLE — 先验概率将与特征文件内所有类中采样像元总数的相关的各类的像元数成比例。
  • FILE — 先验概率将会分配给输入 ASCII 先验概率文件中的各个类。

以下是通过三类样本的特征文件,分类的栅格数据的示例:

六、Iso 聚类(Iso Cluster)

Iso表示:iterative self-organizing –迭代自组织方法。

Iso聚类工具对输入波段列表中组合的多元数据执行聚类。所生成的特征文件(*.gsg)可用作生成非监督分类栅格的分类工具(例如最大似然法分类)的输入。

类数的最小有效值为二。不存在最大聚类数。通常情况下,聚类越多,所需的迭代就越多。

七、Iso 聚类非监督分类(Iso Cluster Unsupervised Classification)

此工具为脚本工具,此工具结合了 Iso 聚类工具与最大似然法分类工具的功能。输出经过分类的栅格。

八、类别概率(Class Probability)

如果发现分类中的某些区域被分配给某一类的概率不是很高,则说明可能存在混合类。

例如,根据分类概率波段,一个已被分类为森林的区域属于森林类的概率只有 55%。您又发现同一区域属于草地类的概率却有 40%。显然,该区域既不属于森林类也不属于草地类。它更可能是一个森林草地混合类。对于使用分类概率工具生成的分类概率,最好检查分类结果。

生成的多波段栅格数据的波段数等于类别数,每个波段表示某种分类的可能概率,像元值从0至100。

九、主成分分析(Principal Components)

对一组栅格波段执行主成分分析 (PCA) 并生成单波段栅格作为输出。此工具生成的是波段数与指定的成分数相同的多波段栅格。

主成分分析工具用于将输入多元属性空间中的输入波段内的数据变换到相对于原始空间对轴进行旋转的新的多元属性空间。新空间中的轴(属性)互不相关。之所以在主成分分析中对数据进行变换,主要是希望通过消除冗余的方式来压缩数据。

以上提到的几个工具,在ArcGIS 10.x版本中,除了在ArcToolbox中可以找到,在 Image Classification 工具条中也可以找到对应的功能,如下图:

这个工具集涉及很多遥感的理论知识,仅仅使用工具是不够的,后面需要多多学习…… 

0%