kikita & Maps

GIS,spatial and artificial intellegence learning and share

在上一篇文章中,我提到的这些工具都是用于研究数据有什么样的空间模式,哪里聚类?哪里是热点?哪里有冷点?哪里有异常值?等等,总之研究的是“生米煮成熟饭”的结果状态。

而“空间关系建模”工具箱中的工具,更倾向于研究 Why? 例如,为什么会出现这种情况? 或者说什么导致了这种情况。这时我们就可以使用工具进行回归分析,如:普通最小二成法(OLS) 和 地理加权回归(GWR)。



你可能会问,为什么要进行回归分析?帮助文档中回归分析基础这一章写的最好,比较贴近读者,而不是冰冷的字典,我把回归分析的应用示例搬过来帮助理解,以下内容整理自帮助文档

  1. 对某一现象建模,以更好地了解该现象并有可能基于对该现象的了解来影响政策的制定以及决定采取何种相应措施。基本目标是测量一个或多个变量的变化对另一变量变化的影响程度。示例:了解某些特定濒危鸟类的主要栖息地特征(例如:降水、食物源、植被、天敌),以协助通过立法来保护该物种。(更好地了解

  2. 对某种现象建模以预测其他地点或其他时间的数值。基本目标是构建一个持续、准确的预测模型。示例:如果已知人口增长情况和典型的天气状况,那么明年的用电量将会是多少?( 建模预测

  3. 您还可以使用回归分析来深入探索某些假设情况。假设您正在对住宅区的犯罪活动进行建模,以更好地了解犯罪活动并希望实施可能阻止犯罪活动的策略。开始分析时,您很可能有很多问题或想要检验的假设情况:( 探索检验假设

  • “破窗理论”表明公共财产的破坏(涂鸦、被毁坏的建筑物等)可招致其他犯罪行为。破坏财产行为与入室盗窃之间是否存在正关系?
  • 非法使用毒品与盗窃行为之间存在某种关系吗(吸毒成瘾的人有可能通过偷取财物来维持他们吸毒的习惯吗)?
  • 窃贼恃强凌弱吗?老人或女性户主家庭居多的住宅区内发生盗窃的可能性更高吗?
  • 是住在富有的小区内更容易遭受盗窃,还是住在贫穷的小区内更容易遭受盗窃?
    您可以通过回归分析来探索这些关系并解答您的问题。

总之,通过回归分析,我们可以对空间关系进行建模、检查和探究;回归分析还可帮助我们解释所观测到的空间模式背后的诸多因素。

在所有的回归方法中,OLS 最为著名。而且,它也是所有空间回归分析的正确起点。它可以尝试了解或预测(早逝/降雨)的变量或过程提供一个全局模型;而且,它可创建一个回归方程来表示该过程。地理加权回归 (GWR) 是若干空间回归方法中的一种,被越来越多地用于地理及其他学科。通过对数据集中的各要素拟合回归方程,GWR 为您要尝试了解/预测的变量或过程提供了一个局部模型。若使用得当,这些方法可提供强大且可靠的统计数据,以对线性关系进行检查和估计。

例如如下是两个变量之间存在正、负关系以及无关系的情况:

Read more »

这组工具中包含众所周知的热点分析工具,通过这个工具我们能捕获到大量数据中的热点和冷点,对我们分析问题有很大的帮助。例如,在犯罪分析中,我们可以研究哪些位置犯罪频繁并且聚集,对增设警力有重要的辅助作用。工具集中的其他工具也有类似的作用,都是通过执行聚类分析来识别具有统计显著性的热点、冷点和空间异常值的位置。

依照惯例,我们还是 one by one 来看。

Similarity Search

相似搜索工具,顾名思义,工具根据要素属性确定哪些候选要素与输入要素最相似或者最不相似。

举个栗子:

我希望找到与圣地亚哥5岁以下儿童、未成年人、65岁以上老年人人数分布相似的城市:

工具中我做如下配置:

Read more »

春节之后,美国esri官网给了我们一些小惊喜,千呼万唤的 ArcGIS Pro 的试用许可终于放出来了。与ArcGIS Desktop Advanced 一起提供 60天的试用,同时附赠了 200 个 credit。

ArcGIS Pro 使用了全新的 Named User 方式授权许可,我们可以多个设备同时在线使用。

PS:如果你希望得到 ArcGIS Desktop的使用许可,这篇文章也能帮到你。

下面就说说申请途径和激活方式。



First ,找到Esri官方试用地址

http://www.esri.com/software/arcgis/arcgis-for-desktop/free-trial


Read more »

Updated: 2017-10-11
修改了文中表意含糊的语句,增加了更多解释性描述。


这一篇具体看分析模式工具集中的具体工具,整理这一篇的目的,不是要读者了解每个工具的背后使用了多么高级的算法,运用了多么庞大的公式,而是一起了解这些工具究竟可以为我们研究什么样的空间数据分布模式,当需要探索数据的空间性质时,知道应该如何去应用这些分析工具。


Average Nearest Neighbor

平均最近邻工具,计算每个要素中心与其最邻近要素中心的距离,然后求取所有最近邻距离的平均值,然后用这个观测平均值与随机分布的期望平均值进行比较,从而可以反应数据的空间分布是聚合的还是分散的。

Average Nearest Neighbor 工具将返回五个值:

  • 观测的平均距离 / Observed Mean Distance
  • 期望的平均距离 / Excepted Mean Distance
  • 最近邻指数 / Nearest Neighbor Ratio
  • z得分 / z-score
  • p值 / p-value

其中,最近邻指数是观测平均值与期望平均值的比率,最近邻如果最近邻比率小于1,则表现的模式为聚类。如果指数大于1,则表现的模式趋向于扩散。

Read more »

有时对于数据量较大的地理数据,我们希望通过一定的统计方法将空间模式量化,从而获知这些地理数据在空间上是聚合的、还是离散的、还是随机的等。

分析模式工具集

在了解如上工具之前,有一些空间统计学的基本知识还是要先搞明白,磨刀不误砍柴工,那就开始吧。


零假设、P值、Z得分、置信度

分析模式工具集中的工具都采用“推论统计学”,先确定一个零假设,也就是假设要素或与要素相关的值都表现为空间随机模式—— **Complete Spatial Randomness (CSR)**;然后再计算一个 p值,用来表示零假设的正确概率。分析模式工具集中的工具都会返回 P值(P-Value)Z得分(Z-Score),这是我们拒绝前面的零假设的依据,也就是我们观测的要素表现出显著性聚类或离散模式,而不是随机模式。

什么是 P 值? 什么是 Z 得分?

P值 就是概率值,它表示观测到的空间模式是由某随机过程创建而成的概率,或者我们简单的理解成是观测到的空间模式是随机空间模式的概率。P 值越小,也就是观测到的空间模式是随机空间模式的可能性越小,也就是我们越可以拒绝开始的零假设。

Z得分 表示标准差的倍数。例如,如果工具返回的 z 得分为 +2.5,我们就会说,结果是 2.5 倍标准差。如下所示,z 得分和 p 值都与标准正态分布相关联。

正态分布

Read more »
0%