卫星能学会看贫穷吗?
  • 发表时间:2018-07-12

想象一下夜晚的地球——广阔而弯曲的黑暗,点缀着一条条光线。这是一个美丽的景象,一个熟悉的景象。今天,这一形象经常扮演一个美丽的陈词滥调,人类发明和连接的代谢前证明,可能出现在Koyannisqatsi和起亚的商业广告中。不过,对于经济学家来说,这种景象不仅仅是一个符号:它是一个强大的数据集。

在过去的几十年里,几乎自从宇航员第一次拍摄夜间地球的图像以来,研究人员已经认识到,“夜间灯光”数据间接反映了产生灯光的人的财富。这种经济计量能力似乎在全球发挥作用:不仅城市比农田更亮,美国城市也比印度城市更亮;随着一个国家GDP的增加,它的夜间亮度也在增加。两年前,斯坦福大学的一位教授甚至利用夜间灯光数据显示,北韩领导人正把国际经济制裁的成本转嫁给农民和村民。随着外国政府实施制裁,平壤变得更加明亮,内陆地区的光线减弱。因此,

夜灯似乎是一种难以置信的资源。如此之多,以至于在经济统计不佳的国家,他们可以充当地区财富调查的代理——除了没有人需要挨家挨户地通过问卷调查。然而,研究也显示,这种不彻底的调查仍将是不准确的:对于一颗卫星来说,夜间的几栋明亮的大厦和一个密集但光线不足的棚户区看起来几乎是一样的。上周发表在《科学》杂志上的斯坦福大学一个研究小组的一篇新论文将一种流行的技术应用到了这个棘手的问题上。为了使夜晚的灯光更加明亮,工程师和计算机科学家给卷积神经网络(一种标准类型的人工智能程序)提供了一系列数据集。他们希望让it了解夜间数据,同时让it摆脱陷阱。

首先,他们教神经网络一个通用的图像识别程序,让它区分边缘、角落和1000多个常见物体。其次,他们要求它将一个国家的一组夜间灯光数据与同一个国家的日间地图相关联,基本上是教它地面上什么样的特征更有可能在夜间使地面变得更亮。最后,他们给它提供了该国现有的分辨率最高的家庭财富数据,即世界银行的生活水平测量研究,以经纬度为索引。

实际上,他们试图教神经网络如何“看到”卫星数据中的贫困。

这一点很重要,原因很简单:“我们没有非常好的数据来说明穷人的处境,特别是在贫穷国家,”斯坦福大学电气工程研究员、论文作者尼尔·让说。

许多经济学家、地理学家和政府都同意这一观点。研究小组提供给他们模型的数据来自五个撒哈拉以南国家——尼日利亚、坦桑尼亚、乌干达、马拉维和卢旺达——它们都面临着非同寻常的“数据稀缺”。俄勒冈州立大学的地理教授Jamon Van Den Hoek没有撰写论文,他说,克服撒哈拉以南非洲地区的数据匮乏推动了该地区的大部分研究。在过去几年里,研究人员试图通过分析手机元数据或检测屋顶是金属还是茅草来推断当地的经济命运。二月份,Facebook甚至训练了一个神经网络,通过从上面辨认建筑物的样子来估计村一级的人口数据。

这篇论文并没有走那么远。在建立模型后,作者根据原始的夜间照明数据和世界银行的调查数据对其预测进行了检验。该模型与世界银行的数据比单独的夜间照明数据更接近。最重要的是,利用一个国家的数据建立的模型——例如坦桑尼亚——在应用于马拉维或卢旺达等另一个国家的日光卫星图像时,效果非常好。这表明该模型定位了跨越国家和地区的财富的实际标志。并验证了论文的第二个论点:在众多的工具中,夜间照明数据是最好的工具,而不是单一的预测工具。

但研究人员仅使用该模型预测国家级数据。该模型只预测了尼日利亚或卢旺达整体的不平等,没有绘制国家以下的财富地图。范登赫克说,这将是下一个重要步骤——为了大规模应用,该模型必须成功预测国家以下贫困地区。

“很好,我们知道拉各斯发生了什么,”他说。“我们不知道这些远离主要人口中心的社区发生了什么。而这些信号不会有足够强的信号来捕捉。“

他说,撒哈拉以南非洲的贫困问题往往不是由国家一级的决定决定的,而是由脱离国家一级的资源链决定的。该地区小农场的所有者可能支持五亿人。这个模型能预测他们的情况吗,特别是村与村之间的情况?他说,尚不清楚该小组所依赖的数据来源是否过于粗糙,无法预测有用的国家以下范围。

而且这项研究还有另一个弱点,那就是它的强项。神经网络让研究人员一次寻找数据集之间的许多相关性,并使他们在建模之初就不再声明数据之间的明确关系。但是他们也可以生产出对人类用户来说完全陌生的软件:神经网络可以看到数据集之间的数千个相似之处,在人类眼中,这些相似之处看起来像是非常大的噪音。

这些是神经网络提出的四种不同“过滤器”的视觉印记。所有这些都是与夜间亮度相关的白天特征,所有这些对人类观众来说都是有意义的:从左到右,它们似乎画出了一幅城市、农田、水和道路的画面。(让等人。[科学]“它们不是很容易解释,很难知道发生了什么,”Jean说。“如果你想让人们信任并使用结果,这绝对是一个合理的担忧。“所以他欣慰地看到,这个模型从白天的图像中提取了与夜间亮度明显相关的各种变量(至少,就像凡人所理解的那样)。其中包括水、道路和农田的存在。

不过,“许多神经元会拾取你作为人去的东西,好吧,这里究竟拾取了什么?”他说。但随着研究小组使用更精确的数据,在更小的范围内,它仍然在模型选择中发现意外。在被要求用高分辨率卫星图像预测城市财富后,一个神经网络开始计算游泳池。

保存