我们如何使用AI构建最新的Open Buildings数据集

2024年10月21日

[阅读时间]分钟阅读

Open Buildings 2.5D 时间序列数据集正帮助填补发展中世界人口数据的重大缺口。

A map of Earth against a gray and white grid. On the map, Central America, the Caribbean, South America, Africa and parts of Asia are covered in purple, yellow and pink to indicate building presence.

2021年，谷歌非洲研究团队启动了开放建筑，一个开源的数据集，包含了各地建筑轮廓大小的信息 Across 应翻译为“各地”，但根据上下文，更合适的可能是“跨越多个地区/国家的开源数据集”，但由于原文缺失具体地名或区域描述，这里保持简洁处理。如果严格依照指令：“确切的翻译，只输出翻译结果”，则：，一个开源的数据集，包含了建筑轮廓信息全球南方利用人工智能和高分辨率卫星图像制作。该团队有一个简单的愿景：填补发展中国家人口和密度数据上的重大空白。目前这是它的第三版，其数据集包含了非洲、南亚和东南亚、拉丁美洲及加勒比地区5800万平方公里范围内18亿栋建筑物的多边形信息。

各国政府、联合国以及众多组织、研究人员和非营利机构利用开放建筑数据来了解人口规模和分布情况，从而使疫苗接种活动、灾害应对等规划更加有效。它甚至改进了谷歌地图，增加了数百万个此前未被绘制的建筑物。

该团队——虽然主要位于加纳，但分布在特拉维夫、苏黎世及更广泛地区——自那以后一直在探索使该项目更加有用的方法。“我们始终处于黑客松模式中：尝试新想法，审视挑战和限制，并思考‘好吧，我们如何解决这个问题？’”谷歌研究项目经理Abdoulaye Diack说。“使用最初的原始数据集，我们未能捕捉到某个区域随时间演变的情况——这些数据是静态的。而这是我们的合作伙伴所寻求的信息。”

商业卫星图像提供商倾向于根据需求和利润优先获取影像，导致全球南方地区——约占地球面积的40%——没有定期且高分辨率的覆盖，一些偏远村庄和非正式定居点完全没有被覆盖。长期以来，欧洲空间局“哨兵-2”卫星等开源资源所拍摄、每五天重访一次的全球图像被认为分辨率太低，无法用于建筑物检测任务。

满怀希望地认为这个低分辨率可能没有他们想象中那么大的障碍，团队决定尝试一下。

首先，他们将由Sentinel-2捕捉到的一个低分辨率的区域图像放入他们的模型中，并要求该模型生成地面上建筑物的多边形。“这是一项非常困难的任务，但存在潜力，”Abdoulaye说。“因此我们要求该模型仅从图像中生成建筑物掩模——或者说是由与特定坐标相关的二进制像素组成的栅格数据。它做得相当不错，我们认为：这是可行的。”

大约一年后，在对模型进行了大量的辛勤迭代之后，团队发布了Open Buildings 2.5D 时间序列数据集上个月。涵盖2016年至2023年，它每年提供全球南方大部分地区建筑分布和数量的快照，还包括建筑物的高度，展示了发展、灾难和其他因素如何影响城市。用户只需选择一个区域，在不同的年份之间切换，并观察世界以彩色形状的模式扩张和收缩。

“关于”到2050年，可能还会有25亿人迁移到城市“对于那些在南半球工作的政府和组织来说，这可能是一个真正的变革性步骤，”谷歌研究产品经理奥利维亚·格雷厄姆说。“如果一个城市正在规划如何安置像医疗和教育这样的基本服务设施，或者在哪里发展供水和能源供应等基础设施，那么这个数据集展示了那些正在积极增长的区域。”

2018年9月28日，印度尼西亚沿海发生了一场7.4级地震，引发海啸，影响了苏拉威西岛上大约150万人。危机过后，建筑区域从海岸线后退，地震的影响在数据中可见。您可以探索这些数据在我们的互动地球引擎应用程序中.

您也可以在Open Buildings 2.5D 时间序列数据集演示中追踪埃及新开罗的建设情况。

团队是如何让他们的模型读取Sentinel-2模糊的卫星图像并自信地提供建筑物检测结果的？他们首先从解决问题开始。

“我们使用了教师-学生模型设置，同时对低分辨率图像进行‘超分辨率’处理并从中提取建筑物轮廓，”谷歌研究软件工程师克里希纳·萨普科塔说。“教师模型在高分辨率图像上训练以检测建筑物，并为学生模型提供标签。最终生成数据集的学生模型从教师模型的输出中学习。然后，它能够接收来自Sentinel-2的低分辨率图像并推断出更高分辨率版本的样子。”

教师模型为学生模型输出高分辨率训练标签。然后它可以从低分辨率图像中推断出建筑物的存在。

为了达到提取建筑物轮廓所需的细节级别，模型会使用一个地点多达32帧的Sentinel-2图像进行任何给定的预测。每一帧相对于其他帧都有轻微偏移，考虑到每张图片捕获之间微小的时间间隔，这有助于提高分辨率——类似于Pixel手机可以使用多张照片来实现的效果。为了更清晰的图像.

与提供精确建筑物多边形轮廓的原始数据集不同，新的时间序列数据集将建筑物用地边界表示为栅格数据。该模型还能够以平均绝对误差仅为1.5米（或不到一个楼层的高度）来预测建筑高度——这对于估算人口密度至关重要。

在其正式发布之前，时间序列数据集被提供给了包括乌干达非政府组织在内的受信任合作伙伴。太阳鸟AI“乌干达约73%的人口无法使用电力，Sunbird AI利用我们原有的数据库与当地政府合作，了解哪些地区最适合建设微电网或为家庭安装太阳能板，”奥利维亚说。“借助新的数据集，他们正在研究两个城镇——詹贾和福特港，并生成图表，让城市议会能够理解增长最快的区域并相应调整资源计划。这展示了如何将这些数据集作为更大的工具包的一部分来帮助了解人口状况及其变化。”

同样的好奇心驱使团队致力于在未来增强这一时间序列数据集。

“我生活在加纳，我可以亲眼看到我们的工作带来的变化以及可能产生的影响，”阿卜杜拉耶说。“非洲许多地方面临资源匮乏的问题，这可能导致数据不足，并产生严重的后续后果。能够成为致力于改变这一状况并产生积极影响的团队的一员是一种荣幸。”

我们如何使用AI构建最新的Open Buildings数据集

关于《我们如何使用AI构建最新的Open Buildings数据集》的评论

发表评论

摘要

相关新闻

相关讨论