Open Buildings: Conjunto de Dados de Edificações do Sul Global

As geometrias de edificações (building footprints) são utilizadas em estudos e pesquisas urbanas de diversas temáticas, como densidade populacional, modelagens de acesso a serviços, expansão urbana, simulações de risco de desastres, planejamento de sistemas de transporte e infraestrutura básica, dentre outros.

No entanto, há uma lacuna na disponibilidade de dados espaciais completos e abertos em muitas regiões, especialmente no chamado Sul Global (países em desenvolvimento, principalmente na África, Ásia e América Latina), o que limita análises urbanas de maior complexidade. É nesse contexto que iniciativas de dados abertos ganham relevância.

O objetivo deste post é apresentar o Open Buildings, um conjunto de dados geográficos de edificações produzido pelo Google Research, descrevendo suas características principais, formatos de dados, métodos de acesso, bem como discutir pontos positivos e limitações dessa fonte, com foco em sua utilidade para estudos urbanos.

1. Origem do Open Buildings

O Open Buildings foi desenvolvido pela equipe de pesquisa do Google Research com foco em aplicações de impacto social. Seu desenvolvimento se inicia a partir da necessidade de preencher lacunas de informação sobre edificações em países e regiões onde dados oficiais ou produtos comerciais são limitados ou inexistentes. A partir de modelos de aprendizagem profunda (deep learning) aplicados a imagens de satélite de alta resolução, o projeto realiza a detecção automática de edificações em grandes extensões territoriais. A primeira versão do conjunto de dados foi lançada com foco no continente africano, com mais de 500 milhões de detecções iniciais, e desde então evoluiu para cobrir grandes partes do Sul Global — incluindo África, Sul da Ásia, Sudeste Asiático, América Latina e Caribe — com versões subsequentes que ampliam e refinam a cobertura e a precisão do conjunto (Google Research, Open buildings, s.d.; European Data, 2021).

O projeto também foi expandido para incluir um conjunto de dados temporal 2.5D, que além de presença de edificações, oferece informação anual sobre contagem fracionada de edifícios e alturas estimadas, cobrindo o período de 2016 a 2023, o que adiciona uma dimensão temporal valiosa para análises de crescimento urbano e mudanças de uso do solo (Google Research, Open Buildings 2.5D Temporal Dataset, s.d.).

2. Características

2.1 Conteúdo, Escala e Cobertura

A versão principal mais recente (Open Buildings V3) contém 1,8 bilhão de detecções de edificações, com polígonos que representam seus contornos, cobrindo um total de aproximadamente 58 milhões de km² no Sul Global. Cada registro inclui os polígonos das edificações (no formato WKT), coordenadas de posição (latitude e longitude), área estimada do polígono; pontuação de confiança atribuída à qualidade da modelagem e o Plus Code que identifica a localização do edifício (Google Research, Open buildings, s.d.).

Não há, no entanto, atributos descritivos para cada edificação, como tipo de uso (residencial, comercial etc.), endereço ou informações socioeconômicas de cada edificação — apenas geometria e métricas associadas ao processo de inferência, uma vez que os tipos e qualidade desses dados variam de acordo com países e regiões. Mas a existência dos dados vetoriais das edificações já facilita a coleta e atualização de dados em campo, por exemplo.

2.1 Formatos de Dados e Acesso

Os dados são disponibilizados em arquivos CSV espacialmente sharded (organizados por células S2 em nível 4), com cada arquivo podendo alcançar vários gigabytes. Isso implica que grandes partes do conjunto de dados precisam ser baixadas em blocos ou processadas em plataformas de computação na nuvem (Google Research, Open buildings, s.d.).

Uma alternativa ao download direto de todos os arquivos CSV é o uso de ferramentas como o Google Earth Engine, que permite acessar o conjunto de dados como uma FeatureCollection, facilitando filtragem por região ou exportação de subconjuntos menores (Google Developers, s.d.).

3. Como Baixar os Dados

No portal oficial do projeto há uma interface que permite selecionar e baixar os arquivos de acordo com a célula ou país de interesse. Valores totais de dados podem chegar a dezenas ou centenas de gigabytes, dependendo do escopo (Google Research, Open buildings, s.d.). Para aprender a realizar o download dos dados e abri-los em um software SIG, como o QGIS, baixe o tutorial nos links abaixo:

[Português] Tutorial: Baixando Dados do Open Buildings e Importando para o QGIS (pdf)

[English] Tutorial: Downloading Data from Open Buildings and Importing it into QGIS (pdf)

Há outras alternativas para download dos dados. É possível usar ferramentas como gsutil para baixar recursivamente os diretórios de dados diretamente de buckets públicos do Google Cloud Storage, por exemplo:

gsutil cp -R gs://open-buildings-data/v3/polygons_s2_level_4_gzip .

No Google Earth Engine, o conjunto de dados está catalogado e pode ser acessado e filtrado por região ou exportado em formatos como GeoJSON, shapefile ou assets pessoais, usando scripts em JavaScript ou Python (Google Developers, s.d.).

4. Pontos Positivos e Negativos

4.1 Pontos Positivos

  • Cobertura ampla e gratuita: disponível para grande parte do Sul Global sem barreiras de custo ou licenciamento restritivo, permitindo uso acadêmico, governamental e comunitário.
  • Base científica e uso de IA: o uso de modelos de aprendizado profundo sobre imagens de satélite de alta resolução amplia a consistência e qualidade dos dados em regiões com pouca informação disponível;
  • Licenciamento aberto: dados licenciados sob Creative Commons Attribution – CC BY-4.0 ou Open Data Commons ODbL, oferecendo flexibilidade para integração em projetos abertos e interoperáveis;
  • Suporte a análises urbanas complexas: dados com potencial para análises de densidade, mudanças temporais (via dataset 2.5D), planejamento de infraestrutura e resposta a emergências.

4.2 Pontos Negativos / Limitações

  • Ausência de atributos descritivos: não há informações sobre uso urbano, tipologia ou função das edificações, o que limita análises que dependam de categorias socioeconômicas ou tipológicas específicas;
  • Tamanho e complexidade de dados: a grande escala do conjunto de dados implica desafios de armazenamento e processamento local; sem ferramentas de filtragem ou computação na nuvem, pode ser inviável para pesquisadores com recursos limitados;
  • Variação de qualidade espacial: em algumas áreas, imagens de satélite desatualizadas ou cobertas por nuvens podem reduzir a precisão da detecção, o que impõe variabilidade espacial na confiabilidade das geometrias;
  • Qualidade da vetorização de formas curvas: como a vetorização dos dados de edificações é realizado a partir de imagens de satélite, muitas edificações curvas ficam com deformações em suas geometrias, parecendo escalonamentos de formas retas;
  • Falta de atualizações frequentes: embora existam versões aprimoradas, a periodicidade de atualizações não é imediata, o que pode ser limitante para análises que exigem dados em tempo quase real.

Considerações Finais

O Open Buildings representa um marco importante na democratização do acesso a dados espaciais de edificações, especialmente para regiões tradicionalmente sub-representadas em bases geográficas de alta qualidade. A possibilidade de acessar cerca de 1,8 bilhão de footprints com cobertura sobre vastas áreas do Sul Global viabiliza pesquisas em estudos urbanos. Contudo, suas limitações, especialmente a ausência de atributos socioeconômicos, desafios de manipulação de grandes volumes e variações de qualidade, devem ser consideradas no desenvolvimento de projetos e metodologias de pesquisa.

Ao combinar o Open Buildings com outros conjuntos de dados — como informações censitárias, dados de uso do solo ou bases crowd-sourced como OpenStreetMap — pesquisadores e profissionais podem enriquecer análises e superar parcialmente algumas das limitações inerentes aos dados puramente geométricos. A importância de iniciativas como esta reside tanto na dimensão técnica quanto no potencial para facilitar o acesso a dados, elemento importante para a elaboração de qualquer pesquisa técnica/científica.

Referências

EUROPEAN DATA. Discover Open Buildings Dataset. European Data. 2021. Disponível em: https://data.europa.eu/lt/news/discover-open-buildings-dataset Acesso em: 04 jan. 2026.

GOOGLE DEVELOPERS. Open Buildings V3 Polygons. Earth Engine Data Catalog [s.d.] . Disponível em: https://developers.google.com/earth-engine/datasets/catalog/GOOGLE_Research_open-buildings_v3_polygons Acesso em: 04 jan. 2026.

GOOGLE RESEARCH. Open Buildings: Dataset of Building Footprints to Support Social Good Applications. Open Buildings [s.d]. Disponível em: https://sites.research.google/gr/open-buildings Acesso em: 04 jan. 2026.

GOOGLE RESEARCH. Open Buildings 2.5D Temporal Dataset. Open Buildings. [s.d.]. Disponível em: https://sites.research.google/gr/open-buildings/temporal Acesso em: 04 jan. 2026.

Deixe um comentário