Análise GeoEspacial Google Earth Engine

Google Earth Engine e Machine Learning para análise geoespacial

O Google Earth Engine (GEE) e o Machine Learning (ML) para análise geoespacia
Escrito por Mario Fomaca Jr.

O aprendizado de máquina (Machine Learning, ou ML) é uma ferramenta poderosa da inteligência artificial para análise de dados geoespaciais. O Google Earth Engine (GEE) oferece uma plataforma ideal para aplicar técnicas de ML à observação da Terra, facilitando a construção de modelos para diversas aplicações.

Um exemplo crucial é o mapeamento da cobertura e uso da terra, essencial para analisar a distribuição de vegetação, água, áreas urbanizadas e outros elementos. Essa informação auxilia empresas, pesquisadores e governos na compreensão de paisagens complexas, permitindo a tomada de decisões informadas para o desenvolvimento sustentável e a mitigação de impactos ambientais.

Assim, mostraremos aqui como os recursos de Machine Learning (ML) disponíveis no Google Earth Engine podem facilitar a construção de modelos de aprendizado de máquina para diferentes áreas, como mapeamento da cobertura do solo.

Introdução ao Google Earth Engine 

O Google Earth Engine (GEE) é um serviço exclusivo do Google Cloud que permite às empresas analisar petabytes de dados geoespaciais, processar imagens de satélite e centenas de datasets de clima, florestas, solos, agricultura, topografia, urbanização e outros. Também conta com a possibilidade de uso de modelos de Machine Learning e de integração com outras ferramentas do ecossistema Google Cloud, como o Vertex AI.

O GEE está hospedado na nuvem do Google e oferece acesso a um catálogo imenso de imagens de satélite gratuitas e atualizadas, além de diversos conjuntos de dados geoespaciais. Entre eles, estão dados Landsat (USGS / NASA), MODIS (Terra / Aqua), e Sentinel-1, 2, 3 e 5P, além de dados de precipitação, elevação, temperatura da superfície do mar e dados climáticos, e muito mais.

Por meio do GEE, diversas organizações podem acessar um extenso catálogo de dados públicos e privados armazenados na nuvem, que, em conjunto com APIs e um servidor de aplicativos, facilitam o uso de modelos de ML.

Machine Learning 

Mas o que é Machine Learning? É o uso de algoritmos para permitir que máquinas aprendam com dados sem serem explicitamente programados. Em um contexto geoespacial, o ML usa dados geoespaciais (como imagens de satélite, dados de sensores e dados de localização) para identificar padrões, fazer previsões e apoiar a tomada de decisões em aplicações como monitoramento ambiental, planejamento urbano e navegação.

Há diferentes tipos de sistemas de ML divididos em categorias amplas. Cada categorização é baseada na quantidade e no tipo de supervisão humana que recebem durante o treinamento, sendo a etapa em que são apresentados exemplos (amostras) para o computador aprender a partir delas.

No aprendizado supervisionado, você sabe quais são seus exemplos (amostras) e o que espera de resultados (chamados de rótulos). No aprendizado não supervisionado, você pede ao modelo para dizer quais são esses resultados que ele encontrou nos dados. Nesse caso, o modelo busca padrões, estruturas e relações nos dados sem a orientação explícita de resultados esperados. 

Machine learning no Google Earth Engine

Os modelos de ML integrados ao GEE oferecem suporte à classificação (onde se prevê diferentes classes) e à regressão (onde se prevê uma quantidade):

Classificação supervisionada: o GEE possui modelos que permitem classificar a terra a partir de exemplos (amostras) de verdade, fundamentais para ensinar um modelo a diferenciar classes.

Classificação não supervisionada: os classificadores não supervisionados do Earth Engine são particularmente úteis quando não existem dados de verdade de campo (amostras), quando você não conhece o número final de classes ou quando deseja fazer experimentos rápidos.

— Regressão: enquanto um modelo de classificação tenta colocar cada entrada em uma classe discreta, um modelo de regressão tenta prever uma variável contínua para cada entrada. Por exemplo, um modelo de regressão consegue prever a qualidade da água, a percentagem de cobertura florestal ou o rendimento das colheitas.

Machine Learning em escala

A escalabilidade de aplicações de ML no GEE é uma de suas principais vantagens. O GEE oferece uma infraestrutura em nuvem robusta, permitindo o processamento de grandes conjuntos de dados geoespaciais com algoritmos de ML sem a necessidade de gerenciamento de infraestrutura ou recursos computacionais locais. Isso se traduz na capacidade de treinar e aplicar modelos de ML em imagens de satélite e outros dados geográficos cobrindo vastas áreas geográficas, algo impensável com recursos computacionais tradicionais.

A escalabilidade é alcançada através da capacidade do GEE de distribuir o processamento de dados por meio de múltiplos servidores, paralelamente. Isso permite que algoritmos de ML, mesmo complexos, sejam executados eficientemente em conjuntos de dados gigantescos, em tempos relativamente curtos.

No entanto, a escalabilidade também é limitada pelos recursos disponíveis na plataforma, e a complexidade do modelo e o tamanho dos dados podem ainda afetar o tempo de processamento, necessitando de otimizações de código e escolha cuidadosa de algoritmos para atingir o máximo de performance.

Apesar dessas limitações, a escalabilidade do GEE representa um salto significativo para o desenvolvimento e aplicação de ML em larga escala na análise de dados geoespaciais.

Machine learning fora do Google Earth Engine

O aprendizado profundo (deep learning) e as redes neurais artificiais (RNAs) são técnicas de aprendizado de máquina eficazes para lidar com dados complexos, como imagens de satélite.

No entanto, as APIs de aprendizado de máquina do Google Earth Engine não oferecem suporte nativo para deep learning ou RNAs. Para utilizá-los, é necessário treinar os modelos externamente ao Earth Engine, utilizando frameworks como TensorFlow ou PyTorch. Alternativamente, ferramentas como scikit-learn e XGBoost também podem ser empregadas para modelos de aprendizado de máquina mais tradicionais.

Para escalar o processamento e gerenciamento de modelos, incluindo aqueles de deep learning, o Google Vertex AI oferece uma solução robusta. Ele disponibiliza ferramentas e bibliotecas otimizadas para o processamento de grandes volumes de dados geoespaciais vetoriais e raster. O Vertex AI simplifica a implantação, o monitoramento e a otimização de modelos geoespaciais em produção, incluindo recursos de automação e controle de custos.

Leia também:

image-2

A Geoambiente é parceira Premier do Google Cloud, revendedora oficial da Plataforma Google Earth Engine.
Com 30 anos de experiência em projetos de Análise Geoespacial e Sensoriamento Remoto, contamos com um time completo de especialistas para apoiar a sua empresa na realização de análises e processamento de dados geoespaciais.

Fale com os nossos especialistas em Google Earth Engine


Sobre o(a) autor(a)

Mario Fomaca Jr.

Geospatial Specialist
Com formação em Engenharia Agrícola e mestrado em Sensoriamento Remoto, é especialista em projetos de processamento digital de imagens e dados de satélite, agrometeorologia, machine learning, AI e desenvolvimento de algoritmos para o processamento de dados obtidos via satélite.

Deixe um Comentário