[Talk-br] Vetorização de matas no OSM com Sentinel-2

Paulo Carvalho paulo.r.m.carvalho em gmail.com
Quinta Setembro 13 12:19:41 UTC 2018


Oi, bom dia, excelente iniciativa.  Entretanto tenho uma crítica quanto ao
sistema de classificação (passos 2 a 6).  Agregá-las com fórmulas do tipo
B11+((1-NDVI)*4000)) e depois usar IF's representa muita perda de
informação, além de que a relação entre elas pode não ser essa equação
(deveria verificar no crossplot) e seria bom apresentar uma fundamentação
física para essas relações.

Para ilustrar, abaixo é mostrado um crossplot entre duas variáveis onde se
observa três grupos: reservatórios arenosos contendo óleo; reservatórios
arenosos com água e rochas que não têm fluido algum (shale).  Quando
aplicamos essa classificação a um mapa, fica fácil saber onde furar um
poço, qual a extensão das reservas, etc..   Note que entre as duas
variáveis não há uma relação linear do tipo Ax + B tal como a equação
apresentada.

[image: image.png]

Agora considere o nosso caso.  Só com o apresentado na página temos 6
variáveis: R, G, B, B11, NDVI e EVI2.  Isso aliado à grande quantidade de
dados tem um ótimo potencial para criar um classificador automático ou
supervisionado robusto e válido em qualquer lugar, o que reduziria MUITO a
quantidade de trabalho manual.  Poderíamos ainda descobrir classes que não
aparecem no dado do experimento (ex.: afloramentos rochosos, pedreiras,
lixões, minas, grandes rebanhos de animais, etc) que poderiam ser
classifcadas como floresta incorretamente.

Eu começaria pelo tratamento da imagem (cuidado com a escolha do filtro).
Por exemplo, na fórmula que citei, o valor de NDVI está sendo multiplicado
por 4000, então qualquer ruído que esse canal tenha será amplificado 4000
vezes, o que com certeza não é bom.  Depois faria o upscaling das imagens
para reduzir o tamanho dos dados, o que permitiria treinar o classificador
em uma área bem maior.  Os corpos (florestas) que se prentende mapear
espera-se que sejam de grande extensão.  Portanto, uma resolução alta
demais só contribui para o custo computacional sem agregar informação.

Em seguida, mudaria o modelo de cor do canal visível de RGB para HSV, por
exemplo, para separar o brilho do caráter espectral das cores (por exemplo,
uma floresta à sombra de uma nuvem poderia ser classificada diferentemente
de outra sob sol intenso).  Estudaria os histogramas e a correlação entre
todas variáveis em crossplots para ter um vislumbre dos grupos (classes) e
assim escolher um algoritmo de classificação multivariado: Árvore de
Decisão, Rede Neuronial, Random Forest, Dendrograma, k-means, etc. O QGis
provavelmente tem ao menos um desses algoritmos.

O algoritmo de classificação "pintará" os mapas com as diversas classes
encontradas, bastaria somente dar nomes e outros atributos a elas
dependendo do que o algoritmo "pintou".  No exeplo do crossplot acima, o
algoritmo só pintou de azul, vermelho e preto.  Para dizer o que é cada
classe, deve-se ver as faixas de valores que correspondem a elas ( o óleo é
menos denso que a água, assim as rochas que contêm esses fluidos têm
respostas acústicas de acordo ).  No nosso caso, uma simples verificação
visual no mapa bastaria para dizer que o que foi pintado de azul, por
exemplo, corresponde a "wood".

att,

PC


Em qua, 12 de set de 2018 às 20:40, Sérgio V. <svolk2 em hotmail.com> escreveu:

> Prezados(as),
>
> venho aqui expor e submeter à apreciação da comunidade OSM no Brasil uma
> proposta de método de mapeamento de matas para o OSM (natural=wood e
> landuse=forest) , baseado em vetorização semi-automatizada de imagens do
> satélite Sentinel-2, para o que peço autorização para uso em mapeamento no
> OSM no Brasil.
>
> A proposta detalhada passo-a-passo encontra-se documentada na página wiki
> "Vetorização de matas com Sentinel-2":
>
> https://wiki.openstreetmap.org/wiki/Vetoriza%C3%A7%C3%A3o_de_matas_com_Sentinel-2
>
> Os testes já realizados (sem upload) encontram-se na página:
>
> https://wiki.openstreetmap.org/wiki/User:SergioAJV/Sentinel-2_vectorizing_tests
>
> O objetivo desta proposta, resumidamente, é contribuir com uma
> ferramenta para o mapeamento no OSM de grandes coberturas de matas.
>
> A justificativa consiste, basicamente, em que o método possibilita mapear
> grandes áreas de mata, de municípios ou regiões de interesse,
> adequadamente, mais rapidamente, e com melhor precisão geométrica do que o
> que comumente pode ser encontrado ou realizado em mapeamento exclusivamente
> manual e com as imagens disponíveis nem sempre atualizadas e que, de todo
> modo, não permitem escolha, como de épocas do ano mais propícias à
> identificação de vegetação.
>
> O método se destina a matas. Não se destina ao mapeamento de objetos
> pequenos. A resolução das imagens disponíveis é de 10 e 20m/pixel, e as geometrias
> resultantes da ordem de ~1nó/10m em curvas. Ainda assim maior do que se
> pode encontrar muitas vezes em mapeamento manual de "landcover", como
> matas. O processo pode gerar cerca de 100 a 150 nós por km2, em áreas com
> muita variedade de tipos de matas. O que significa cerca de 1.000.000 de
> nós a partir de 1 imagem Sentinel de 100x100km. Menos que isso em áreas
> mais homogêneas.
>
> O método exige o controle ativo dos parâmetros de distinção de classes de
> vegetação e demais elementos geográficos a partir das imagens de satélite,
> em todo o andamento do processo, até o resultado final na geração de
> vetores .osm.
> Exige certo tempo na aplicação dos passos, e sobretudo atenção, como na
> medição de valores de pixels para as classes de objetos, escolha de objetos
> para amostragem, bem como na verificação do resultado final. Não é um
> processo imediato. Ainda assim, permite grande ganho de tempo no mapeamento.
>
> Mais detalhes podem ser encontrados nas citadas páginas de documentação.
>
> Agradeço sua atenção e apreciação, acolhendo questões ou comentários no
> que desejarem e/ou julgarem necessário.
>
>
> - - - - - - - - - - - - - - - -
>
> Sérgio - http://www.openstreetmap.org/user/smaprs
> _______________________________________________
> Talk-br mailing list
> Talk-br em openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20180913/0c06ef2a/attachment-0001.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 183596 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20180913/0c06ef2a/attachment-0001.png>


Mais detalhes sobre a lista de discussão Talk-br