[Talk-br] idéias dados IBGE >> OSM: CNEFE, setores censitários, quarteirões.
Fernando Trebien
fernando.trebien em gmail.com
Terça Abril 1 15:44:37 UTC 2014
Oi Lucas,
A) Eu não sei se poderíamos importar no OSM os contornos dos setores
censitários, não temos tags pra isso ainda. Mas podemos pensar em
propor essas tags. Setores não são nem áreas residenciais
(landuse=residential), nem limites administrativos
(boundary=administrative), seriam algo novo. Talvez tenhamos alguns
problemas em disponibilizar essa informação para que as pessoas
alterem como queiram, o que poderia introduzir erros uma vez que os
setores não são visíveis/identificáveis em solo e/ou imagens de
satélite.
C) Seria bem interessante importar os domicílios rurais com base
nessas coordenadas. Onde encontramos essa informação?
0) Fiz a importação dos aglomerados subnormais (que são um subconjunto
dos setores censitários) e a geometria me pareceu muito boa nos casos
que eu tratei (revisei mais de 10 mil polígonos, um por um). Só em
Salvador havia um deslocamento uniforme (que o Wille me avisou e eu
corrigi manualmente depois) de menos de 30 metros.
1) Com o "osmosis" (https://wiki.openstreetmap.org/wiki/Osmosis) você
consegue extrair geometria a partir de um polígono-limite. Se você
baixar o mapa do país
(http://download.geofabrik.de/south-america/brazil.html), pode aplicar
o osmosis a cada uma das cidades ou mesmo a cada setor censitário (a
partir do shape do IBGE), e com isso descobrir quais ruas pertencem a
cada cidade/setor. Seria um processamento complexo e talvez demorado,
mas possível.
2) Eu acho esse assunto muito interessante e acho que deveríamos
pensar em generalizar para cadastros quaisquer (não só o CNEFE). Vamos
criar uma página no wiki pra tratar disso como um projeto (com
objetivos, idéias/brainstorm, obstáculos a resolver, etc.)? Acho mais
fácil chamar gente pra nos ajudar se fizermos isso, e pra servir de
registro/inspiração pra revisões similares no futuro.
Da maneira que eu sugeri no fórum, acho arriscado aplicar uma correção
100% automática. O melhor é sugerir uma correção e deixar que as
pessoas decidam. O CNEFE já se mostrou um tanto desatualizado nos
casos em que eu testei.
Eu também tinha em mente dividir o território em partes e entregar o
resultado da comparação pros mapeadores locais, que então nos
avisariam quais porções já foram tratadas/revisadas (ninguém mais
precisaria repetir a comparação nessas porções).
3) Acho uma idéia interessantíssima.
4) Acho que se você conseguir extrair uma lista de nomes por setor
como eu sugeri em (1), você não precisa fazer esse pareamento.
Num primeiro momento, acho que o mais fácil seria fazer assim:
- a partir dos shapes dos setores censitários do IBGE, extrair nomes
de ruas para cada setor; isso envolve usar o osmosis pra extrair a
geometria dentro dos limites do setor, e depois usar algo como o
osmfilter pra extrair o nome das ruas
- gerar, para cada setor, o resultado da comparação dos nomes de ruas
(talvez usando o script que eu propus no fórum, com melhorias)
- descartar os setores que não tiverem diferenças
- distribuir para os mapeadores locais (talvez através do wiki) o
resultado da comparação por setor, junto com o shape do setor, para
que possam fazer os ajustes que acharem necessários
- conforme vão consumindo essa informação, os mapeadores nos
informariam e nós registraríamos no wiki quais setores já foram
revisados (com isso os esforços se concentrariam nos setores que ainda
não foram revisados)
O que mais poderíamos fazer:
- uma interface com o LeafletJS que, a partir da posição atual do
usuário no mapa, descobriria qual é o setor mais próximo, mostraria o
seu contorno e o resultado da comparação
Mas o pessoal que está acostumado com o JOSM não precisaria muito
disso. Poderíamos colocar (no próprio artigo do projeto) como usar o
JOSM para fazer a revisão; isso seria mais fácil do que desenvolver
uma interface só pra mostrar as diferenças graficamente com algum grau
de aproximação.
O mesmo processo poderia ser aplicado pra todas as demais comparações
que pensarmos em fazer no futuro.
Acho que, pras cidades menores, seria mais rápido/eficiente fazer a
revisão por cidade ao invés de por setor.
Que tal?
2014-03-31 6:32 GMT-03:00 Lucas Ferreira Mation <lucasmation em gmail.com>:
>
> Prezados,
>
> Sou economista e trabalho no IPEA, entre outras coisas, com questões de
> economia urbana e favelas. Sempre sentimos falta de uma base de dados
> completa, precisa e gratuita de ruas, e outros atributos. Apenas
> recentemente tive contato com o OSM e estou impressionado com a riqueza de
> informações disponíveis. O projeto e o trabalho de vocês é fantástico.
>
> Como tenho trabalhado com as bases de setor censitário e CNEFE do censo
> 2010, minha primeira idéia ao entrar em contato com o OSM foi de trazer as
> informações destas bases para dentro do OSM, ou como um rascunho-guia para
> pessoas validarem. Sugeri esta idéia no forum
> e o Alexandreme sugeriu a lista talk-br, onde encontrei outras treads com
> idéias similares. Listo abaixo as informações que sei destas bases do Censo
> 2010, e depois minhas idéias sobre como poderiam ser exploradas/mireradas:
>
> A) Setor censitário: são uma divisão do território para operacionalizar a
> coleta de informação no censo, tal que um setor seja área de
> responsabilidade de um único recenseador, com 250 a 350 domicílios em áreas
> urbanas, um pouco menos em áreas rurais. Costumam corresponder a uns poucos
> quarteirões, mas podem ser apenas um quarteirão, ou até meio quarteirão em
> áreas muito densas. São 316,5 mil setores em 2010.
> O IBGE fornece um shapefile para cada uf com os polígonos dos setores. Além
> disso o IBGE fornece uma base de dados com informações
> demográficas e econômicas agregadas para os moradores de cada setor
> censitário. O grau de precisão destes shapes varia de cidade para cidade.
>
> B) Base de quarteirões/quadras: o IBGE também dispõem internamente de uma
> base de dados de quarteirões, entretanto esta base, em formato digital não é
> divulgada. Aprendi com o projeto IBGEtools (muito bacana por sinal), que
> imagens dos quarteirões de cada setor estão dispníveis em PDF no site do
> IBGE.
>
> C) CNEFE : lista os endereços de todos os domicílios recenseados = 81
> milhões de observações. Para os domicílios rurais são incluídas as
> coordenadas do domicílio. Para os urbanos é indicado o setor censitário
> (localização conhecida pelo item A). Também são indicados o quarteirão e
> face de quarteirão, cujo shape eles não divulgam mas que cuja numeração
> segue uma contagem seguencial dentro do setor (acho que no sentido horário).
>
> Dado isso, listo as coisas dúvidas que penso que podem ser feitas e as
> dúvidas associadas:
>
> 0) medir imprecisão dos shapes de setor censitário: acho que este
> diagnóstico seria a primeira coisa a ser feita seria, para ter uma idéia do
> grau de erro deste dado em cada cidade. Já foi feito alguma estimativa do
> tipo ? Alguma tentativa de corrigir os shapes de setor censitário? Digo isso
> porque as idéias subsequentes, na maioria usam o shape de setores para
> juntar espacialmente os dados.
>
> 1) Comparar listas de ruas CNEFE vs. OSM para ver o grau de coberturado OSM:
> , conforme proposto/implementado para o Brasil (aqui1 e aqui2) e Alemanha
> (aqui). Esta comparação pode ser feita em diversas escalas (município,
> distrito, subdistrito e até setor (supoondo mapas compatíveis) na forma de
> tabela ou de um heatmap. Aliás, baixei o shape de ruas do Brasil do OSM mas
> não vem com informação de município ou nenhuma indicação geográfica.Como
> obtenho isso nos shapes do OSM? ou preciso eu mesmo cruzar com um shape de
> municípios no qgis?
>
> 2) Dado este paramento, o CNEFE poderia ser usado para corrigir typos dos
> nomes de ruas no OSM, ou pelo menos sugerir correções. (neste caso seria bom
> fazer um matching probalistico/fuzzy dos nomes).
>
> 3) Criar traçados de ruas a partir de CNEFE+shape-setores. Conforme descrito
> no post no forum, sabendo que a rua passa dentro de um conjunto de setores
> seria possível esboçar o trajeto da rua, ou uma área no meio da qual sabemos
> que ela passa, o que poderia servir de guia para os mapeadores.
>
> 4) Pareamento de quarteirões e faces de quarteirão do CNEFE e do OSM em
> áreas já mapeadas. Supondo que o perímetro do setor seja conhecido
> (shape-setor seja preciso) deve ser possível identificar qual quarteirão do
> CNEFE corresponde a qual quarteirão do OSMs. Sendo assim seria possível
> adicionar toda a estrutura de números de rua do CNEFE ao OSM.
>
> Enfim, estas são a idéias mais preliminares, espero que o email não tenha
> ficado longo demais. Queria ver o que o pessoal acha delas e se alguém se
> anima a ajudar. Tenho algumas idéias sobre algoritmos, etc para fazer estes
> cruzamentos, mas não sei python, detalhes do OSM , etc para implementa tudo
> num código na web.
>
> abraço
> Lucas
>
> _______________________________________________
> Talk-br mailing list
> Talk-br em openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>
--
Fernando Trebien
+55 (51) 9962-5409
"Nullius in verba."
Mais detalhes sobre a lista de discussão Talk-br