[Talk-br] Fwd: Re: Street name data

Hermann Peifer peifer em gmx.eu
Segunda Março 24 01:24:45 UTC 2014


Tambem já pensei nos setores censitários. A hierarquia no RS (em todo 
país?) e: município > distrito > subdistrito > setor

No RS teve em 2010 (e tem ainda, pelo que eu sei): 496 municípios e dois 
"pseudo-municípios": 4300001 LAGOA MIRIM e 4300002 LAGOA DOS PATOS. (O 
bom neste projeto é que a gente não precisa se preocupar muito com os 
pseudo-municípios ;-)

Os 496 municípios gaúchos são divididos em:
1230 distritos > 1370 sub-distritos > 22728 setores

Estou usando os shape do IBGE para fazer a(s) lista(s) OSM, não 
trabablho direto com os tags boundary/admin_level do OSM. O CNEFE 2010, 
abaixado do ftp.ibge.gov.br [1] e as divisas municipais/setoriais de 
2010 abaixado do geoftp.ibge.gov.br [2] me parecem uma boa combinação 
para fazer comparações consistentes. Usar as "próprias" divisas do 
OSM-BR seria um detalho por resolver depois (já que pelo estou vendo, a 
maioria das divisas do OSM-BR é um resultado de uma importação histórica 
de uma outra versão de divisas originando do IBGE).

Vou fazer 3 novas tabelas na base das divisas setoriais: RUAS_CNEFE, 
RUAS_OSM e SETORES_IBGE. Estas tabelas vão ter mais linhas porque a 
mesma avenida comprida vai aparecer em vários setores. Mesmo asim, acho 
que "comparações setoriais" podem melhorar o resultado, pelo menos na 
teoria..

Abraços, Hermann

[1] 
ftp://ftp.ibge.gov.br/Censos/Censo_Demografico_2010/Cadastro_Nacional_de_Enderecos_Fins_Estatisticos/RS/
[2] 
ftp://geoftp.ibge.gov.br/malhas_digitais/censo_2010/setores_censitarios/rs.zip 



On 2014-03-23 21:12, Fernando Trebien wrote:
> Mas isso funcionaria também onde os distritos/subdistritos não estão
> mapeados no OSM?
>
> (Nem definimos ainda qual é o admin_level que se deve colocar pra
> representar esses casos. Mas provavelmente deveríamos ter essa
> discussão.)
>
> Eu estava pensando se esse método de comparação não poderia se
> estender para outros cadastros quaisquer (além do CNEFE). Assim seria
> mais fácil integrar no OSM o melhor de todos os mundos que temos
> disponíveis. Alguém sabe de outro cadastro que poderia ser
> interessante comparar com o OSM?
>
> 2014-03-23 17:04 GMT-03:00 Thiago Marcos P. Santos <tmpsantos em gmail.com>:
>> 2014-03-23 21:37 GMT+02:00 Fernando Trebien <fernando.trebien em gmail.com>:
>>> Exato. Isso na verdade me sugere um outro critério de ordenação do
>>> resultado: tamanho do nome/distância de Levenshtein. Seria um critério
>>> aproximado mas que ajudaria o revisor a começar direto com casos que
>>> raramente seriam descartados e a deixar pro final os difíceis de
>>> decidir. Postei no fórum o resultado de fazer assim, pra poder
>>> comparar facilmente.
>>>
>>> Vou tentar integrar o script com este outro arquivo pra gerar na saída
>>> o nome ao invés do código da cidade. Depois, dá até pra dividir a
>>> saída por cidade, colocar tudo num repositório, e só ir controlando no
>>> wiki quais arquivos já foram revisados (ou talvez até ir passando de
>>> um diretório para outro no repositório).
>>>
>>> Minha impressão até o momento: a comparação dos cadastros é bastante
>>> útil, mas não dá pra confiar no CNEFE sempre.
>>>
>>
>> No CNEFE tem informações sobre o distrito, sub-distrito, etc. Se
>> pegarmos as informações do way em questão no OSM e fizermos um
>> bounding box, poderíamos restringir a busca aos sub-distritos que
>> fazer overlap com este bounding box e deixaríamos o resultado mais
>> preciso.
>>
>> O que acham?
>>
>> _______________________________________________
>> Talk-br mailing list
>> Talk-br em openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-br
>
>
>





Mais detalhes sobre a lista de discussão Talk-br