[Talk-br] Fwd: Re: Street name data
Thiago Marcos P. Santos
tmpsantos em gmail.com
Domingo Março 23 12:30:38 UTC 2014
2014-03-22 22:13 GMT+02:00 Hermann Peifer <peifer em gmx.eu>:
>
> É mesmo: a qualidade dos dados do IBGE pode ser um problema.
>
> Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203
> endereços. Nemhum deles tem um acento e todos os nomes em letras
> maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo
> Levenshtein, mas agora estou na dúvidas si vale a pena mesmo.
>
> Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido,
> para ilustrar o estágio do mapeamento.
>
O que eu faria neste caso é normalizar os dados de ambas as bases de
dados (OSM e IBGE) colocando tudo minúsculo e sem acentos.
Me parece que os logradouros classificados como "rua" e "avenida" na
base do IBGE estão OK. Isto já cobre boa parte dos dados.
Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do IBGE.
[]'s
Mais detalhes sobre a lista de discussão Talk-br