[Talk-br] Fwd: Re: Street name data

Paulo Carvalho paulo.r.m.carvalho em gmail.com
Domingo Março 23 12:50:30 UTC 2014


Quando você diz "normalizar os dados", você diz para utilizar no seu
processamento?  Ou é para normalizar na base OSM?


Em 23 de março de 2014 09:30, Thiago Marcos P. Santos
<tmpsantos em gmail.com>escreveu:

> 2014-03-22 22:13 GMT+02:00 Hermann Peifer <peifer em gmx.eu>:
> >
> > É mesmo: a qualidade dos dados do IBGE pode ser um problema.
> >
> > Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203
> > endereços. Nemhum deles tem um acento e todos os nomes em letras
> > maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo
> > Levenshtein, mas agora estou na dúvidas si vale a pena mesmo.
> >
> > Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido,
> > para ilustrar o estágio do mapeamento.
> >
>
> O que eu faria neste caso é normalizar os dados de ambas as bases de
> dados (OSM e IBGE) colocando tudo minúsculo e sem acentos.
>
> Me parece que os logradouros classificados como "rua" e "avenida" na
> base do IBGE estão OK. Isto já cobre boa parte dos dados.
>
> Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do
> IBGE.
>
> []'s
>
> _______________________________________________
> Talk-br mailing list
> Talk-br em openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140323/19879775/attachment.html>


Mais detalhes sobre a lista de discussão Talk-br