<div dir="ltr">Quando você diz "normalizar os dados", você diz para utilizar no seu processamento?  Ou é para normalizar na base OSM?</div><div class="gmail_extra"><br><br><div class="gmail_quote">Em 23 de março de 2014 09:30, Thiago Marcos P. Santos <span dir="ltr"><<a href="mailto:tmpsantos@gmail.com" target="_blank">tmpsantos@gmail.com</a>></span> escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">2014-03-22 22:13 GMT+02:00 Hermann Peifer <<a href="mailto:peifer@gmx.eu">peifer@gmx.eu</a>>:<br>
><br>
> É mesmo: a qualidade dos dados do IBGE pode ser um problema.<br>
><br>
> Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203<br>
> endereços. Nemhum deles tem um acento e todos os nomes em letras<br>
> maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo<br>
> Levenshtein, mas agora estou na dúvidas si vale a pena mesmo.<br>
><br>
> Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido,<br>
> para ilustrar o estágio do mapeamento.<br>
><br>
<br>
O que eu faria neste caso é normalizar os dados de ambas as bases de<br>
dados (OSM e IBGE) colocando tudo minúsculo e sem acentos.<br>
<br>
Me parece que os logradouros classificados como "rua" e "avenida" na<br>
base do IBGE estão OK. Isto já cobre boa parte dos dados.<br>
<br>
Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do IBGE.<br>
<br>
[]'s<br>
<br>
_______________________________________________<br>
Talk-br mailing list<br>
<a href="mailto:Talk-br@openstreetmap.org">Talk-br@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-br" target="_blank">https://lists.openstreetmap.org/listinfo/talk-br</a><br>
</blockquote></div><br></div>