<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
{font-family:Tahoma;
panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0cm;
margin-bottom:.0001pt;
font-size:12.0pt;
font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
{mso-style-priority:99;
color:blue;
text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
{mso-style-priority:99;
color:purple;
text-decoration:underline;}
p
{mso-style-priority:99;
mso-margin-top-alt:auto;
margin-right:0cm;
mso-margin-bottom-alt:auto;
margin-left:0cm;
font-size:12.0pt;
font-family:"Times New Roman","serif";}
span.EstiloDeEmail18
{mso-style-type:personal-reply;
font-family:"Calibri","sans-serif";
color:#1F497D;}
.MsoChpDefault
{mso-style-type:export-only;
font-family:"Calibri","sans-serif";
mso-fareast-language:EN-US;}
@page WordSection1
{size:612.0pt 792.0pt;
margin:70.85pt 3.0cm 70.85pt 3.0cm;}
div.WordSection1
{page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=PT-BR link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Grafia de rua realmente é um problema sério, penas para ficar em um exemplo que tenho catalogado devido ao processo de Auditoria de Endereços que faço em relação a base de CEPs, este é um caso real retirado de arquivo de um cliente:<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><div align=center><table class=MsoNormalTable border=0 cellspacing=0 cellpadding=0 style='border-collapse:collapse'><tr><td width=340 valign=top style='width:255.05pt;border:solid black 1.0pt;border-right:none;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>RUA <u>RROUXINOL</u> NR 575<span style='color:black'><o:p></o:p></span></span></p></td><td width=340 valign=top style='width:255.2pt;border:solid black 1.0pt;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>R <u>ROXINOL</u> NUM 575<span style='color:black'><o:p></o:p></span></span></p></td></tr><tr><td width=340 valign=top style='width:255.05pt;border-top:none;border-left:solid black 1.0pt;border-bottom:solid black 1.0pt;border-right:none;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>R <u>ROUCHINOL</u> 575<span style='color:black'><o:p></o:p></span></span></p></td><td width=340 valign=top style='width:255.2pt;border:solid black 1.0pt;border-top:none;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>R <u>REGIONOL</u> 575<span style='color:black'><o:p></o:p></span></span></p></td></tr><tr><td width=340 valign=top style='width:255.05pt;border-top:none;border-left:solid black 1.0pt;border-bottom:solid black 1.0pt;border-right:none;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>RUA <u>AV</u> ROUXINOL 575<span style='color:black'><o:p></o:p></span></span></p></td><td width=340 valign=top style='width:255.2pt;border:solid black 1.0pt;border-top:none;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>R <u>ROXINO</u> 575<span style='color:black'><o:p></o:p></span></span></p></td></tr><tr><td width=340 valign=top style='width:255.05pt;border-top:none;border-left:solid black 1.0pt;border-bottom:solid black 1.0pt;border-right:none;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>R <u>AVENIDA</u> ROUXINOL 575<span style='color:black'><o:p></o:p></span></span></p></td><td width=340 valign=top style='width:255.2pt;border:solid black 1.0pt;border-top:none;padding:0cm 0cm 0cm 0cm'><p class=MsoNormal><span style='font-size:11.0pt'>R <u>ROUSCHINOL</u> 575<span style='color:black'><o:p></o:p></span></span></p></td></tr></table></div><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Algumas coisas podem ser dicionarizadas mas com muito critério, outras somente um trabalho manual mesmo, apenas para ficar num caso já citado aqui não é possível dicionarizar usando fonética ( Izabel e Isabel, Sousa e Souza ) entre outros, pois ambas as grafias são corretas.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Os cadastros da prefeitura são as melhores referências, seguido pelo correio (Base mantida a mais tempos com objetivo de endereçamento) e o CNEFE em ultima instância ( pelo volume de dados disponível numa única fonte ), nos casos de placas de rua o problema não é o cadastro mas a execução do serviço até pouco tempo atrás tínhamos placas para a R Estela e R Stela uma em frente a outra aqui em São Paulo. Só para constar o Correio não tem nenhuma Rua Doutor Ébano catalogada no CEP.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Mesmo podendo existir algum erro no CNEFE alguma informação é melhor que nenhuma informação, de qualquer maneira estou corrigindo a base CNEFE que tenho aqui e padronizando de acordo com a EXCT no caso de cidades com CEP por logradouro, mas o processo é realmente longo.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>De resto para minhas inserções no OSM sigo o critério de não alterar o source para correções do tipo ROUCHINOL para ROUXINOL, MEM SA para MEM DE SA, acentuação, pluralidade, etc<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Reinaldo <o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>De:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> John Packer [mailto:john.packer7@gmail.com] <br><b>Enviada em:</b> quinta-feira, 24 de abril de 2014 23:36<br><b>Para:</b> OpenStreetMap no Brasil<br><b>Assunto:</b> Re: [Talk-br] Listas de endereços por município<o:p></o:p></span></p><p class=MsoNormal><o:p> </o:p></p><div><div><p class=MsoNormal>Por mim, poderia ser passado um corretor ortográfico pelos nomes de ruas retirados pelo IBGE.<o:p></o:p></p></div><p class=MsoNormal>Não tem nenhuma garantia de qualidade neles.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'><o:p> </o:p></p><div><p class=MsoNormal>Em 24 de abril de 2014 23:30, Lucas Ferreira Mation <<a href="mailto:lucasmation@gmail.com" target="_blank">lucasmation@gmail.com</a>> escreveu:<o:p></o:p></p><p>Tem casos em que é clara a grafia, como em JK e outros nomes comuns, da para fazer um dicionário. Mas tem vários casos em que não da para saber.<o:p></o:p></p><p>Se conseguíssemos juntar listas de varias fontes "oficiais"/corretas, ou pelo menos mais corretas que o CNEFE, eu posso fazer um matching probabilístico p ficar c um cnefe com as grafias corrigidas. Assim daria p juntar as vantagens do cnefe ter ruas com algumas indicação de localização (setor censitário), com a grafia correta das listagens oficiais<o:p></o:p></p><div><p class=MsoNormal>Em 24/04/2014 23:17, "Alexandre Magno Brito de Medeiros" <<a href="mailto:alexandre.mbm@gmail.com" target="_blank">alexandre.mbm@gmail.com</a>> escreveu:<o:p></o:p></p><div><div><div><div><p class=MsoNormal style='margin-bottom:12.0pt'>Sim, é basicamente isso. Não me lembro de ter inserido ou retirado termos ou letras de algum nome. A não ser um singular/plural evidentemente destoante.<o:p></o:p></p></div><p class=MsoNormal>Alexandre Magno<o:p></o:p></p><div><div><div><p class=MsoNormal style='margin-bottom:12.0pt'><o:p> </o:p></p><div><p class=MsoNormal>Em 24 de abril de 2014 23:12, Nelson A. de Oliveira <<a href="mailto:naoliv@gmail.com" target="_blank">naoliv@gmail.com</a>> escreveu:<o:p></o:p></p><p class=MsoNormal>Se são correções do tipo Joao → João não há necessidade de mudar o source.<o:p></o:p></p></div><p class=MsoNormal><o:p> </o:p></p></div></div></div></div><p class=MsoNormal><o:p> </o:p></p></div></div><div><p class=MsoNormal style='margin-bottom:12.0pt'>_______________________________________________<br>Talk-br mailing list<br><a href="mailto:Talk-br@openstreetmap.org" target="_blank">Talk-br@openstreetmap.org</a><br><a href="https://lists.openstreetmap.org/listinfo/talk-br" target="_blank">https://lists.openstreetmap.org/listinfo/talk-br</a><o:p></o:p></p></div></div><p class=MsoNormal style='margin-bottom:12.0pt'><br>_______________________________________________<br>Talk-br mailing list<br><a href="mailto:Talk-br@openstreetmap.org">Talk-br@openstreetmap.org</a><br><a href="https://lists.openstreetmap.org/listinfo/talk-br" target="_blank">https://lists.openstreetmap.org/listinfo/talk-br</a><o:p></o:p></p></div><p class=MsoNormal><o:p> </o:p></p></div></div></body></html>