[Talk-br] RES: Listas de endereços por município
Reinaldo Neves
rneves em equacao.com.br
Sexta Abril 25 13:43:11 UTC 2014
Grafia de rua realmente é um problema sério, penas para ficar em um exemplo que tenho catalogado devido ao processo de Auditoria de Endereços que faço em relação a base de CEPs, este é um caso real retirado de arquivo de um cliente:
RUA RROUXINOL NR 575
R ROXINOL NUM 575
R ROUCHINOL 575
R REGIONOL 575
RUA AV ROUXINOL 575
R ROXINO 575
R AVENIDA ROUXINOL 575
R ROUSCHINOL 575
Algumas coisas podem ser dicionarizadas mas com muito critério, outras somente um trabalho manual mesmo, apenas para ficar num caso já citado aqui não é possível dicionarizar usando fonética ( Izabel e Isabel, Sousa e Souza ) entre outros, pois ambas as grafias são corretas.
Os cadastros da prefeitura são as melhores referências, seguido pelo correio (Base mantida a mais tempos com objetivo de endereçamento) e o CNEFE em ultima instância ( pelo volume de dados disponível numa única fonte ), nos casos de placas de rua o problema não é o cadastro mas a execução do serviço até pouco tempo atrás tínhamos placas para a R Estela e R Stela uma em frente a outra aqui em São Paulo. Só para constar o Correio não tem nenhuma Rua Doutor Ébano catalogada no CEP.
Mesmo podendo existir algum erro no CNEFE alguma informação é melhor que nenhuma informação, de qualquer maneira estou corrigindo a base CNEFE que tenho aqui e padronizando de acordo com a EXCT no caso de cidades com CEP por logradouro, mas o processo é realmente longo.
De resto para minhas inserções no OSM sigo o critério de não alterar o source para correções do tipo ROUCHINOL para ROUXINOL, MEM SA para MEM DE SA, acentuação, pluralidade, etc
Reinaldo
De: John Packer [mailto:john.packer7 em gmail.com]
Enviada em: quinta-feira, 24 de abril de 2014 23:36
Para: OpenStreetMap no Brasil
Assunto: Re: [Talk-br] Listas de endereços por município
Por mim, poderia ser passado um corretor ortográfico pelos nomes de ruas retirados pelo IBGE.
Não tem nenhuma garantia de qualidade neles.
Em 24 de abril de 2014 23:30, Lucas Ferreira Mation <lucasmation em gmail.com> escreveu:
Tem casos em que é clara a grafia, como em JK e outros nomes comuns, da para fazer um dicionário. Mas tem vários casos em que não da para saber.
Se conseguíssemos juntar listas de varias fontes "oficiais"/corretas, ou pelo menos mais corretas que o CNEFE, eu posso fazer um matching probabilístico p ficar c um cnefe com as grafias corrigidas. Assim daria p juntar as vantagens do cnefe ter ruas com algumas indicação de localização (setor censitário), com a grafia correta das listagens oficiais
Em 24/04/2014 23:17, "Alexandre Magno Brito de Medeiros" <alexandre.mbm em gmail.com> escreveu:
Sim, é basicamente isso. Não me lembro de ter inserido ou retirado termos ou letras de algum nome. A não ser um singular/plural evidentemente destoante.
Alexandre Magno
Em 24 de abril de 2014 23:12, Nelson A. de Oliveira <naoliv em gmail.com> escreveu:
Se são correções do tipo Joao → João não há necessidade de mudar o source.
_______________________________________________
Talk-br mailing list
Talk-br em openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br
_______________________________________________
Talk-br mailing list
Talk-br em openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140425/ba001fc2/attachment-0001.html>
Mais detalhes sobre a lista de discussão Talk-br