[Talk-br] Lixo na base

Paulo Carvalho paulo.r.m.carvalho em gmail.com
Segunda Março 24 16:01:48 UTC 2014


Uma expressão regular para buscar é essa: [^a-z0-9 áãâéèíóõôúüç]*

Testem em http://www.gethifi.com/tools/regex .  Notem que ela pega todos os
caracteres que não podem figurar em nomes de ruas.  Caso eu tenha esquecido
de algum caracter permitido, sem polêmicas, basta colocá-lo na expressão.


Em 24 de março de 2014 12:43, Erick de Oliveira Leal <
erickdeoliveiraleal em gmail.com> escreveu:

> Se houvesse um script q identificasse que o primeiro caracter não é a
> alfabético nem numérico e indicasse o id pra corrigi-los já seria uma boa.
> Só não tenho conhecimento pra isso...
> Em 24/03/2014 11:24, "Paulo Carvalho" <paulo.r.m.carvalho em gmail.com>
> escreveu:
>
>> Pessoal,
>>
>>     Muitos de vocês devem estar acompanhando nosso trabalho de compilar
>> mapas para Garmin.  Durante nosso processo de pesquisa e testes, estamos
>> encontrando muito lixo na base.  Veja as capturas de tela de busca de ruas
>> do GPS, tiradas pelo Márcio Thundercel:
>>
>>
>> [image: 4][image: 4a][image: 4b][image: 4c]
>>
>> Não se trata de erro de compilação, pois estes nomes mal formados podem
>> ser encontrados na base:
>> http://www.openstreetmap.org/way/145463471
>> http://www.openstreetmap.org/way/145463460
>> http://www.openstreetmap.org/way/252764173
>>
>> Só para citar alguns exemplos.
>>
>> Diante desses problemas, devemos empregar alguma varredura na base,
>> possivelmente baseada em expressões regulares para identificar,localizar e possivelmente
>> corrigir esses ruídos.
>>
>> []s
>>
>> Paulo Carvalho
>>
>>
>>
>>
>>
>>
>>
>> _______________________________________________
>> Talk-br mailing list
>> Talk-br em openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-br
>>
>>
> _______________________________________________
> Talk-br mailing list
> Talk-br em openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/a80cd66a/attachment-0001.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4c[2].jpg
Tipo: image/jpeg
Tamanho: 20724 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/a80cd66a/attachment-0004.jpg>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4a[2].jpg
Tipo: image/jpeg
Tamanho: 13526 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/a80cd66a/attachment-0005.jpg>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4[2].jpg
Tipo: image/jpeg
Tamanho: 13664 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/a80cd66a/attachment-0006.jpg>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4b[2].jpg
Tipo: image/jpeg
Tamanho: 16951 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/a80cd66a/attachment-0007.jpg>


Mais detalhes sobre a lista de discussão Talk-br