[Talk-br] Lixo na base

Fernando Trebien fernando.trebien em gmail.com
Segunda Março 24 15:48:07 UTC 2014


Pra ser bem produtivo, o melhor é dizer (junto com um exemplo do problema)
qual a melhor forma de tratá-lo.

Por exemplo:
- sugiro remover do início e do fim dos nomes (mas não do meio) qualquer
sequência que contenha os seguintes caracteres: .,'`´?! ()
  * ponto, vírgula, apóstrofe, acento grave, acento agudo, interrogação,
exclamação, espaço, parênteses
  * discussão: fazer isso em todos os casos teria algum efeito colateral
negativo em algum caso específico?
    * se sim: temos como refinar o método para tratar desse problema?
    * se não: como aplicamos isso em massa pra todo o Brasil?

Outra coisa é que precisamos começar a compilar esses pedidos em algum
lugar. Senão, eles ficam soltos, e as pessoas esquecem deles. Simples assim.

Marcelo, você não foi pra fogueira. Imagine que alguém (tipo eu) tivesse a
idéia maluca de tentar mover todas as paradas de ônibus para uns 3~4m da
via mais próxima, pra "melhorar" o mapa. Isso alteraria o mapeamento que
você veio fazendo em Recife. "Vai dar errado em alguns casos", você
afirmaria (ainda mais se você tivesse consertado tudo manualmente, um por
um), e seria um bom argumento para não sair fazendo isso sem pensar em como
tratar dos casos ruins. Ou seja, ou se usa um método mais inteligente (que
muitas vezes emerge justamente de uma troca de idéias com a comunidade), ou
se deixa pra que as pessoas façam elas mesmas, caso por caso. Se as pessoas
concordarem em consertar o problema causado pela sua melhoria automatizada,
excelente! Mas elas precisam concordar antes né.

2014-03-24 12:25 GMT-03:00 Marcelo Pereira <pereiraholder em gmail.com>:

> Não vejo porque não ter correção automática nestes casos, pois eles já
> estão sendo tratados como erros, só falta a correção.
>
> E simplesmente apontar o erro parece contraproducente, pois a solução de
> achá-los é bem parecida com a de consertá-los.
>
>
> Marcelo
>
>
> Em 24 de março de 2014 12:08, Paulo Carvalho <paulo.r.m.carvalho em gmail.com
> > escreveu:
>
> Não estou sugerindo correção automática, mas sim algo que consiga
>> identificar tais erros.
>>
>> O fato está aí: há sujeira na base.  Vamos deixar assim?
>>
>>
>> Em 24 de março de 2014 12:05, Marcelo Pereira <pereiraholder em gmail.com>escreveu:
>>
>>  Da última vez que tentei fazer isso, quase fui pra fogueira da
>>> Inquisição!!!
>>>
>>>
>>> Em 24 de março de 2014 11:46, Fernando Trebien <
>>> fernando.trebien em gmail.com> escreveu:
>>>
>>> Devemos? Devemos. Mas quem fará? E como?
>>>>
>>>>
>>>> 2014-03-24 11:24 GMT-03:00 Paulo Carvalho <paulo.r.m.carvalho em gmail.com
>>>> >:
>>>>
>>>>> Pessoal,
>>>>>
>>>>>     Muitos de vocês devem estar acompanhando nosso trabalho de
>>>>> compilar mapas para Garmin.  Durante nosso processo de pesquisa e testes,
>>>>> estamos encontrando muito lixo na base.  Veja as capturas de tela de busca
>>>>> de ruas do GPS, tiradas pelo Márcio Thundercel:
>>>>>
>>>>>
>>>>> [image: 4][image: 4a][image: 4b][image: 4c]
>>>>>
>>>>> Não se trata de erro de compilação, pois estes nomes mal formados
>>>>> podem ser encontrados na base:
>>>>> http://www.openstreetmap.org/way/145463471
>>>>> http://www.openstreetmap.org/way/145463460
>>>>> http://www.openstreetmap.org/way/252764173
>>>>>
>>>>> Só para citar alguns exemplos.
>>>>>
>>>>> Diante desses problemas, devemos empregar alguma varredura na base,
>>>>> possivelmente baseada em expressões regulares para identificar,localizar e possivelmente
>>>>> corrigir esses ruídos.
>>>>>
>>>>> []s
>>>>>
>>>>> Paulo Carvalho
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> Talk-br mailing list
>>>>> Talk-br em openstreetmap.org
>>>>> https://lists.openstreetmap.org/listinfo/talk-br
>>>>>
>>>>>
>>>>
>>>>
>>>> --
>>>> Fernando Trebien
>>>> +55 (51) 9962-5409
>>>>
>>>> "The speed of computer chips doubles every 18 months." (Moore's law)
>>>> "The speed of software halves every 18 months." (Gates' law)
>>>>
>>>> _______________________________________________
>>>> Talk-br mailing list
>>>> Talk-br em openstreetmap.org
>>>> https://lists.openstreetmap.org/listinfo/talk-br
>>>>
>>>>
>>>
>>>
>>> --
>>>
>>> ... Edileuzaaaa, eu não tem nada a ver com Creuza,
>>>    É mentira da Ivete, não é meu esse caniveeeeeete...
>>> "Halley, Luiz" - Poeta, Cantor, Compsitor
>>>
>>> _______________________________________________
>>> Talk-br mailing list
>>> Talk-br em openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-br
>>>
>>>
>>
>> _______________________________________________
>> Talk-br mailing list
>> Talk-br em openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-br
>>
>>
>
>
> --
>
> ... Edileuzaaaa, eu não tem nada a ver com Creuza,
>    É mentira da Ivete, não é meu esse caniveeeeeete...
> "Halley, Luiz" - Poeta, Cantor, Compsitor
>
> _______________________________________________
> Talk-br mailing list
> Talk-br em openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>
>


-- 
Fernando Trebien
+55 (51) 9962-5409

"The speed of computer chips doubles every 18 months." (Moore's law)
"The speed of software halves every 18 months." (Gates' law)
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/208b1cd2/attachment-0001.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4a[2].jpg
Tipo: image/jpeg
Tamanho: 13526 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/208b1cd2/attachment-0004.jpg>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4c[2].jpg
Tipo: image/jpeg
Tamanho: 20724 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/208b1cd2/attachment-0005.jpg>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4[2].jpg
Tipo: image/jpeg
Tamanho: 13664 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/208b1cd2/attachment-0006.jpg>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 4b[2].jpg
Tipo: image/jpeg
Tamanho: 16951 bytes
Descrição: não disponível
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140324/208b1cd2/attachment-0007.jpg>


Mais detalhes sobre a lista de discussão Talk-br