[Talk-br] Erros comuns encontrados nos dados

Fernando Trebien fernando.trebien em gmail.com
Quarta Janeiro 1 21:19:36 UTC 2014


Ok. Sugeri isso porque achei que poderia extrair a informação
facilmente a partir de alguma listagem oficial do IBGE.

Quanto à subdivisão da cidade em partes, acho que você pode fazer como
lhe parecer mais lógico. Fiquei curioso pra saber qual dos meus
comentários você leu (eu faço tantos, e sobre tantas coisas diferentes
:P). Talvez você tenha lido algo no artigo do wiki sobre Porto Alegre,
onde eu apenas dividi a cidade por bairro (acaba fazendo sentido pro
dia em que houver 1 mapeador por região/bairro) e os coloquei numa
ordem específica (pro caso de eu continuar sendo o único mapeando a
cidade por muito tempo).

Na época eu tentei várias heurísticas, mas a que me pareceu mais
natural foi assim:
- o primeiro da sequência é o Centro
- o segundo é o bairro adjacente mais famoso (famoso segundo o Google Trends)
- o terceiro é o mais famoso que é adjacente aos dois anteriores
- o quarto é o mais famoso adjacente aos três anteriores

E assim por diante. Acho que funciona pra qualquer cidade de tamanho
médio, provavelmente pra Recife também. São Paulo, por exemplo,
exigiria uma subdivisão diferente, é tão grande que pode-se dizer que
tem vários "centros" - mas uma vez eleitos, daria pra seguir um
critério similar pra cada um. O resultado aqui em Porto Alegre é bem
razoável: a região coberta atinge gradualmente um equilíbrio entre
"distância do centro" e "distância até a linha de desenvolvimento pro
leste".

Por que usar o "famoso" como critério na ordenação: porque o mais
famoso (seja boa ou má fama) é provavelmente o que as pessoas mais vão
procurar no mapa, então é mais importante que esteja correto antes dos
outros. Pro usuário, ter o "famoso" coberto é sinal de que o mapa
atende às suas necessidades mais comuns, e encontrar um erro numa
região dessas é um sinal bem pior do que encontrar um erro numa região
afastada (onde o usuário teria um pouco mais de tolerância). Só por
isso.

Por que usar o "adjacente" como critério: pra que eu não ficasse
saltando de uma área pra outra, pra que as conexões entre as áreas não
tendessem a ser ignoradas.

2014/1/1 Marcelo Pereira <pereiraholder em gmail.com>:
> Lembro que não identifiquei erros nos nomes das vias aqui, só a falta do
> identificador, por isso acredito que nomear tudo como Rua e depois sair
> consertando, pode ser mais danoso do que fazer certo de uma vez só, mesmo
> que muito mais demorado.
>
> De um jeito ou de outro, eu me candidato a revisar tudo, ou pelo menos o que
> eu puder.
>
> Para os limites de Recife é mais fácil, pois eu tenho fontes boas de
> pesquisa, para as outras cidades, mesmo as vizinhas, a quantidade de
> informação disponível cai assustadoramente, por isso tende a ser mais
> dificil a revisão.
>
> Quando falei no GPS, eu não tinha a intenção de usar isso como desculpa para
> a falta de identificadores, foi só um exemplo.
>
> Partindo para a prática, pelo que vi são duas opções, a primeira inclui Rua
> em todas as vias e depois passa pente fino, a segunda começa a consertar
> manualmente.
>
> É isso ? Se sim voto na segunda opção, mesmo que seja mais trabalhoso.
>
> Fernando, quanto à lista de não ruas de Recife, vou ver o que consigo e lhe
> envio em pvt, mas pode demorar um pouco até compilar tudo, certo ?
>
> Marcelo P
>
>
> Em 1 de janeiro de 2014 17:37, Fernando Trebien <fernando.trebien em gmail.com>
> escreveu:
>
>> Claro que pode.
>>
>> Ou poderíamos fazer melhor: Marcelo, seria possível conseguir uma
>> listagem de tudo aquilo que não contém o nome "Rua" em Recife? Talvez
>> a partir do IBGE? Isso pode ser fonte de dados para uma revisão
>> posterior a essa edição. Talvez o número total de elementos nessa
>> situação seja pequeno (uns 100 ou 200), daí poderíamos deixar a tag
>> "fixme" de lado caso você se comprometesse a revisar isso logo em
>> seguida.
>>
>> Quanto a soar melhor no GPS, sua decisão não deve se basear nesse
>> critério. Chamos isso de "mapear para a aplicação". No caso, a
>> aplicação pode decidir se quer retirar o prefixo (rua, avenida, etc.)
>> caso exista, mas seria estranho (e frequentemente errado) ela
>> acrescentar um prefixo padrão caso eles não existam nos dados. Por
>> isso, ter o prefixo dá às aplicações a possibilidade de decidir.
>>
>> 2014/1/1 Nelson A. de Oliveira <naoliv em gmail.com>:
>> > 2014/1/1 Fernando Trebien <fernando.trebien em gmail.com>:
>> >> Essa escolha produz resultados menos incorretos, mas nos prende num
>> >> estado que não leva ao resultado mais correto ao longo do tempo. Por
>> >> isso, eu aceitaria um aumento temporário na incorreção.
>> >
>> > Posso sugerir também incluir um FIXME=Verificar nome da rua (ou algo
>> > parecido) nessas ruas?
>> >
>> > _______________________________________________
>> > Talk-br mailing list
>> > Talk-br em openstreetmap.org
>> > https://lists.openstreetmap.org/listinfo/talk-br
>>
>>
>>
>> --
>> Fernando Trebien
>> +55 (51) 9962-5409
>>
>> "The speed of computer chips doubles every 18 months." (Moore's law)
>> "The speed of software halves every 18 months." (Gates' law)
>>
>> _______________________________________________
>> Talk-br mailing list
>> Talk-br em openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-br
>
>
>
>
> --
> -
> TImbuSérieA2013
>
> _______________________________________________
> Talk-br mailing list
> Talk-br em openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>



-- 
Fernando Trebien
+55 (51) 9962-5409

"The speed of computer chips doubles every 18 months." (Moore's law)
"The speed of software halves every 18 months." (Gates' law)



Mais detalhes sobre a lista de discussão Talk-br