[Talk-br] Erros comuns encontrados nos dados

Flavio Bello Fialho bello.flavio em gmail.com
Quinta Janeiro 2 22:23:03 UTC 2014


Uma boa fonte de informação é a prefeitura das cidades. A delimitação dos
bairros, por exemplo, geralmente é definida por lei, e as leis não têm
problema de direitos autorais, pois são leis. O plano diretor geralmente
está disponível no site da prefeitura e pode incluir as leis relevantes.
Em 01/01/2014 19:20, "Fernando Trebien" <fernando.trebien em gmail.com>
escreveu:

> Ok. Sugeri isso porque achei que poderia extrair a informação
> facilmente a partir de alguma listagem oficial do IBGE.
>
> Quanto à subdivisão da cidade em partes, acho que você pode fazer como
> lhe parecer mais lógico. Fiquei curioso pra saber qual dos meus
> comentários você leu (eu faço tantos, e sobre tantas coisas diferentes
> :P). Talvez você tenha lido algo no artigo do wiki sobre Porto Alegre,
> onde eu apenas dividi a cidade por bairro (acaba fazendo sentido pro
> dia em que houver 1 mapeador por região/bairro) e os coloquei numa
> ordem específica (pro caso de eu continuar sendo o único mapeando a
> cidade por muito tempo).
>
> Na época eu tentei várias heurísticas, mas a que me pareceu mais
> natural foi assim:
> - o primeiro da sequência é o Centro
> - o segundo é o bairro adjacente mais famoso (famoso segundo o Google
> Trends)
> - o terceiro é o mais famoso que é adjacente aos dois anteriores
> - o quarto é o mais famoso adjacente aos três anteriores
>
> E assim por diante. Acho que funciona pra qualquer cidade de tamanho
> médio, provavelmente pra Recife também. São Paulo, por exemplo,
> exigiria uma subdivisão diferente, é tão grande que pode-se dizer que
> tem vários "centros" - mas uma vez eleitos, daria pra seguir um
> critério similar pra cada um. O resultado aqui em Porto Alegre é bem
> razoável: a região coberta atinge gradualmente um equilíbrio entre
> "distância do centro" e "distância até a linha de desenvolvimento pro
> leste".
>
> Por que usar o "famoso" como critério na ordenação: porque o mais
> famoso (seja boa ou má fama) é provavelmente o que as pessoas mais vão
> procurar no mapa, então é mais importante que esteja correto antes dos
> outros. Pro usuário, ter o "famoso" coberto é sinal de que o mapa
> atende às suas necessidades mais comuns, e encontrar um erro numa
> região dessas é um sinal bem pior do que encontrar um erro numa região
> afastada (onde o usuário teria um pouco mais de tolerância). Só por
> isso.
>
> Por que usar o "adjacente" como critério: pra que eu não ficasse
> saltando de uma área pra outra, pra que as conexões entre as áreas não
> tendessem a ser ignoradas.
>
> 2014/1/1 Marcelo Pereira <pereiraholder em gmail.com>:
> > Lembro que não identifiquei erros nos nomes das vias aqui, só a falta do
> > identificador, por isso acredito que nomear tudo como Rua e depois sair
> > consertando, pode ser mais danoso do que fazer certo de uma vez só, mesmo
> > que muito mais demorado.
> >
> > De um jeito ou de outro, eu me candidato a revisar tudo, ou pelo menos o
> que
> > eu puder.
> >
> > Para os limites de Recife é mais fácil, pois eu tenho fontes boas de
> > pesquisa, para as outras cidades, mesmo as vizinhas, a quantidade de
> > informação disponível cai assustadoramente, por isso tende a ser mais
> > dificil a revisão.
> >
> > Quando falei no GPS, eu não tinha a intenção de usar isso como desculpa
> para
> > a falta de identificadores, foi só um exemplo.
> >
> > Partindo para a prática, pelo que vi são duas opções, a primeira inclui
> Rua
> > em todas as vias e depois passa pente fino, a segunda começa a consertar
> > manualmente.
> >
> > É isso ? Se sim voto na segunda opção, mesmo que seja mais trabalhoso.
> >
> > Fernando, quanto à lista de não ruas de Recife, vou ver o que consigo e
> lhe
> > envio em pvt, mas pode demorar um pouco até compilar tudo, certo ?
> >
> > Marcelo P
> >
> >
> > Em 1 de janeiro de 2014 17:37, Fernando Trebien <
> fernando.trebien em gmail.com>
> > escreveu:
> >
> >> Claro que pode.
> >>
> >> Ou poderíamos fazer melhor: Marcelo, seria possível conseguir uma
> >> listagem de tudo aquilo que não contém o nome "Rua" em Recife? Talvez
> >> a partir do IBGE? Isso pode ser fonte de dados para uma revisão
> >> posterior a essa edição. Talvez o número total de elementos nessa
> >> situação seja pequeno (uns 100 ou 200), daí poderíamos deixar a tag
> >> "fixme" de lado caso você se comprometesse a revisar isso logo em
> >> seguida.
> >>
> >> Quanto a soar melhor no GPS, sua decisão não deve se basear nesse
> >> critério. Chamos isso de "mapear para a aplicação". No caso, a
> >> aplicação pode decidir se quer retirar o prefixo (rua, avenida, etc.)
> >> caso exista, mas seria estranho (e frequentemente errado) ela
> >> acrescentar um prefixo padrão caso eles não existam nos dados. Por
> >> isso, ter o prefixo dá às aplicações a possibilidade de decidir.
> >>
> >> 2014/1/1 Nelson A. de Oliveira <naoliv em gmail.com>:
> >> > 2014/1/1 Fernando Trebien <fernando.trebien em gmail.com>:
> >> >> Essa escolha produz resultados menos incorretos, mas nos prende num
> >> >> estado que não leva ao resultado mais correto ao longo do tempo. Por
> >> >> isso, eu aceitaria um aumento temporário na incorreção.
> >> >
> >> > Posso sugerir também incluir um FIXME=Verificar nome da rua (ou algo
> >> > parecido) nessas ruas?
> >> >
> >> > _______________________________________________
> >> > Talk-br mailing list
> >> > Talk-br em openstreetmap.org
> >> > https://lists.openstreetmap.org/listinfo/talk-br
> >>
> >>
> >>
> >> --
> >> Fernando Trebien
> >> +55 (51) 9962-5409
> >>
> >> "The speed of computer chips doubles every 18 months." (Moore's law)
> >> "The speed of software halves every 18 months." (Gates' law)
> >>
> >> _______________________________________________
> >> Talk-br mailing list
> >> Talk-br em openstreetmap.org
> >> https://lists.openstreetmap.org/listinfo/talk-br
> >
> >
> >
> >
> > --
> > -
> > TImbuSérieA2013
> >
> > _______________________________________________
> > Talk-br mailing list
> > Talk-br em openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-br
> >
>
>
>
> --
> Fernando Trebien
> +55 (51) 9962-5409
>
> "The speed of computer chips doubles every 18 months." (Moore's law)
> "The speed of software halves every 18 months." (Gates' law)
>
> _______________________________________________
> Talk-br mailing list
> Talk-br em openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.openstreetmap.org/pipermail/talk-br/attachments/20140102/02c4f2de/attachment-0001.html>


Mais detalhes sobre a lista de discussão Talk-br