[Talk-br] Sobre a necessidade (ou não) de ter addr:street em importação de addr:housenumber

Fernando Trebien fernando.trebien em gmail.com
Qui Fev 14 18:19:30 UTC 2019


On Thu, Feb 14, 2019 at 7:55 AM Peter Krauss <ppkrauss em gmail.com> wrote:
> 2.2. Ponto oficial incompleto: pode ser importando?  Essa é a discussão. As fontes de informação na verdade existem, só que não é uma fonte única, pode estar misturando verdade de campo, norma oficial (por exemplo leis de nomenclatura de rua), dado oficial (ex. os pontos fornecidos pela prefeitura), etc. O algorítomo mesmo sendo aberto é complexo e poucas pessoas do OSM terão tempo e capacidade de avaliar.  ESTÁ EM DISCUSSÃO, mas precisamos primeiro arrumar a casa, chegar a uma descrição satisfatória no "ponto oficial completo" (2.1 acima).  Mesmo depois de discutir e chegar a um consenso aqui precisaremos verificar com restante da comunidade OSM.
>
> 2.2.1. Com  numeração (addr:housenumber) obtida por interpolação/proximidade.

Acho que depende das características do dado original. Se o que ele
tem é o endereço inicial e final de cada quadra, ou um endereço no
meio de cada quadra, ele pode ser importado sem problema algum usando
linhas interpoladoras, tal como se faz sem Buenos Aires e em alguns
outras cidades do mundo, contanto que os pontos de endereço contenham
o nome da rua. Seria indesejável interpolar o endereço gerando cada
ponto intermediário.

> 2.2.2. Com  nome de rua (addr:street) obtido por proximidade.

Entre poder/não poder eu prefiro responder isso com as consequências
pro OSM de importar com ou sem um tratamento dos problemas dessa
abordagem.

Em Porto Alegre já constatamos que a projeção dos endereços nas ruas
para obter o nome da rua produz cerca de 5% de endereços errados, ou
seja, 1 erro em cada 20 endereços. Um dado com tantos erros não possui
qualidade suficiente para suportar satisfatoriamente um serviço de
geocodificação. Se, por exemplo, alguém quiser usar o  mapa para
oferecer um serviço de entregas ou de transporte individual, muitos
endereços estarão a quilômetros de distância do local correto, o que
obviamente seria bem ruim pra confiabilidade do serviço. Nesse caso,
eu esperaria que o usuário simplesmente descartaria o OSM e adotaria
um concorrente, como o Google Maps. Pior do que isso, se alguém quiser
usar os endereços existentes para inserir pontos de interesse a partir
de uma listagem local, os erros serão propagados e a correção exigirá
mais esforço (talvez o dobro) do que se tivesse sido feita antes.

Mesmo numa cidade do tamanho de Porto Alegre, a solução manual desses
problemas exigiria um trabalho contínuo de ~2 semanas eu acho. Vale a
pena considerando o benefício. Na maioria dos municípios (em geral
pequenos) um trabalho desse tipo poderia ser feito completamente em
poucas horas.

Onde não houver mão-de-obra disposta a realizar a correção, acho que é
fundamental no mínimo documentar (de preferência no wiki) que ficou
pendente de correção, do contrário ninguém vai saber onde procurar os
erros. Idealmente seria aberta também uma tarefa em algum sistema de
gestão de tarefas para orientar e monitorar esse trabalho. Agora que
temos o Kaart interessado em nos ajudar, podemos também tentar um
contato com eles para que realizem as correções manualmente. Se este
caso surgir com frequência em municípios diferentes, acho que vale a
pena organizar um grupo de trabalho para fazer as correções manuais.
Um grupo especializado assim estaria familiarizado com o tipo de erro
desse processo e poderia trabalhar rápido e com menos erros humanos.

Caso a etapa de documentar a correção não for feita, o resultado mais
provável é que os erros permanecerão no mapa por um bom tempo e que
serão esquecidos, prejudicando a confiabilidade dos dados. Por
exemplo, na importação dos edifícios em Porto Alegre, uma informação
foi colocada na etiqueta description, foi solicitado aos mapeadores
que fosse convertida em etiquetas consumíveis (geralmente amenity=*),
mas esse trabalho nunca foi feito por ninguém. A informação está lá no
OSM, parada há anos, sem usufruto pelas aplicações. Como diz o wiki
[2] num texto proveniente do original em inglês, "nunca suponha que
essas pessoas vão alegremente arrumar a bagunça que você fez."

Não estou dizendo que é obrigação de quem importa fazer a correção
manual. O importante é traçar um plano de correção e engajar as
pessoas que o executarão, e havendo interessados em fazer isso antes
mesmo da importação, melhor ainda. Como você pode ver lá na discussão
de Porto Alegre, há também questões relativas à limpeza de dados
existentes.

> O que acha?  Podemos seguir com essa terminologia? importação de "ponto invalido" (obviamente invalida), de "ponto oficial completo" e de "ponto oficial incompleto".

Eu chamaria isso de um endereço incompleto/insuficiente, não de
inválido. O que realmente é inválido (em ~5% dos casos) é a heurística
de projetar o endereço sobre a rua mais próxima, seja ela feita antes
da importação ou feita pelo geocodificador caso a addr:street esteja
faltando no endereço.

-- 
Fernando Trebien



Mais detalhes sobre a lista de discussão Talk-br