[Talk-es] Solución geocoder (ihg)
Daniel Pardo
daniel en tercerob.com
Jue Feb 4 08:44:08 UTC 2016
Echale un vistazo a
http://www.gisgraphy.com/
Lo hemos montado y va muy bien.
Saludos,
Daniel
--------
Message: 1
Date: Wed, 3 Feb 2016 22:07:37 +0100
From: ihg <ihg2 en alu.ua.es>
To: talk-es en openstreetmap.org
Subject: [Talk-es] Solución geocoder
Message-ID: <56B26C19.5000706 en alu.ua.es>
Content-Type: text/plain; charset=utf-8; format=flowed
Hola a todos,
Estoy investigando para utilizar un buscador sobre los mapas (geocoder).
Como todos tienen sus restricciones de límites de uso, he investigado y
veo que se puede instalar Nominatim en tu propio servidor. El problema
que tiene es que tiene unos requerimientos bestiales: 500GB de disco
duro y unos 32GB de RAM para que funcione más o menos bien. Además, dice
que tardaría en importar los datos e indexarlos... ¡unos 11 días!
Mi pregunta es... ¿se podría generar una versión más ligera de esta base
de datos? Es decir, yo no necesito toda la información, como nombres de
comarcas, parkings, etc. Con que simplemente se almacenaran los países,
ciudades y calles me bastaría (¡incluso podría prescindir de las calles!).
A ver si alguno de vosotros me puede esclarecer estas dudas...
¡Muchas gracias!
Un saludo.
El día 4 de febrero de 2016, 6:33,
<talk-es-request en openstreetmap.org> escribió:
> Envíe los mensajes para la lista Talk-es a
> talk-es en openstreetmap.org
>
> Para subscribirse o anular su subscripción a través de la WEB
> https://lists.openstreetmap.org/listinfo/talk-es
>
> O por correo electrónico, enviando un mensaje con el texto "help" en
> el asunto (subject) o en el cuerpo a:
> talk-es-request en openstreetmap.org
>
> Puede contactar con el responsable de la lista escribiendo a:
> talk-es-owner en openstreetmap.org
>
> Si responde a algún contenido de este mensaje, por favor, edite la
> linea del asunto (subject) para que el texto sea mas especifico que:
> "Re: Contents of Talk-es digest...". Además, por favor, incluya en la
> respuesta sólo aquellas partes del mensaje a las que está
> respondiendo.
>
>
> Asuntos del día:
>
> 1. Solución geocoder (ihg)
> 2. Re: Nominatim debería ser más flexible (David Marín Carreño)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Wed, 3 Feb 2016 22:07:37 +0100
> From: ihg <ihg2 en alu.ua.es>
> To: talk-es en openstreetmap.org
> Subject: [Talk-es] Solución geocoder
> Message-ID: <56B26C19.5000706 en alu.ua.es>
> Content-Type: text/plain; charset=utf-8; format=flowed
>
> Hola a todos,
>
> Estoy investigando para utilizar un buscador sobre los mapas (geocoder).
> Como todos tienen sus restricciones de límites de uso, he investigado y
> veo que se puede instalar Nominatim en tu propio servidor. El problema
> que tiene es que tiene unos requerimientos bestiales: 500GB de disco
> duro y unos 32GB de RAM para que funcione más o menos bien. Además, dice
> que tardaría en importar los datos e indexarlos... ¡unos 11 días!
>
> Mi pregunta es... ¿se podría generar una versión más ligera de esta base
> de datos? Es decir, yo no necesito toda la información, como nombres de
> comarcas, parkings, etc. Con que simplemente se almacenaran los países,
> ciudades y calles me bastaría (¡incluso podría prescindir de las calles!).
>
> A ver si alguno de vosotros me puede esclarecer estas dudas...
>
> ¡Muchas gracias!
>
> Un saludo.
>
>
>
> ------------------------------
>
> Message: 2
> Date: Thu, 04 Feb 2016 05:33:14 +0000
> From: David Marín Carreño <davefx en gmail.com>
> To: Discusión en Español de OpenStreetMap
> <talk-es en openstreetmap.org>
> Subject: Re: [Talk-es] Nominatim debería ser más flexible
> Message-ID:
> <CAHPETy7uHKxKqqqUzHWdwZyvYtmBewcwWrCYQAwC2gFSWVBTxg en mail.gmail.com>
> Content-Type: text/plain; charset="utf-8"
>
> Otra opción sería indicar, en la petición de búsqueda a nominatim, el
> idioma en que se quiere buscar (para seleccionar un conjunto de stop words
> adecuado) y que nominatim primero buscara de firma textual (encontrando el
> pueblo De en Indonesia) y luego en una segunda pasada ignorase las palabras
> que decimos...
>
> Hablo sin haber mirado ni una sola línea de código fuente...
>
> El mar., 2 feb. 2016 14:48, Xavier Barnada <xbarnada en gmail.com> escribió:
>
>> Una pregunta , todo esto que estais comentando esta en la issue?
>> Porque seguro que les puede ser util a los programadores de Nominatim les
>> puede ayudar y estoy seguro que si a parte de explicarles el problema les
>> enviais una solucion os lo agradeceran
>>
>> Saludos
>>
>>
>> El mar., 2 feb. 2016 a las 12:43, Alejandro Moreno Calvo (<
>> almorca en gmail.com>) escribió:
>>
>>> Curiosamente hay un pueblo llamado De en Indonesia
>>> http://nominatim.openstreetmap.org/details.php?place_id=14215103 que con
>>> ese parche no se encontraría nunca.
>>>
>>> No tengo el detalle de cómo está implementado Nominatim pero para mí la
>>> solución pasa por usar funciones estadísticas de comparación de cadenas, de
>>> manera que en vez de buscar una similitud exacta se busque aquello que
>>> supere un cierto porcentaje de similitud. En Oracle estás funciones están
>>> dentro del paquete UTL_MATCH [
>>> https://docs.oracle.com/cd/E18283_01/appdev.112/e16760/u_match.htm ]. En
>>> PostgreSQL existe el módulo *fuzzystrmatch* [
>>> http://www.postgresql.org/docs/current/static/fuzzystrmatch.html ] que
>>> parece más limitado y existe un proyecto [
>>> http://pgsimilarity.projects.pgfoundry.org/ ] que implementa más
>>> funciones pero no sé si es muy común su uso ni si está actualizado.
>>>
>>> Yo tengo pendiente echarle un vistazo a Nominatim e intentar implementar
>>> esto pero seguramente me lleve varios meses por falta de tiempo por lo que
>>> si alguien se quiere animar a recoger el testigo bienvenido es.
>>>
>>> El 2 de febrero de 2016, 12:02, Benjamín Valero Espinosa <
>>> benjavalero en gmail.com> escribió:
>>>
>>>> El problema con las "stop words" es que puedes sin querer capar una
>>>> palabra que sí tiene sentido en otro idioma. El ejemplo típico es "die",
>>>> que es un artículo definido en alemán pero es un verbo en inglés. ¿Esto se
>>>> está controlando? Lo ideal sería listas de "stop words" por idioma, pero
>>>> claro, para eso también habría que saber en qué idioma está la calle :-O
>>>>
>>>> El 2 de febrero de 2016, 9:16, Alejandro Moreno Calvo <almorca en gmail.com
>>>> > escribió:
>>>>
>>>>> Hola Xavier.
>>>>>
>>>>> Hay que tener en cuenta que ese PR soluciona un caso muy concreto pero
>>>>> que habría que hacer un análisis más profundo de los artículos que se
>>>>> pueden dar. Así a bote pronto se me ocurre también habría que añadir "el",
>>>>> "la", "las", "los".
>>>>>
>>>>> El 2 de febrero de 2016, 8:40, Xavier Barnada <xbarnada en gmail.com>
>>>>> escribió:
>>>>>
>>>>>> Hola,
>>>>>>
>>>>>> Acabo de hacer una pull request que deberia solucionar este problema,
>>>>>> he seguido el ejemplo de las otras stopwords y este comentario
>>>>>> https://trac.openstreetmap.org/ticket/4895#comment:4
>>>>>>
>>>>>> https://github.com/twain47/Nominatim/pull/358
>>>>>>
>>>>>> Saludos
>>>>>>
>>>>>> El dom., 31 ene. 2016 a las 11:57, Emilio Gómez Fernández (<
>>>>>> emilio.gomez.fdez en gmail.com>) escribió:
>>>>>>
>>>>>>> Hola a todos.
>>>>>>>
>>>>>>> Fui yo quien abrí ese ticket hace tiempo, tanto ahí como en GitHub
>>>>>>> [1], y también lo comenté en la reunión en Aguilar de Campoo en la que
>>>>>>> estuvimos algunos de nosotros.
>>>>>>> La respuesta viene a ser, en resumidas cuentas, que añadir nuevas
>>>>>>> palabras vacías en español a las escasas que ya existen en Nominatim [2]
>>>>>>> podría perjudicar las búsquedas en otros idiomas. La consecuencia es que en
>>>>>>> nuestro caso usar la API de Nominatim para realizar, por ejemplo,
>>>>>>> geocodificación inversa es de escasa utilidad aun a pesar de que los datos
>>>>>>> existan en la base de datos.
>>>>>>>
>>>>>>> Lo único que se me ocurre es que esta discusión salte a la lista
>>>>>>> General y tener un feedback de otros usuarios para que la cosa se mueva y
>>>>>>> tenga más repercusión, porque este importante problema también afecta a
>>>>>>> otros idiomas [3][4].
>>>>>>>
>>>>>>> Saludos.
>>>>>>>
>>>>>>> [1] https://github.com/twain47/Nominatim/issues/85
>>>>>>> [2]
>>>>>>> https://github.com/twain47/Nominatim/blob/master/module/nominatim.c
>>>>>>> [3] https://github.com/twain47/Nominatim/issues/333
>>>>>>> [4] https://trac.openstreetmap.org/ticket/4961
>>>>>>>
>>>>>>>
>>>>>>> El 30 de enero de 2016, 14:17, Alejandro Moreno Calvo <
>>>>>>> almorca en gmail.com> escribió:
>>>>>>>
>>>>>>>> Este problema ya lleva reportado tiempo.
>>>>>>>> https://trac.openstreetmap.org/ticket/4895
>>>>>>>> El 30 ene. 2016 2:04 p. m., "Xavier Barnada" <xbarnada en gmail.com>
>>>>>>>> escribió:
>>>>>>>>
>>>>>>>>> Hola,
>>>>>>>>>
>>>>>>>>> A parte de la ayuda que podamos prestar al buscador mediante mejor
>>>>>>>>> etiquetado no veo mucho mas que se pueda hacer.
>>>>>>>>> Si quereix podeis reportar los problemas que veais al repositorio
>>>>>>>>> de Nominatim en github
>>>>>>>>> https://github.com/twain47/Nominatim
>>>>>>>>>
>>>>>>>>> Saludos
>>>>>>>>>
>>>>>>>>> El sáb., 30 ene. 2016 a las 13:54, Jorge Sanz Sanfructuoso (<
>>>>>>>>> sanchi2 en gmail.com>) escribió:
>>>>>>>>>
>>>>>>>>>> Hola.
>>>>>>>>>>
>>>>>>>>>> Son un desastre las búsquedas. Hace no mucho salio el tema, no se
>>>>>>>>>> si por aqui o por el telegram y alguien comentó que está adaptado para el
>>>>>>>>>> habla inglesa y que según Nominatim si se adapta para otros idiomas podría
>>>>>>>>>> hacer que fallara en el inglés.
>>>>>>>>>>
>>>>>>>>>> Ya no es escribir bien o mal, hay casos como los artículos que a
>>>>>>>>>> veces los llevan las calles y a veces no. Es adivina adivinanza. jajaja
>>>>>>>>>>
>>>>>>>>>> Un saludo.
>>>>>>>>>>
>>>>>>>>>> El sáb., 30 ene. 2016 a las 13:12, Manuel Lladosa (<
>>>>>>>>>> manolollr en gmail.com>) escribió:
>>>>>>>>>>
>>>>>>>>>>> Hace un rato he hecho estas búsquedas:
>>>>>>>>>>>
>>>>>>>>>>> - Calle san roNque, paiporta (con falta de ortografía por
>>>>>>>>>>> descuido): no
>>>>>>>>>>> me encuentra nada por la falta, vale, de acuerdo.
>>>>>>>>>>> - Calle san roque, paiporta: no me encuentra nada. ¡Pues vaya!
>>>>>>>>>>> - Calle de san roque, paiporta: ¡premio!
>>>>>>>>>>>
>>>>>>>>>>> ¡Que tiquismiquis! jeje. Tienes que poner la calle con precisión
>>>>>>>>>>> milimétrica. Cuando alguien busca una calle no suele conocer el
>>>>>>>>>>> nombre
>>>>>>>>>>> con tanta exactitud y esto irrita un pelín :-), ya me ha pasado
>>>>>>>>>>> varias
>>>>>>>>>>> veces que no he encontrado calles, siendo que estaban en OSM.
>>>>>>>>>>>
>>>>>>>>>>> ¿Como podemos pedir que Nominatim sea más flexible, que no
>>>>>>>>>>> requiera
>>>>>>>>>>> búsquedas tan precisas? Y tampoco estaría mal que corrigiera
>>>>>>>>>>> faltas de
>>>>>>>>>>> ortografía, vale, debemos escribir bien, pero es que a veces se
>>>>>>>>>>> hacen
>>>>>>>>>>> por descuido.
>>>>>>>>>>>
>>>>>>>>>>> Muchas gracias.
>>>>>>>>>>>
>>>>>>>>>>> _______________________________________________
>>>>>>>>>>> Talk-es mailing list
>>>>>>>>>>> Talk-es en openstreetmap.org
>>>>>>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>>>>>>
>>>>>>>>>> --
>>>>>>>>>> Jorge Sanz Sanfructuoso - Sanchi
>>>>>>>>>> Blog http://blog.jorgesanzs.com/
>>>>>>>>>> _______________________________________________
>>>>>>>>>> Talk-es mailing list
>>>>>>>>>> Talk-es en openstreetmap.org
>>>>>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>>>>>
>>>>>>>>>
>>>>>>>>> _______________________________________________
>>>>>>>>> Talk-es mailing list
>>>>>>>>> Talk-es en openstreetmap.org
>>>>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>>>>
>>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> Talk-es mailing list
>>>>>>>> Talk-es en openstreetmap.org
>>>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>>>
>>>>>>>>
>>>>>>> _______________________________________________
>>>>>>> Talk-es mailing list
>>>>>>> Talk-es en openstreetmap.org
>>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> Talk-es mailing list
>>>>>> Talk-es en openstreetmap.org
>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>
>>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> Talk-es mailing list
>>>>> Talk-es en openstreetmap.org
>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>
>>>>>
>>>>
>>>> _______________________________________________
>>>> Talk-es mailing list
>>>> Talk-es en openstreetmap.org
>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>
>>>>
>>> _______________________________________________
>>> Talk-es mailing list
>>> Talk-es en openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>
>> _______________________________________________
>> Talk-es mailing list
>> Talk-es en openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-es
>>
> ------------ próxima parte ------------
> Se ha borrado un adjunto en formato HTML...
> URL: <http://lists.openstreetmap.org/pipermail/talk-es/attachments/20160204/2f485a48/attachment.html>
>
> ------------------------------
>
> Subject: Pié de página del digest
>
> _______________________________________________
> Talk-es mailing list
> Talk-es en openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-es
>
>
> ------------------------------
>
> Fin de Resumen de Talk-es, Vol 109, Envío 8
> ********************************************
--
Daniel Pardo
CEO
Plaza de las Cortes 2
28014 Madrid - España
daniel en tercerob.com | www.tercerob.com
Si no desea seguir recibiendo comunicaciones a través de esta vía o si
desea ejercitar sus derechos de acceso, rectificación, cancelación y
oposición, puede hacerlo enviando una solicitud por escrito a C/ Plaza
de las Cortes 2, 6º planta 28014 Madrid Madrid - España, o a través
de correo electrónico a hola en tercerob.com junto con prueba válida en
derecho, como fotocopia del DNI e indicando en el asunto “PROTECCION
DE DATOS”.
La información contenida tanto en este e-mail, como en los documentos
adjuntos, es información confidencial y privilegiada para uso
exclusivo de la persona o personas a las que va dirigido. No está
permitido el acceso a este mensaje a cualquier otra persona distinta a
los indicados. Si no es uno de los destinatarios, cualquier
duplicación, reproducción, distribución, así como cualquier uso de la
información contenida o cualquiera otra acción u omisión tomada en
relación con el mismo, está prohibida y puede ser ilegal.
Este mensaje no supone la creación de relaciones contractuales ni
otros compromisos a través del uso de este mensaje.
Más información sobre la lista de distribución Talk-es