[Talk-de] Nominatim, Probleme und Merkwürdigkeiten

Sarah Hoffmann lonvia at denofr.de
Do Nov 19 12:49:40 UTC 2015


On Thu, Nov 19, 2015 at 01:11:32PM +0100, Martin Koppenhoefer wrote:
> Am 19. November 2015 um 12:22 schrieb Sarah Hoffmann <lonvia at denofr.de>:
> 
> >
> > Kurz gesagt, altbekanntes Problem. Wenn du etwas im Trac suchst, findest du
> > reichlich Bugreports betreffst dem Problem mit dem Weglassen von Vornamen
> > und
> > Titeln in romanischen Sprachen in Nominatim.
> 
> was ich vor allem komisch fand, dass "corso gramsci, aquileia" kein
> Ergebnis brachte, "via gramsci, aquileia" aber schon (der richtige Name ist
> aber Corso Antonio Gramsci), so eine Art Spezialbehandlung für Via scheint
> es zu geben, die Corso bisher nicht berücksichtigt.

Das ist eine echte Falschzuordnung, die in etwa so geht:
Bekannte Abkürzungen werden auf die Anfrage angewendet, hier via -> v.
Ergibt sich somit "v gramsci, aquileia". Dann wird die List potentieller
Hausnummern abgesucht, und da steht 'v' drin. Hausnummern können aber in
der Anfrage wegfallen, bleibt "gramsci, aquileia" und das passt natürlich
auf die "Corso Antonio Gramsci, Aquileia".

Die Lösung des Problems ist theoretisch einfach (merken, dass das v ein
abgekürztes via ist), praktisch aber etwas trickreicher zu implementieren.

> > Beste derzeitige Lösung ist die Angabe der üblichen Kurzform im short_name
> > Tag.
> 
> OK (das sind allerdings die meisten Straßen mit Namen, die dann diesen tag
> bekommen), ähnlich machen wir das auch schon für Datumsangaben, wo sowohl
> ausgeschrieben, arabische Ziffern und römische Zahlen vorkommen können
> (z.B. "Via quattro Novembre", "Via 4 Novembre", "Via IV Novembre").
> Vielleicht könnten wir diese stattdessen auch in die Abkürzungstabelle als
> Abkürzungen eintragen? (Es kommen nicht so viele Zahlen tatsächlich vor,
> sind jeweils besondere Datumsangaben).

Zahlen ist nochmal ein anderes Problem. Das ist noch viel relevanter für
die Amerikaner mit den vielen durchnummerierten Sprachen. Trickreich wird
es vor allem, weil Nominatim das natürlich in allen Sprachen können muss.

> > Was ihr ausserdem als Community tun könnt, ist die Liste der üblichen
> > Abkürzungen in
> > http://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations
> > zu ergänzen. die italienische Sektion ist da gerade noch sehr knapp
> > gehalten
> 
> Werde ich auf jeden Fall ansprechen, sieht mir auf den ersten Blick schon
> gar nicht schlecht aus, was wir da haben, gibt aber sicherlich noch mehr.

Ich sehe, dass du schon einiges ergänzt hast.
Wie gesagt, Zahlen ist noch ein anderes Problem. Aber was sich in der Liste
noch gut macht, sind Titel (Capitano, Dottore etc.). Also
eben das, was man üblicherweise an Abkürzungen in Strassennamen benutzt.

> Wenn es nun mehrere Möglichkeiten gibt, tragen wir die dann einfach alle
> untereinander ein, z.B. "S." kann sein: "San", "Sant'", "Santa"?

Ja, bitte.

Gruss

Sarah




Mehr Informationen über die Mailingliste Talk-de