[Talk-de] Problematik der Ortsnamenzusätze

Dominik Wegerle OSM at dwegerle.eu
Do Jun 9 12:39:15 UTC 2011


On 09.06.2011 13:28, Igor Podolskiy wrote:
> Bodo,
>
> On 08.06.2011 22:47, Bodo Meissner wrote:
>>
>> Das erschwert das Zusammensetzen etwas, weil man einmal ein 
>> Leerzeichen einfügen muß und einmal nicht. Vermutlich lassen sich 
>> (sprachabhängig) Regeln definieren, bei welchen Zeichen das 
>> Leerzeichen entfällt.
>>
>>> Ich will übrigens gar nichts aufbrechen :) Im Gegenteil, ich bin mit 
>>> "name=Limburg an der Lahn" vollkommen zufrieden.
>>
>> Die Software-Entwickler wahrscheinlich nicht.
>> Die Trennung wäre nicht nur für den Renderer nützlich, sondern auch 
>> für einen Suchalgorithmus. So könnte der Anwender wählen, ob er das 
>> Suchmuster nur im "Kern" oder auch im Präfix oder Suffix suchen möchte.
>
> vielleicht habe ich mich etwas missverständlich ausgedrückt, sorry. Du 
> hast vollkommen recht, sowohl das Zusammensetzen als auch das Trennen 
> ist schwierig bis nahezu unmöglich (im Fall der Übersetzung - 
> maschinelle Übersetzung hat selbst für normalen Fließtext nur eher 
> bescheidene Ergebnisse und wir reden hier von Eigennamen, die 
> grundsätzlich aus einem Wörterbuch kommen).
>
> Mein Vorschlag ist, das Zusammensetzen und das Trennen durch Software 
> vollständig zu eliminieren, indem man immer in jedem einzelnen Tag 
> einen vollständigen zusammenhängenden Namen einträgt.
>
> Also zum Beispiel (gerade bei alt_name kann man wieder drüber 
> streiten, allerdings käme das gerade einem Suchalgorithmus zu gute):
>
> name=Frankfurt am Main
> short_name=Frankfurt
> official_name=Frankfurt am Main, Stadt # Kommt aus dem 
> Gemeindeverzeichnis
> alt_name=Frankfurt (Main);Frankfurt/Main;Frankfurt/M.
> name:ru=Франкфурт-на-Майне
> short_name:ru=Франкфурт
>
> name=Hamburg
> alt_name=Hansestadt Hamburg
> official_name=Freie und Hansestadt Hamburg
>
> Das hat für I18N den Vorteil, dass immer vollständige Namen übersetzt 
> werden. Der Renderer kann sich dann den kürzesten Aussuchen, wenn er 
> keinen Platz hat. Und ein Suchalgorithmus kannst du auch darüber 
> laufen lassen, ohne irgendwie Preprocessing mit Präfixen und Suffixen 
> zu betreiben.
>
> Das ist alles doch schon in Key:name im Wiki erklärt und geregelt. 
> name:prefix und name:suffix übrigens auch [1], ist eigentlich ganz 
> überraschend, wofür das eigentlich mal gedacht war.
>
> Da du auch "die Softwareentwickler" angesprochen hast: Ich bin auch 
> einer ;) Also, hier die ungefilterte Entwicklersicht:
>
> Als Entwickler will ich letzten Endes die Daten mindestens der ersten 
> Normalform. Und wir diskutieren hier nichts anderes als was die 
> korrekte erste Normalform für Ortsnamen ist (eigentlich für 
> administrative Einheiten, aber sei's drum). Die einen sagen: wir 
> normalisieren in drei Teile, Präfix, Kern, Suffix für irgendeine vage 
> Definition von Kern, Präfix und Suffix. Ich sage: der Name ist schon 
> eine Einheit in sich und braucht nicht weiter zerteilt zu werden. Wenn 
> es mehrere Namen gibt, ist doch schön, sollen sie als mehrere Namen 
> entsprechend ihrer Bedeutung bitte auch eingetragen werden. Aber ein 
> Name ist zusammenhängend, in sich abgeschlossen und sollte im 
> Idealfall von keiner Software irgendwie weiter transformiert werden, 
> weil das spätestens bei mehreren Sprachen nicht mehr entscheidbar ist. 
> Manchmal braucht man andere Trennzeichen. Manchmal ändert sich auch 
> die Reihenfolge der Wörter bei der Übersetzung. Manchmal gibt es einen 
> gänzlich anderen Namen. Manchmal gibt es zusätzlichen Präpositionen. 
> Manchmal wird ein Teil des Namens dekliniert.
>
> Mein Problem mit der Präfix-Kern-Suffix-Aufteilung ist auch, dass sie 
> mehr oder weniger willkürlich und präsentationsorientiert ist. Alle 
> Tags in Key:name haben auch eine eigene in der echten Welt relevante 
> Bedeutung. Deswegen präferiere ich diese Variante.
>
>> Ich gehe davon aus, daß Du das in den meisten Fällen nach Gefühl 
>> richtig eintragen kannst und nur in Ausnahmefällen die Regeln lesen 
>> müßtest.
> Danke für das Vertrauen :) Aber zwischen nur selten und gar nicht 
> liegt auch ein Unterschied.
>
>> Bisher stelle ich mir die Entscheidung recht einfach vor: Welche 
>> Bezeichnung würde ich auf einer Karte erwarten, wenn der Platz knapp 
>> ist? Das wäre der Name. Alles davor ist Präfix, alles danach Suffix. 
>> Oder hast Du ein Beispiel für einen schwierigen Fall?
> Martin Strutmann hat in seinen Beiträgen in diesem Thread 
> dankenswerterweise eine ganze Reihe von Beispielen gebracht. Die 
> Wakendorf-Serie ist zum Beispiel sehr interessant.
>
> Außerdem ist der von dir geschilderte Gedankengang 
> Renderer-orientiert. Kann man machen, aber das vernachlässigt wieder 
> alle anderen Anwendungen. Außerdem: Print oder Web? Welcher Stil? 
> Welcher Kartenzweck?
>
> Mein Gedankengang ist: "Frankfurt am Main" ist ein zusammenhängender 
> vollständiger Name, der kommt in einen Tag rein, Ende. "Frankfurt" ist 
> eine gebräuchliche alternative Verkürzung, also kommt es in "alt_name" 
> oder "short_name", Ende. Viel einfacher, als über Renderer, Stile und 
> überhaupt Anwendungen nachzudenken.
>
>>> Wohlgemerkt: ich habe nichts gegen alternative vollständige Namen 
>>> (alt_name, old_name, name:alternative, name:official, 
>>> name:$YOUR_QUALIFIER, ...), nur Bedenken gegen das Zerstückeln.
>>
>> Einmal vollständig und einmal nur der Hauptteil wäre auch möglich, 
>> ist aber etwas redundant und hat IMHO mehr Fehlermöglichkeiten.
> Genau das schlage ich vor. Das bisschen Redundanz erspart uns aber 
> einen Haufen von irgendwelchen Trennungs- und 
> Zusammensetzungsalgorithmen, die jetzt nicht gerade ein Beispiel für 
> Robustheit sein werden - natürlich auch IMHO.
>
> Viele Grüße
> Igor
>
> [1] http://wiki.openstreetmap.org/wiki/Key:name:prefix
>
> _______________________________________________
> Talk-de mailing list
> Talk-de at openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-de

Ich versuche hier nochmal meine Meinungen zu äussern und vielleicht das 
Thema / die Themen nochmal differenziert zusammenzufassen:
Vielleicht wissen wir am Ende dann auch wieder über was wir jetzt 
eigentlich diskutieren wollen oder müssen.

1. das Einstiegsproblem:
OSMAND findet den Ort "Ostseebad Zingst" nicht, wenn man nach "Zingst" 
sucht:
Meiner Meinung tatsächlich ein Softwareproblem von OSMAND, welches sich 
durch nicht allzu großen Aufwand lösen lassen müsste, schließlich ist 
der String "Zingst" ein Teil des Strings "Ostseebad Zingst".
Gerne wird ja hier darauf verwiesen, das wir kein Mapping für den 
Renderer betreiben, für Software eben auch nicht!

2. Nutzung des Keys "name=*":
Hier kam nun die Frage auf, wie viel Name denn nun im Tag "name=*" zu 
stecken hat.
Ich halte Namenszusätze hier nicht für Unsinn, schon gar nicht, wenn sie 
Teil des amtlichen Stadtnamens sind.

3. Nutzung von Keys "name:$YOUR_QUALIFIER":
Ich will jetzt nicht wiederholen wie viele Varianten es für 
"$YOUR_QUALIFIER" gibt. Wer eine für deutschlandweit gültige Liste haben 
will, darf sich gerne hier umkucken:
http://wiki.openstreetmap.org/wiki/User:Fortunequest/LOK#name
Diese Liste habe ich mal aus einer Laune heraus erstellt um grade dem 
Wildwuchs von Schlüsseln entgegenzuwirken. Alleine bei uns in 
Deutschland haben wir aktuell 7280 verschiedene Schlüssel. Viele erzeugt 
aufgrund von Rechtschreibfehlern oder wohl aus einer Laune heraus.

4. Wohin gehört denn nun was?:
Wie ich es aktuell halten würde...
key=name -> value="amtlicher Stadtname"
Alle Zusätze die amtlich festgelegt sind kommen da mit hinein.

Sollte es Städtebezeichnungen in Fremdsprachen geben, dann...
z.B. key=name:en -> value="Munich"
z.B. key=name:fr -> value="Aix-la-Chapelle"
usw...

Gleiches für Lokale Variationen.

Für Alternativnamen sollte man sicherlich einen einheitlichen Key 
definieren: vorhanden sind schon: "name:alt=*" , "name:alternative=*" , 
"alt_name=*", "alt-name=*", "alternative_name=*", "alternative name=*" 
"alt:name=*", ... Liste ist nicht vollständig!

Redundante informationen, die schon anderweitig enthalten sind, würde 
ich komplett weglassen.

Ortsnamenzusätze, wie die von mir erwähnten Beispiele: 
„Wissenschaftsstadt“, „Universitätsstadt“, „Documentastadt“ ....
gehören nicht in "name=*", Sie stehen ja auch auf den Ortsschildern vom 
Ortsnamen abgesetzt.
Wohin mit diesen, ist wohl nach wie vor offen...

5. Der Thread lautet Ortsnamenzusätze:
D.h. Ortsteilnamen erzeugen mit großer Wahrscheinlichkeit neue Probleme...
Gleiches gilt für Gemeinden, Regionen, etc.

6. Quo Vadis:
Leider habe ich keine Mustergültige Lösung parat, ich hoffe, das man 
durch ne öffentliche Diskussion am Ende aber mehr Klarheiten erzeugen 
kann als Chaos zu stiften!

Abschließend hoffe ich, das sich keiner auf den Schlips getreten fühlt, 
wenn ich jetzt meine nicht vorhandene Kompetenz überschritten habe und 
Dinge vergessen, oder fälschlich dargestellt haben solte!

Liebe Grüße

Dominik

-- 
Dominik Wegerle
"fortunequest"
osm at dwegerle.eu




Mehr Informationen über die Mailingliste Talk-de