[Talk-de] Problematik der Ortsnamenzusätze

Igor Podolskiy igor.podolskiy at vwi-stuttgart.de
Do Jun 9 11:28:07 UTC 2011


Bodo,

On 08.06.2011 22:47, Bodo Meissner wrote:
>
> Das erschwert das Zusammensetzen etwas, weil man einmal ein Leerzeichen einfügen muß und einmal nicht. Vermutlich lassen sich (sprachabhängig) Regeln definieren, bei welchen Zeichen das Leerzeichen entfällt.
>
>> Ich will übrigens gar nichts aufbrechen :) Im Gegenteil, ich bin mit "name=Limburg an der Lahn" vollkommen zufrieden.
>
> Die Software-Entwickler wahrscheinlich nicht.
> Die Trennung wäre nicht nur für den Renderer nützlich, sondern auch für einen Suchalgorithmus. So könnte der Anwender wählen, ob er das Suchmuster nur im "Kern" oder auch im Präfix oder Suffix suchen möchte.

vielleicht habe ich mich etwas missverständlich ausgedrückt, sorry. Du 
hast vollkommen recht, sowohl das Zusammensetzen als auch das Trennen 
ist schwierig bis nahezu unmöglich (im Fall der Übersetzung - 
maschinelle Übersetzung hat selbst für normalen Fließtext nur eher 
bescheidene Ergebnisse und wir reden hier von Eigennamen, die 
grundsätzlich aus einem Wörterbuch kommen).

Mein Vorschlag ist, das Zusammensetzen und das Trennen durch Software 
vollständig zu eliminieren, indem man immer in jedem einzelnen Tag einen 
vollständigen zusammenhängenden Namen einträgt.

Also zum Beispiel (gerade bei alt_name kann man wieder drüber streiten, 
allerdings käme das gerade einem Suchalgorithmus zu gute):

name=Frankfurt am Main
short_name=Frankfurt
official_name=Frankfurt am Main, Stadt # Kommt aus dem Gemeindeverzeichnis
alt_name=Frankfurt (Main);Frankfurt/Main;Frankfurt/M.
name:ru=Франкфурт-на-Майне
short_name:ru=Франкфурт

name=Hamburg
alt_name=Hansestadt Hamburg
official_name=Freie und Hansestadt Hamburg

Das hat für I18N den Vorteil, dass immer vollständige Namen übersetzt 
werden. Der Renderer kann sich dann den kürzesten Aussuchen, wenn er 
keinen Platz hat. Und ein Suchalgorithmus kannst du auch darüber laufen 
lassen, ohne irgendwie Preprocessing mit Präfixen und Suffixen zu betreiben.

Das ist alles doch schon in Key:name im Wiki erklärt und geregelt. 
name:prefix und name:suffix übrigens auch [1], ist eigentlich ganz 
überraschend, wofür das eigentlich mal gedacht war.

Da du auch "die Softwareentwickler" angesprochen hast: Ich bin auch 
einer ;) Also, hier die ungefilterte Entwicklersicht:

Als Entwickler will ich letzten Endes die Daten mindestens der ersten 
Normalform. Und wir diskutieren hier nichts anderes als was die korrekte 
erste Normalform für Ortsnamen ist (eigentlich für administrative 
Einheiten, aber sei's drum). Die einen sagen: wir normalisieren in drei 
Teile, Präfix, Kern, Suffix für irgendeine vage Definition von Kern, 
Präfix und Suffix. Ich sage: der Name ist schon eine Einheit in sich und 
braucht nicht weiter zerteilt zu werden. Wenn es mehrere Namen gibt, ist 
doch schön, sollen sie als mehrere Namen entsprechend ihrer Bedeutung 
bitte auch eingetragen werden. Aber ein Name ist zusammenhängend, in 
sich abgeschlossen und sollte im Idealfall von keiner Software irgendwie 
weiter transformiert werden, weil das spätestens bei mehreren Sprachen 
nicht mehr entscheidbar ist. Manchmal braucht man andere Trennzeichen. 
Manchmal ändert sich auch die Reihenfolge der Wörter bei der 
Übersetzung. Manchmal gibt es einen gänzlich anderen Namen. Manchmal 
gibt es zusätzlichen Präpositionen. Manchmal wird ein Teil des Namens 
dekliniert.

Mein Problem mit der Präfix-Kern-Suffix-Aufteilung ist auch, dass sie 
mehr oder weniger willkürlich und präsentationsorientiert ist. Alle Tags 
in Key:name haben auch eine eigene in der echten Welt relevante 
Bedeutung. Deswegen präferiere ich diese Variante.

> Ich gehe davon aus, daß Du das in den meisten Fällen nach Gefühl richtig eintragen kannst und nur in Ausnahmefällen die Regeln lesen müßtest.
Danke für das Vertrauen :) Aber zwischen nur selten und gar nicht liegt 
auch ein Unterschied.

> Bisher stelle ich mir die Entscheidung recht einfach vor: Welche Bezeichnung würde ich auf einer Karte erwarten, wenn der Platz knapp ist? Das wäre der Name. Alles davor ist Präfix, alles danach Suffix. Oder hast Du ein Beispiel für einen schwierigen Fall?
Martin Strutmann hat in seinen Beiträgen in diesem Thread 
dankenswerterweise eine ganze Reihe von Beispielen gebracht. Die 
Wakendorf-Serie ist zum Beispiel sehr interessant.

Außerdem ist der von dir geschilderte Gedankengang Renderer-orientiert. 
Kann man machen, aber das vernachlässigt wieder alle anderen 
Anwendungen. Außerdem: Print oder Web? Welcher Stil? Welcher Kartenzweck?

Mein Gedankengang ist: "Frankfurt am Main" ist ein zusammenhängender 
vollständiger Name, der kommt in einen Tag rein, Ende. "Frankfurt" ist 
eine gebräuchliche alternative Verkürzung, also kommt es in "alt_name" 
oder "short_name", Ende. Viel einfacher, als über Renderer, Stile und 
überhaupt Anwendungen nachzudenken.

>> Wohlgemerkt: ich habe nichts gegen alternative vollständige Namen (alt_name, old_name, name:alternative, name:official, name:$YOUR_QUALIFIER, ...), nur Bedenken gegen das Zerstückeln.
>
> Einmal vollständig und einmal nur der Hauptteil wäre auch möglich, ist aber etwas redundant und hat IMHO mehr Fehlermöglichkeiten.
Genau das schlage ich vor. Das bisschen Redundanz erspart uns aber einen 
Haufen von irgendwelchen Trennungs- und Zusammensetzungsalgorithmen, die 
jetzt nicht gerade ein Beispiel für Robustheit sein werden - natürlich 
auch IMHO.

Viele Grüße
Igor

[1] http://wiki.openstreetmap.org/wiki/Key:name:prefix




Mehr Informationen über die Mailingliste Talk-de