[Talk-de] RelatedTerms im Wiki zur verbesserten Tag-Suche

Stefan Keller sfkeller at gmail.com
Do Sep 1 16:57:38 UTC 2011


Wir experimentieren z.Zt. mit unserem TagFinder
(http://152.96.56.32/poiservice/tagfinder ) und möchten damit die
schnelle Suche nach OSM-Tags verbessern (vgl. Thread "Taginfo Ideen
..." vom 1. Mai 2011 auf Talk-de).

Nebst der Übersetzung (z.B. de=>en) - z.Zt. mangels Besserem mit dem
"Microsoft Translator Service" - ist einer der entscheidenden Punkte,
dass Synonyme und verwandte Begriffe gefunden werden.

Beispiel: Man sucht nach "Kirche" und erhält
"amenity=place_of_worhsip" als Antwort. Die Übersetzung
"Kirche=>Church" führt da nicht zum Ziel.

Es ist eine kontrollierte Wortliste (Thesaurus) nötig, d.h. Synonyme
und verwandte Begriffe. Diese sind z.T. OpenStreetMap-spezifisch und
können nicht mit einem allgemeinen Thesaurus gefunden werden (wobei
z.B. http://www.openthesaurus.org nützliche Dienste erweist).

=> Ich schlage daher vor, verwandte Begriffe - sog. RelatedTerms - im
OSM-Wiki zu erfassen.

Diese RelatedTerms können durch die Community aktuell gehalten werden
(ich würde gerne mit gutem Beispiel vorangehen). Natürlich wäre es
präziser, wenn nebst RelatedTerms auch Synonyme und
Ober-/Unterbegriffe verwendet würden. Aber das scheint mir zu
kompliziert (viele gehen ja lieber mappen statt dokumentieren).

=> Zur Erfassung und zum leichten Auslesen nehme ich Wiki-Templates.

Das sähe dann in der rohen Wiki-Seite (z.B.
http://wiki.openstreetmap.org/wiki/DE:Tag:amenity%3Dplace_of_worship )
so aus (z.B. unten in der Nähe der Kategorien):
  {{RelatedTerm|DE_de|Kirche}}
  {{RelatedTerm|DE_de|Moschee}}, {{RelatedTerm|DE_de|Synagoge}},
{{RelatedTerm|DE_de|Andachtsgebäude}}
  {{RelatedTerm|DE_ch|Gebetshaus}}

Die RelatedTerms werden durch den Update-Prozess von Taginfo vorgängig
aus den Wiki-Seiten ausgelesen und in der Taginfo DB abgelegt (macht
er jetzt schon für das Template "Tag"). Die RelatedTerms-Listen stehen
dann über die schnelle Taginfo API zur Verfügung. Der "Bevorzugte
Begriff" (PreferredTerm, bzw. "Preferred Tag") wird übrigens über ein
anderes Taginfo API eruiert, das eine Tag-Statistik zurückgibt.
Theoretisch liessen sich Teile des Codes dann direkt in die
Taginfo-Suche einbauen (das Taginfo API wird ja jetzt schon genutzt).

=> Anregungen, Kommentare?

Grüsse, Stefan




Mehr Informationen über die Mailingliste Talk-de