[Talk-de] TagFinder - eine Volltext-Suchmaschine für OSM Tags (Prototyp)

Andreas Labres list at lab.at
Di Jan 20 06:52:27 UTC 2015


On 19.01.15 18:06, Stefan Keller wrote:
> Am 19. Januar 2015 um 17:30 schrieb Andreas Labres <list at lab.at>:
>> * Irgendwie weiß man nicht, in welcher Sprache man grade mit dem Tool
>> interagiert. Das sollte irgendwie leicht auswählbar sein.
> Rechts oben steht eine Flagge und "Deutsch". Meintest du das?

Ja, offensichtlich habe ich das komplett übersehen! Ich denke, wenn ich die
Seite aufrufe, konzentriere ich mich unwillkürlich auf das Eingabefeld. Eine
Flagge hätte ich dort in der Nähe gesucht.

>> * Die Ergebnisse sollten eine sinnvolle Reihenfolge haben, z.B. eine Suche nach
>> "Arzt" sollte das treffendste amenity=doctors *weit* vor dem /Fehler/
>> amenity=doctor liefern!
> Es gibt eine Reihenfolge: Zuerst diejenigen Tags, in denen der
> Suchbegriff direkt im Key oder Value vorkommt.

Naja, grade der Suchbegriff "Arzt" zeigt, dass da grob das Falsche herauskommt!
Zu "betonen" wären Hits innerhalb der "description" des Templates (oder im
ersten Absatz oder in der category (wieder Hinweis auf Hierarchien).

Hier hätte unbedingt amenity=doctors der erste & hervorgehobene Treffer sein
müssen, das amenity=doctor (wie gesagt, ein bekannter Fehler) hätte man eher
verschweigen sollen (oder nur ganz unten unter "ferner liefen" anführen).
Vielleicht wäre das auch über das Wiki "erlernbar" (für die Software), wenn man
konsequent eine "common errors" Sektion einführt. Oder man macht im Wiki eine
Ausnahmen-Seite ein, wo solche Besonderheiten aufgeführt sind (z.B. mit
Einträgen der Art "ignore amenity=doctor").

> Was "sinnvoll" bzw. "richtig" ist, kann fast nur ein Mensch entscheiden.

Nein. Wenn ein tag-Hit gefunden wird und dort "doctor" in der description
gefunden wird, ist das ein "richtiger" Tag.

Und auch bei der Unterscheidung: 'Es gibt zwei Hits, wo "doctor" in der Value
vorkommt (mal doctor, mal doctors), welcher ist der richtige?'
muss der Hit den Vorrang haben, zu dem es auch einen Tag-Eintrag im Wiki gibt!
Aber wie gesagt, mir scheint die description im Wiki wichtiger als die Value
eines Tags.

> Wie soll das System entscheiden, welche der 100% treffende Ergebnisse
> zu wählen ist?

Ähm, wo kommt auf den Wiki-Seiten
* Tag:sport=archery
* Tag:military=range
das Wort "Praxis" vor? Da kann ja nur irgendeine Fuzzy-Suche zugeschlagen haben,
das meinte ich mit: 100%ig ist ein übereinstimmender Hit, nix fuzzy.

>> * Das Ding sollte Hierarchien verstehen und entsprechend anschaulich/leicht
>> fasslich darstellen, z.B. eine Suche nach "Wohnstraße" findet ja richtig den Tag
>> highway=living_street und den Key highway, es sollte dem Nutzer aber auch sofort
>> klar sein, dass der Key der "Überbegriff" ist, der Tag das konkrete (passende)
>> Key/Value-Paar.
> Das ist ein sehr interessanter Aspekt:
> Nur schon wie wir solche Modellierungs-Dinge nennen sollten, ist mir unklar.

Ich stelle mir das so vor:

Wenn ich nach "Wohnstraße" suche, ist der passendste Hit:
DE:Tag:highway=living_street (übrigens würde ich mir einen Link auf die DE-Seite
wünschen, wenn Sprache Deutsch und die DE-Seite vorhanden). Und dann könnte man
die hierarchische Einordnung angeben, also "DE:Key:highway", dann die
"group/Gruppe" (idF wieder Highway).

   Tag: highway=living_street
   +--- Key: highway=*
          +--- Gruppe: highway (also "Straßen/Wege")

> Ich nehme an, du meinst Hierarchien im Sinne der OSM-Tags?
> Begriffshierarchien kennt der TagFinder über einen eigens erstellten
> Thesaurus (Bevorzugter Begriff, Überbegriff, Unterbegriff).
> Bei OSM ist es leider nicht immer so, dass der Key der Überbegriff ist
> (z.B. bei building=yes)...

   Tag: building=house
   +--- Key: building=*
          +--- Gruppe: Man made

Zusatztags, sind wieder ein eigenes Thema, da müßte man wohl erst eine
Hierarchie heraussuchen, also

   Key: maxspeed=*
   +--- Zusatztag zu Key: highway=*
          +--- Gruppe: highway (also "Straßen/Wege")

oder

   Tag: cycleway=opposite lane
   +--- Key: cycleway=*
          +--- Zusatztag zu Key: highway=*
                 +--- Gruppe: highway (also "Straßen/Wege")

Übrigens wäre auch schön, wenn man leicht (z.B. durch unterschiedliches Layout)
erfassen könnte, was ein Key und was ein Value Eintrag ist.

/al





Mehr Informationen über die Mailingliste Talk-de