[Talk-de] Das neue Taginfo

Jochen Topf jochen at remote.org
Do Okt 7 20:02:45 UTC 2010


On Wed, Oct 06, 2010 at 08:45:26PM +0200, M∡rtin Koppenhoefer wrote:
> Am 5. Oktober 2010 17:11 schrieb Jochen Topf <jochen at remote.org>:
> > On Tue, Oct 05, 2010 at 04:30:03PM +0200, Peter Wendorff wrote:
> >>  On 05.10.2010 16:00, Chris66 wrote:
> >>> Wunsch: In dem Suchfeld soll auch nach Werten gesucht werden können.
> >>> Also zB. gebe ich  "sauna" ein und möchte die zugehörigen Keys
> >>> (amenity vs. leasure) angezeigt bekommen.
> >> name nicht zu vergessen :D
> >
> > Und da liegt auch das Problem, warum ich das bisher nicht gemacht hab. Es ist
> > nicht so einfach "mal schnell" 50 Millionen Tags zu durchsuchen. D.h.  ich
> > brauche irgendeinen Index. Ein simpler Index ist einfach zu machen in Sqlite.
> > Aber es dauert relativ lang, einen solchen Index aufzubauen. Und dann hab ich
> > noch keine Substring-Suche, das ist aufwändiger und ich hab noch keine gute
> > Idee, wie ich das machen soll. Und potentiell gibt es dann sehr viele Treffer,
> > z.B. eben im name-Tag.
> 
> 
> ja, den name-tag solltest Du vermutlich komplett ignorieren, genauso
> wie ref und noch ein paar andere Kandidaten (evtl. note, description).

Ich will auf keinen Fall eine hardgecodeded Liste, welche Tags zu ignorieren
sind oder so. Die muss man dann wieder pflegen. D.h. das muss irgendwie
automatisch gehen. Ist aber natürlich machbar, man ignoriert halt alle Values
die weniger als 1000 mal vorkommen oder sonstwas.

> Die value-Suche wäre schon extrem wichtig, weil man sonst ja den Tag
> schon kennen muss (dafür kann man dann tolle Statistiken und die Karte
> mit der Verbreitung ansehen, wenn man den Tag erstmal gefunden hat).

Ja, ist schon klar. Value-Suche ist ganz oben auf der Liste von Sachen, die
jeder gerne will. :-)

> Auch eine Karte, nachdem man einen bestimmten Wert gefunden hat, wäre
> super (weiss nicht, wie aufwendig das ist), weil es einem ja nicht
> hilft, wenn man eine Karte aller amenities angezeigt bekommt
> (großteils flächig rot). Bei seltenen Keys ist es natürlich schon
> ausreichend.

Schwierig. Für 50 Mio Tags auf jeden Fall nicht zu machen. Aber vielleicht
für die 10.000 häufigsten Tags oder so. Mal sehn...

Jochen
-- 
Jochen Topf  jochen at remote.org  http://www.remote.org/jochen/  +49-721-388298





Mehr Informationen über die Mailingliste Talk-de