[Talk-de] Idee für einen Bot

Alexander Matheisen AlexanderMatheisen at ish.de
Sa Dez 4 14:40:11 UTC 2010


> Das scheint mir eine unheimlich komplexe Angelegenheit zu sein, die so 
> fehleranfällig ist, dass es vermutlcih mehr Probleme macht als es löst. Wie 
> willst Du die daten auslesen? Bräuchtest Du ja irgendeine Heuristik, die 
> erkennt, was wie eine Adresse aussieht. Und ob die dann zu der Firma gehört 
> (oder vielleicht nur dem Webdesigner oder einem Kunden oder was auch immer)?

Das ließe sich noch irgendwie machen, Adressen und Öffnungszeiten haben
ja immer eine gewisse Form.

> Ich glaube nicht dass Google das so macht. Die Sammeln afaik Daten die sie 
> teilweise von externanbietern einkaufen (qype bspw.), und man kann sich dort 
> als Firma einfach anmelden.

Ich meine, mal gelesen zu haben, bzw. das beweisen zu können, dass die
wirklich Webseiten auslesen. Wie kommt es sonst, dass in meiner
Nachbarschaft z.B. eine Modellbaufirma, die in einem normalen Wohnhaus
ist und vermutlich nur über einen Mitarbeiter verfügt, da drin ist?

> IMHO ist unser größeres Problem gerade auch nicht das Eintragen von POIs, 
> sondern das komfortable Auslesen. Google hat halt das schöne feature "suche 
> pizza in der nähe von Punkt X". Wir haben nichts vergleichbares (openlinkmap 
> kommt dem noch am nächsten, aber ist trotzdem weit davon entfernt). Wenn wir 
> sowas hätten, gäbe es auch viel mehr Motivation, POIs umfangreich einzutragen 
> und das Problem würde sich meiner Ansicht nach von selber lösen.

Das Auslesen ist ja wieder eine andere Baustelle. Erstmal muss man ja
überhaupt auch mal die Daten reinbekommen. Und OLM zeigt auch jetzt
schon Öffnunngszeiten an, die werden nicht nur mit einer Suche wie
Google angezeigt. Nur es ist eben viel Arbeit, bei jedem POI auf der
Homepage oder an der Tür die Öffnungszeiten und Kontaktdaten
nachzuschauen und einzutragen. Da diese Informationen immer ein halbwegs
standartisiertes Format haben, lässt sich solch eine Arbeit gut von
einem Programm erledigen.

Allerdings ist es zur Zeit glaube ich wirklich besser, wenn man erstmal
nur Listen erstellt und die Infos von Hand einträgt. Sollte mal
irgendwann jede Hausnummer eingetragen sein und die meisten POIs
zumindest mit Name, kann man die Zuordnung auch noch mit einem Programm
halbwegs automatisch machen, zumindest in den Fällen, in denen das
nichts mit Raterei zu tun hat.


Alex





Mehr Informationen über die Mailingliste Talk-de