[Talk-de] addr:country Groß-/Kleinschreibung

marcus.wolschon at googlemail.com marcus.wolschon at googlemail.com
Mi Jan 21 14:55:45 UTC 2009


On Wed, 21 Jan 2009 14:28:52 +0100, Andreas Labres <list at lab.at> wrote:
> Frederik Ramm wrote:
>> 1. Wiki umstellen auf "es sollen Grossbuchstaben genutzt werden"
>> 2. Inspector umstellen auf case-insensitive fuer die
>> PLZ-Gebietsbestimmung
>> 3. existierende kleingeschriebene addr:country mit Bot einmalig auf 
>> Grossbuchstaben abändern
>> 4. alles, was im addr:country-Feld steht und nicht zwei Grossbuchstaben 
>> hat, künftig vom Inspector anmeckern lassen
> 
> Gute Vorschläge, gefallen mir alle. :)
> 
> IMO sollte man sich trotzdem eine bessere Alternative überlegen... jetzt
> muß ich
> schon überall Wien dazuschreiben, wo doch eigentlich eh kloa ist, daß
PLZ
> 1xxx
> immer Wien ist. Aber daß ich jetzt tausendfach dazuschreiben muß, daß
> Wien auch
> wirklich in AT ist, is mühsam... beim place tag dazuschreiben oder
sowas.
> 
> Irgendwie schiene mir das überhaupt ein gangbarer Weg, sich die
"optional"
> Dinge
> einer Adresse zusammenzusuchen... die Straße über die nächstliegende
> Straße und
> dann nach einem place tag in der Nähe suchen, dort könnten dann PLZ und
> Ort zu
> finden sein...


"in der Nähe Suchen" ist leider immer eine sehr teure Operation.
Du suchst selten danach, ob Hausnummer 14 in der Testgasse jetzt
in AT ist sondern eher, nach allen Hausnummern 14 in allen Strassen
deren Name "Testgasse" enthält in AT und musst dafür für jede
Hausnummer und jede solche Strasse "in der Nähe Suchen".
Bzw. du machst das gleiche im Vorfeld für alle Strassen und
alle Hausnummern der Welt um einen Such-Index zu bilden, den du
beim nächsten hourly-diff aktualisieren musst und so jede Woche
oder jeden Monat mal komplett von 0 neu bauen solltest.

Wir sind leider noch nicht an dem Punkt wo man das Landesgrenzen-Polygon
zuverlässig und vollständig für jedes Land abfragen kann und dann
einfach
zuerst mit der Bounding-Box des Landes, im Zweifel dann mit einem stark
vereinfachten Polygon und im Zweifel dann mit dem ganzen
Landesgrenzen-Polygon
testen kann.
Momentan stecken wir halt noch an dem Punkt fest, wo man mit viel Arbeit
die geschätzten Bounding-Boxes von Orten und Bundesländern indizieren
muss
und dann hofft auf dem nächstgelegenen Ort das Bundesland oder das Land
zu finden und dann auf dem Bundesland wenigstens das Land und in gut
20-30% der Fälle das Land oder die PLZ oder das Bundesland oder den
Stadtteil
mal eben garnicht mit einem >einfachen< und in sehr endlicher Zeit
umsetzbaren
Algorithmus ermitteln kann.

Marcus




Mehr Informationen über die Mailingliste Talk-de