[Talk-de] OSBugs bug?
Steffen Grunewald
steffen.grunewald at gmx.net
So Mär 11 19:27:09 UTC 2012
On Sat 2012-03-10 (00:20), Michael Bemmerl wrote:
> Mitja Kleider schrieb:
> > On 03/09/2012 07:28 PM, Steffen Grunewald wrote:
> >> (wenn encode("utf-8") einen Fehler
> >> produziert, dann schlimmstenfalls den "near XYZ"-Teil ganz weglassen,
> >> hier in der Gegend produziert geonames teilweise ziemlich haarsträubende
> >> Sachen).
> >
> > Stimmt, der Ortsname ist nicht besonders präzise, sollte man mal durch
> > einen OSM Geocoder ersetzen ;)
> >
> > Ich habe "near XYZ" auf dem Server rausgenommen, damit der Feed wieder
> > funktioniert. Vielleicht hast du ja Lust, [1] weiter voranzutreiben.
>
> Ich hab' das mal auf meinem lokalen Rechner ausprobiert, und konnte den
> Fehler bei mir lösen, indem ich den MySQL-Client auf UTF-8 konfiguriert
> habe. Bei mir ist (auch?) noch die Standard-Zeichenkodierung von Mysql
> auf latin1 eingestellt. Auch das encode("utf-8") brauchte es nicht mehr.
>
> Ich hab' die Änderung mal in meinen Fork eingecheckt [1].
Hmm, ich habe jetzt erst einmal in den Sourcecode geguckt, Python ist
nicht meine Baustelle - und irgendwie vermute ich ja, daß die Daten in der
DB auch noch ein Mix aus ISO8819-irgendwas und UTF-8 sein werden - in dem
Fall hülfe gar nix außer ausgiebiger Fehlerbehandlung.
Gut, man könnte wahrscheinlich gucken, ob >=0x80 ohne UTF-konforme
"Fortsetzung" auftauchen und dann mit Latin-xy weiterzumachen versuchen...
(was bei "äß" vermutlich spektakulär in die Hose geht).
Ich würde jedenfalls erst einmal die Geocoder-DB ansehen, welche
Überraschungen dort noch warten.
Anstelle des "near $name" könnte ich mir (etwa auf volle Bogenminuten
gerundete) Positionen vorstellen, ich sehe zwar die Koordinaten im Link,
aber nur in Dezimalgrad...
S
Mehr Informationen über die Mailingliste Talk-de