[Talk-de] OSBugs bug?

Michael Bemmerl osm-talk at mx-server.de
So Mär 11 23:56:42 UTC 2012


Steffen Grunewald schrieb:
> Hmm, ich habe jetzt erst einmal in den Sourcecode geguckt, Python ist
> nicht meine Baustelle - und irgendwie vermute ich ja, daß die Daten in der 
> DB auch noch ein Mix aus ISO8819-irgendwas und UTF-8 sein werden - in dem
> Fall hülfe gar nix außer ausgiebiger Fehlerbehandlung.
> Gut, man könnte wahrscheinlich gucken, ob >=0x80 ohne UTF-konforme 
> "Fortsetzung" auftauchen und dann mit Latin-xy weiterzumachen versuchen...
> (was bei "äß" vermutlich spektakulär in die Hose geht).
> Ich würde jedenfalls erst einmal die Geocoder-DB ansehen, welche 
> Überraschungen dort noch warten.

Richtig, in der Datenbank ist Mischmasch zwischen ISO-8819-x und UTF-8.
Beispiel ID 7: "Châteaugiron". Das â ist als 0xE2 in der DB, wäre als
UTF-8 aber 0xC3 0xA2.

Grüße,
Michael

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 195 bytes
Beschreibung: OpenPGP digital signature
URL         : <http://lists.openstreetmap.org/pipermail/talk-de/attachments/20120312/9e38c155/attachment.sig>


Mehr Informationen über die Mailingliste Talk-de