[Talk-de] PERL REGEX?
Frederik Ramm
frederik at remote.org
Do Okt 16 19:28:07 UTC 2008
Hallo,
Jacques_N wrote:
> Was ich mit diesem Posting eigendlich sagen wollte: man muß nicht immer
> das Rad neu erfinden,
> es gibt Leute, die das schon gemacht haben und oft auch viel besser als
> man es selbst könnte.
Das stimmt.
Allerdings kann man, indem man "cheatet", ein OSM-XML-File unter
Umstaenden wesentlich schneller parsen als das jeder Parser koennte,
denn man weiss bestimmte Dinge, die der Parser nicht weiss. Zum Beispiel
weiss man, dass in einem "lat"- oder "lon"-Attribut niemals ein
UTF8-Umlaut vorkommen kann, und daher kann man es sich sparen, die Werte
dieser Attribute nach UTF8 zu parsen. Oder man interessiert sich
vielleicht nur fuer Nodes in einem bestimmten Koordinatenbereich; ein
gewoehnlicher XML-Parser, auch SAX, hat schon username, id, lat, lon
geparst und schoen in ein Hash geschrieben und dafuer extra Speicher
alloziert, bevor das Programm die Chance hat, zu sagen "nee, dieser Node
interessiert mich nicht".
Also, ein fertiger XML-Parser bietet sich immer dann an, wenn man eh die
ganze Datei verarbeiten will oder es auf die Ausfuehrungsgeschwindigkeit
nicht so ankommt. Wenn man dann am Ende noch von 2 Stunden
Ausfuehrungszeit auf 1 Stunde Ausfuehrungszeit runter will, kann man
immer noch von Hand parsen.
Bye
Frederik
--
Frederik Ramm ## eMail frederik at remote.org ## N49°00'09" E008°23'33"
Mehr Informationen über die Mailingliste Talk-de