[Talk-de] PERL REGEX?

Frederik Ramm frederik at remote.org
Do Okt 16 19:28:07 UTC 2008


Hallo,

Jacques_N wrote:
> Was ich mit diesem Posting eigendlich sagen wollte: man muß nicht immer  
> das Rad neu erfinden,
> es gibt Leute, die das schon gemacht haben und oft auch viel besser als  
> man es selbst könnte.

Das stimmt.

Allerdings kann man, indem man "cheatet", ein OSM-XML-File unter 
Umstaenden wesentlich schneller parsen als das jeder Parser koennte, 
denn man weiss bestimmte Dinge, die der Parser nicht weiss. Zum Beispiel 
weiss man, dass in einem "lat"- oder "lon"-Attribut niemals ein 
UTF8-Umlaut vorkommen kann, und daher kann man es sich sparen, die Werte 
dieser Attribute nach UTF8 zu parsen. Oder man interessiert sich 
vielleicht nur fuer Nodes in einem bestimmten Koordinatenbereich; ein 
gewoehnlicher XML-Parser, auch SAX, hat schon username, id, lat, lon 
geparst und schoen in ein Hash geschrieben und dafuer extra Speicher 
alloziert, bevor das Programm die Chance hat, zu sagen "nee, dieser Node 
interessiert mich nicht".

Also, ein fertiger XML-Parser bietet sich immer dann an, wenn man eh die 
ganze Datei verarbeiten will oder es auf die Ausfuehrungsgeschwindigkeit 
nicht so ankommt. Wenn man dann am Ende noch von 2 Stunden 
Ausfuehrungszeit auf 1 Stunde Ausfuehrungszeit runter will, kann man 
immer noch von Hand parsen.

Bye
Frederik

-- 
Frederik Ramm  ##  eMail frederik at remote.org  ##  N49°00'09" E008°23'33"




Mehr Informationen über die Mailingliste Talk-de