[Talk-de] planet files etc auspacken - probelm

Gary68 gary at gary68.de
Do Aug 27 17:41:48 UTC 2009


:-) naja, tage dauert es nicht. und das planet will ich auch nicht
wirklich auspacken, aber doch mit einer perl lib lesen. und eben das
geht nicht.

und das auspacken kann geschwindigkeitsvorteile bringen, wenn ich die
datei mehrfach verwende. plattenplatz vorausgesetzt.

tnx

gerhard
gary68


On Thu, 2009-08-27 at 17:51 +0200, Peter Körner wrote:
> > habe ubuntu im einsatz, einmal mit rechtsklick "extract here" probiert,
> > einmal mit bunzip2...
> 
> Bei so ner riesigen Datei? 150 GB XML? Das kann dich Tage kosten...
> Was willst du denn mit dem Dump machen? Ich würde den Dump mit bzcat in 
> eine Pipe schreiben und von (d)einem Tool auf STDIN auslesen lassen:
> 
> bzcat planet-latest.osm.bz2 | some-tool > output.txt
> 
> Zum Testen beispielsweise:
> 
> bzcat planet-latest.osm.bz2 | less
> 
> Das geht auch mit PHP-Scripten:
> 
> bzcat planet-latest.osm.bz2 | php saxparser.php > output.txt
> 
> Ein Beispiel in PHP kannst du dir hier runterladen:
> 
> http://cassini.toolserver.org/~mazder/duplicate-countries/from-planet.osm/source.tar.bz2
> 
> Peter





Mehr Informationen über die Mailingliste Talk-de