[Talk-de] [bulk] Re: Straßenliste aus Pulldown Menü auslesen
Falko Thomale
f.thomale at googlemail.com
Do Apr 1 00:50:32 UTC 2010
Am 31.03.2010 22:21, schrieb Stefan Schwan:
> Hallo!
>
> Am 31. März 2010 18:19 schrieb <zorque at web.de>:
>> kann man auch hier [1] die Liste extrahieren? Habe im Quelltext nix gefunden. Wahlbezirke sollten ja auch gemeinfrei sein.
Meiner Meinung nach sind die Wahlbezirke auch in der öffentlichen
Bekanntmachung bei Wahlen angegeben, sollten meiner Meinung nach also
gemeinfrei sein.
>
> man muss ja erstmal einen Buchstaben eingeben...
>
> for letter in {a..z}; do wget -q -O -
> --post-data='buchstabe='$letter''
> "http://www.ulm.de/politik_verwaltung/rathaus/wahlbezirke_wahllokale.13563.3076,3571,3744,4323,13563.htm"
> | grep 'option' | iconv -f iso-8859-1 -t utf-8 | sed 's/^.*<option
> value=".*">//g' | sed 's#</option>##' >> ulm.txt ; done
>
> so fehlen zwar noch die Straßen die mit Umlauten anfangen, aber es ist
> ein Anfang.
Wenn man in die Suchmaske ein * eingibt werden alle Straßennamen in der
Liste angezeigt.
Das Skript ist eine super Sache, ich habe es mal folgendermaßen abgeändert:
wget -q -O - --post-data='buchstabe=*'
"http://www.ulm.de/politik_verwaltung/rathaus/wahlbezirke_wahllokale.13563.3076,3571,3744,4323,13563.htm"
| grep 'option' | iconv -f iso-8859-1 -t utf-8 | sed 's/^.*<option
value=".*">//g' | sed 's#</option>##' >> ulm.txt
Das Ergebnis liegt bei http://pastebin.com/raw.php?i=4XwUMwCd
Mehr Informationen über die Mailingliste Talk-de