[Talk-br] KML para o PicLayer à partir dos PDFs do IBGE

Thiago Marcos P. Santos tmpsantos em gmail.com
Quarta Março 5 02:37:41 UTC 2014


Olá pessoal,

Sou novato na lista, me interessei pelo OSM este ano e comecei a
mapear minha cidade natal: Pará de Minas - MG. Meu objetivo é terminar
a cidade ainda este ano e ter uma mapa superior ao da cidade vizinha
Itaúna - MG. :)

Uma dificuldade que imagino que muitos tem é quanto ao nomes das ruas.
Teoricamente temos todas estas informações nos PDFs do IBGE, mas não é
prático importar estes dados como uma layer no JOSM. Recentemente
comecei a trabalhar em um script para extrair os mapas dos PDFs usando
OCR.

A primeira versão funciona razoavelmente bem e estou disponibilizando
o código para a comunidade. Até então consigo gerar um KML e .png(s)
que podem ser importados para o JOSM usando o plugin PicLayer. Note que
os encaixes não são perfeitos porque trata-se de uma colagem de mapas
grosseiros em diferente escalas, mas é bastante útil assim mesmo.

Screenshots:
http://tmpsantos.com.br/stuff/ibge_layer_1.png
http://tmpsantos.com.br/stuff/ibge_layer_2.png
http://tmpsantos.com.br/stuff/ibge_layer_3.png

O ideal seria gerar tiles com estas imagens e hospedar em algum lugar.
Isto tornaria a manipulação no JOSM mais fácil (usaria bem menos
memória), acessível para mappers que não usam Linux e a geração de
imagens poderia ser feito em larga escala. Este é o próximo passo e
gostaria de sugestões.


--


= Instruções =


* Ache o código da cidade no site do IBGE:

- http://www.ibge.gov.br/home/geociencias/areaterritorial/area.shtm
    Pará de Minas = 3147105 = 3147105.zip


* Baixe o arquivo de mapas da sua cidade e descompacte:

ftp://geoftp.ibge.gov.br/mapas_estatisticos/censo_2010/mapas_de_setores_censitarios/MG/3147105.zip

Atenção, use o arquivo do "censo_2010"!


* Instale as dependências (testado no Ubuntu 13.10 em um Intel 64-bits):

- python-pythonmagick
    $ sudo apt-get install python-pythonmagick
- python-tesseract
    https://code.google.com/p/python-tesseract/downloads/list


* Como usar a ferramenta:

$ git clone https://github.com/tmpsantos/IBGETools.git
$ cd IBGETools
$ mkdir out; cd out
$ ../ibge_kml_maker.py [path_para_os_diretorio_com_os_pdfs] > out.kml

Ex.: $ ../ibge_kml_maker.py ../../osm/3147105/MSU/ > out.kml

Você pode apontar para a raiz de onde o pacote foi descompactado, mas
recomendo apenas se a cidade for pequena. Senão o KML vai ficar enorme
e o JSOM vai capotar por falta de memória. Neste caso, separe os PDFs
que você quer em um outro diretório e aponte para o mesmo.

Bugs (certamente tem vários), contribuições, dúvidas, etc. é só falar
ou fazer um pull request no GitHub.

[]'s



Mais detalhes sobre a lista de discussão Talk-br