<div dir="ltr">Dear all,<div><br></div><div>I would like to draw your attention to a project I've been working on to process OSM planet files on Hadoop:</div><div><br></div><div><a href="https://github.com/willtemperley/osm-hadoop" target="_blank">https://github.com/willtemperley/osm-hadoop</a><br></div><div><br></div><div>It's geared toward a quite specific task: from a planet.pbf file, extracting and rasterizing the linear features with a specific tag - we needed to do this for all highways and railways as an input to an accessibility model.</div><div><br></div><div>We've leveraged the Osmosis pbf2 library to perform the deserialization which has just worked, excepting that seeking between file blocks is impossible - see the readme for the workaround.<br></div><div><br></div><div>I'd be interested to hear anyone else's experience processing OSM data using big data tech.  I'd be interested in working on a more generic framework, perhaps with support for Apache Hive or other analytic frameworks.</div><div><br></div><div>Any ideas on how to take things forward, formats to support etc would be of interest.</div><div><br></div><div>Best regards,</div><div><br></div><div>Will Temperley</div><div><br></div><div><br></div></div>