Hi all,<br><br><div class="gmail_quote">On Wed, Mar 28, 2012 at 6:48 AM, Ian Dees <span dir="ltr"><<a href="mailto:ian.dees@gmail.com" target="_blank">ian.dees@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">



<div>On Wed, Mar 28, 2012 at 5:47 AM, Josh Doe <span dir="ltr"><<a href="mailto:josh@joshdoe.com" target="_blank">josh@joshdoe.com</a>></span> wrote:<br></div><div class="gmail_quote"><div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">




I initially just sent this to Ian Dees, but maybe there are others on this list<br>
that are thinking of doing this or could help.<br>
<br>
Considering the upcoming license change and it's impact (many roads<br>
that may become missing), I was thinking more about using TIGER 2011<br>
to find roads that seem to be missing in the OSM database. My PostGIS<br>
skills are nil, but it seems like it should be a fairly trivial query<br>
to buffer the<br>
OSM ways and find TIGER segments which don't intersect the buffered ways.<br>
Hardest part will then be scaling this up to all 3140 counties. Later we could<br>
continue to utilize the resource by extending this work to progressively get<br>
more intelligent by splitting ways into two node segments to get more accurate<br>
results, and maybe do string matching to highlight name problems. Oh and<br>
flagging of erroneous data in TIGER. And maybe stats per county, and ...<br>
<br>
This requires hardware resources and people with skills to manage the large<br>
database and ideally move towards weekly/daily/minutely updates, and<br>
to generate tiles showing the missing segments. Anyone interested in<br>
helping with this?</blockquote><div><br></div></div><div>I started playing with this last night and ended up with the Chicago area metro extract from Mike and the Cook County TIGER roads data as layers in QGIS. Next up is to play with various queries to find missing roads in OSM. I like the idea of buffer and joining as a start and will probably move over to PostGIS to do that.</div>




<div><br></div><div>I'd love to hear from anyone else that has ideas.</div></div>
<br></blockquote><div><br>As for scaling, it may be preferable to process counties on request, it is a pretty expensive operation especially when you get into the details and start realizing all the subqueries you'll need to get it right. The added advantage is that it is easier to keep track of the counties that are already looked at, at the expense of some overhead coding.<br>


<br>Queries to find missing roads entirely based on intersection are not likely to be very successful for two reasons: 1) TIGER spatial accuracy is bad enough to generate a lot of false positives and 2) a buffered OSM road will likely intersect more than one TIGER road, even if the actual road does not exist in JOSM.<br>

<br>What you could do is buffer all OSM roads and filter those TIGER roads that are more than x % outside of the resulting polygon. Those may be candidates for missing roads. Another interesting case for a microtasking platform by the way, to have people who are not necessarily experienced OSM editors identify the valid missing roads from the resulting dataset.<br>

<br>Best<br>Martijn<br>-- <br></div></div>martijn van exel<br>geospatial omnivore<br>1109 1st ave #2<br>salt lake city, ut 84103<br><a href="tel:801-550-5815" value="+18015505815" target="_blank">801-550-5815</a><br>
<a href="http://oegeo.wordpress.com" target="_blank">http://oegeo.wordpress.com</a><br>