<div dir="ltr">Seem to have lost previous replies :S<div><br></div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sat, Dec 28, 2013 at 2:30 PM, Jason Remillard <span dir="ltr"><<a href="mailto:remillard.jason@gmail.com" target="_blank">remillard.jason@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="im"><span style="font-family:arial,sans-serif;font-size:13px">Hi Daniel,</span><div style="font-family:arial,sans-serif;font-size:13px">
<br></div><div style="font-family:arial,sans-serif;font-size:13px">FYI, the wiki page has a link to the full data set. It is ~ 125K buildings. Probably 125 change sets.</div>

<div style="font-family:arial,sans-serif;font-size:13px"><br></div></div></div></blockquote><div><br></div><div>Yeah, I was going to go a lot smaller than that in all likelyhood, and use JOSM's X-objects-per-changeset features.</div>
<div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="im">
<div style="font-family:arial,sans-serif;font-size:13px"></div></div><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">Do you have address data too? </div><div style="font-family:arial,sans-serif;font-size:13px">
<br></div></div></div></blockquote><div>There is open address data (<a href="http://services.land.vic.gov.au/landchannel/content/productCatalogue">http://services.land.vic.gov.au/landchannel/content/productCatalogue</a>) for the whole state, but no one has yet done the explicit permission and other steps to make that suitable.</div>
<div> </div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">


</div></div><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">- The tagging seem fine. You might want to put the date the source data in the changeset comments. </div><div style="font-family:arial,sans-serif;font-size:13px">


<br></div></div></div></blockquote><div>Will do  </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr">
<div class="im"><div style="font-family:arial,sans-serif;font-size:13px"></div></div><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">This is a lot of data. You need to break it up, something like 1000 buildings per OSM/OSC file. If know python and linux I can send you a script. </div>
<div style="font-family:arial,sans-serif;font-size:13px">

<br></div></div></div></blockquote><div>Send away. I'd do it with a bit of xpath or even manually, but because there are relations, those tend to get broken the few times I've tried.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div dir="ltr"><div class="im"><div style="font-family:arial,sans-serif;font-size:13px"></div><div style="font-family:arial,sans-serif;font-size:13px">Doing the building overlap check with the mapnik image layer is a bad idea. You can automate with postgis, do it with QGIS, or in JOSM by downloading the OSM data into the source OSM files, and running the JOSM validator. </div>


<div style="font-family:arial,sans-serif;font-size:13px"><br></div></div></div></blockquote><div>So I really intend here to keep a human in the loop as much as possible. While the JOSM validations will catch crossed buildings, the data would only be uploaded to areas where it is immediately and obviously clear there is no existing content.</div>
<div><br></div><div>There are a few duplicated way/node validation errors that need to be checked fully, but most are due to multipolygons being turned into relations, and being shared between multiple buildings.</div><div>
 </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">
</div></div><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">If the source data is very good and you do the overlap check ahead of time (postgis, or QGIS), you can have a set of buildings that don't overlap that can be uploaded with less checking and a set that do overlap that will need to be conflated individually. The building that are known to overlap with OSM you might end up keeping all of the OSM data, but add in the height and name tags. This only makes sense if the source data is really good. Otherwise, you may need to pick through everything by hand.</div>


<div style="font-family:arial,sans-serif;font-size:13px"><br></div></div></div></blockquote><div><br></div><div>It might seem like a tremendous amount of effort to do this, but I'd err on the side of human in the loop rather than automation</div>
<div><br></div><div>I'd figured I would just omit completely anything existing on the first pass. For simple buildings, it's perferrable to keep the OSM version; but for complex buildings that have been traced from bing; this dataset is more accurate. </div>
<div> </div><div>It's easy to seperate the two classes of buildings (imported vs existing) by querying content without a height tag.<br></div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div dir="ltr"><div class="im"><div style="font-family:arial,sans-serif;font-size:13px"></div></div><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">You will want the JOSM validator to be clean on your OSM/OSC files. For example.</div>
<div style="font-family:arial,sans-serif;font-size:13px">

 - Negative building heights. </div></div></div></blockquote><div>Manually checked and removed these. 29 / 125,000.</div><div><br></div><div>Additionally, anything that was 0.0 height was removed; as they majority were shade sales, roofs, or other things suspended above ground but with no height.</div>
<div><br></div><div>Buildings < 0.5 metres might be removed as well.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div dir="ltr"><div class="im"><div style="font-family:arial,sans-serif;font-size:13px"> - The source data has duplicates with itself. </div></div></div></blockquote><div><br></div><div>As mentioned above, most appear to be part of relations. These wouldn't be imported without specific cleanup.  JOSM tells me there are 20/125,000 in total.</div>
<div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">
 - The multipologon's have building=yes on ways and relation. IT should be either on the outer way or the relation, but not on the inner ways.</div></div></div></blockquote><div> </div><div>I'll likely try to omit these until last and remodel by hand.</div>
<div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="im">

<div style="font-family:arial,sans-serif;font-size:13px"> - some round features are a bit overnoded. </div></div></div></blockquote><div>Got specific examples/how you were able to query those? I'll use simplify on them as appropriate. </div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="im"><div style="font-family:arial,sans-serif;font-size:13px">
 - duplicate nodes.</div></div></div></blockquote><div>Fixed.</div><div><br></div><div><br></div></div></div></div>