<div dir="ltr"><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">Yuri,</div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">The 435 lines of your "simple code" certainly produced some great information.</div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large"><br></div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large"> I zipped and downloaded <a href="https://photos.app.goo.gl/zYVLBoZCftwaDe9j9">Middlesex, buildings and points</a></div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">It's interesting to me that all the files for each set must be downloaded in order for JOSM to open the shape file. <br></div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large"><br></div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">I opened all 3 shape files and am reviewing the data, stepping through the layers using the carto overlay to orientate myself.</div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large"><br></div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">Bedford is pretty clean and I recognize that the OSM database you used is from a few days ago. I can see errors where I have recently corrected OSM. Simple things like the spelling of a road name.</div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large"><br></div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">Do you have a suggestion how I can flag the data that are not really a problem so we won't have to review it again when another bump is created? </div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large"><br></div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">We're also going to need a way to not step on each others work.</div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large">I'll take care of all the Bedford data.</div><div class="gmail_default" style="font-family:"trebuchet ms",sans-serif;font-size:large"><br></div><div><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div><font face="arial, helvetica, sans-serif" size="4">Alan</font></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr">On Mon, Aug 6, 2018 at 9:29 AM Yury Yatsynovich <<a href="mailto:yury.yatsynovich@gmail.com">yury.yatsynovich@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Greetings!<div><br>I've recently written a simple code (see lines 107-202 in <a href="https://github.com/yyatsyn/MassGIS-address-import/blob/master/import_addresses_work_in_progress.py" target="_blank">https://github.com/yyatsyn/MassGIS-address-import/blob/master/import_addresses_work_in_progress.py</a>) that looks for nearest 7 streets for each address point (or each building with address information) and marks this point/building as problematic if neither of names of the 7 streets match the addr:street tag value for the point/building. <br>I've done this check for points/buildings that are already in OSM as well as those that are in MassGIS database of addresses. <div><br></div><div>The resulting shape files are stored in <a href="https://mega.nz/#F!75M1CAAJ!8r63YpTy3HIACDcAUO4c2g" target="_blank">https://mega.nz/#F!75M1CAAJ!8r63YpTy3HIACDcAUO4c2g</a> (make sure you download all files with the same names to be able to open the corresponding .shp-file): </div><div>-- problem_pnt_addr.shp and problem_bld_addr.shp -- have points/building that are already in OSM</div><div>-- *COUNTY*_problem_mgis.shp -- have points from MassGIS (split by counties).<br><br>Most of problems with MassGIS are from relatively small mismatches in street names (e.g. MassGIS has addresses with "MEDOUIE CREEK ROAD", while in OSM it is just "MEDOUIE CREEK" or "HELLER WAY" vs "HELLERS WAY" or "TENNESSEE AVENUE" vs "TENNESSE AVENUE"). </div><div><br></div><div><div>I guess, I may also add some fuzzy matching mechanism to the code (so that "TENNESSEE AVENUE" and "TENNESSE AVENUE" would be considered the same) in order to separate those MassGIS addresses that are definitely located in the wrong places (those MassGIS points for which addr:street is not even somewhat similar to the names of nearby OSM streets) from points that are next to a street with a mis-spelled name.</div><div></div><br>If there are mismatches in names of streets in OSM and MassGIS, how do we figure out which source is right? <br><br>As far as I know, some OSM apps (<a href="http://MAPS.ME" target="_blank">MAPS.ME</a>, 7 ways) need addr:street and name of the highway to match exactly in order to convert and properly search over the address data. So, before we continue with importing, shall we correct all mismatches in the existing points/buildings with addr:street and misspelled streets?<br><br></div><div>Best,</div><div>-- <br><div class="m_-6218890628217021985gmail_signature">Yury Yatsynovich</div>
</div></div></div>
</blockquote></div>