<div dir="ltr">Greetings!<div><br>I've recently written a simple code (see lines 107-202 in <a href="https://github.com/yyatsyn/MassGIS-address-import/blob/master/import_addresses_work_in_progress.py">https://github.com/yyatsyn/MassGIS-address-import/blob/master/import_addresses_work_in_progress.py</a>) that looks for nearest 7 streets for each address point (or each building with address information) and marks this point/building as problematic if neither of names of the 7 streets match the addr:street tag value for the point/building. <br>I've done this check for points/buildings that are already in OSM as well as those that are in MassGIS database of addresses. <div><br></div><div>The resulting shape files are stored in <a href="https://mega.nz/#F!75M1CAAJ!8r63YpTy3HIACDcAUO4c2g">https://mega.nz/#F!75M1CAAJ!8r63YpTy3HIACDcAUO4c2g</a> (make sure you download all files with the same names to be able to open the corresponding .shp-file): </div><div>-- problem_pnt_addr.shp and problem_bld_addr.shp -- have points/building that are already in OSM</div><div>-- *COUNTY*_problem_mgis.shp -- have points from MassGIS (split by counties).<br><br>Most of problems with MassGIS are from relatively small mismatches in street names (e.g. MassGIS has addresses with "MEDOUIE CREEK ROAD", while in OSM it is just "MEDOUIE CREEK" or "HELLER WAY" vs "HELLERS WAY" or "TENNESSEE AVENUE" vs "TENNESSE AVENUE"). </div><div><br></div><div><div>I guess, I may also add some fuzzy matching mechanism to the code (so that "TENNESSEE AVENUE" and "TENNESSE AVENUE" would be considered the same) in order to separate those MassGIS addresses that are definitely located in the wrong places (those MassGIS points for which addr:street is not even somewhat similar to the names of nearby OSM streets) from points that are next to a street with a mis-spelled name.</div><div></div><br>If there are mismatches in names of streets in OSM and MassGIS, how do we figure out which source is right? <br><br>As far as I know, some OSM apps (<a href="http://MAPS.ME">MAPS.ME</a>, 7 ways) need addr:street and name of the highway to match exactly in order to convert and properly search over the address data. So, before we continue with importing, shall we correct all mismatches in the existing points/buildings with addr:street and misspelled streets?<br><br></div><div>Best,</div><div>-- <br><div class="gmail_signature">Yury Yatsynovich</div>
</div></div></div>