<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Greetings!</div><div dir="ltr"><br>As I've recently had a bit of time to devote to this import, here is a quick update (links to the mentioned below Mega and Dropbox folders as well as the Google Docs spreadsheet and the code files are on <a href="https://github.com/yyatsyn/MassGIS-address-import" target="_blank" style="color:rgb(0,0,128);text-decoration:underline">https://github.com/yyatsyn/MassGIS-address-import</a>).<div><br></div><div>1. Before importing MassGIS (MAD) addresses we need to make sure they are accurate. For this I used two checks to mark MAD addresses as "suspicious" (see the file "massgis_check_validity.py" on the github for the code):<br clear="all"><div>a) a given MAD address shares a street name with at most 2 other addresses and such a street name is not in the boundaries of a given town. Many points that are marked as suspicious by this criterion are just the points on the unmapped streets. </div><div>b) a given MAD address point is TOO FAR from other address points with the same street name</div><div>The resulting "suspicious" MAD addresses are saved as shp-files in an archive "check_massgis_validity.zip" that is uploaded to both Dropbox and Mega. It would be great if we could go over each town and check those "suspicious" addresses to figure out if they are worth importing or not. I usually do it in QGIS by loading the shp-file with "suspicious" MAD points and OSM as a background layer and then go to other sources like BING street view/town's GIS websites to check each "suspicious" point. For keeping track on progress of this stage I suggested to use the Google Spreadsheet, sheet "<span style="font-family:"Google Sans",Roboto,RobotoDraft,Helvetica,Arial,sans-serif;font-size:14px;letter-spacing:0.4px;white-space:pre">street names mismatches", where I mark all MAD addresses' IDs (they are also in the shp-files)</span></div><div>that are not worth importing + any other irregularities in the MAD data (like street names signs for which differ from their names in MAD). My intuition is that the MAD addresses of BC-type (assigned to building centroids) are pretty accurate, so I would focus on checking and importing them first, while importing PC (plot centroid) and other address points later.<br><br></div><div>2.  After we figure out which MAD points should be excluded from the import we can match BC-points to buildings. I've written a piece of code for that, which would combine several stacked address points into one ";"-separated point and would also check that no duplicates are created by the import. For the code, please, see the file "match_mgis_addr_to_osm_buildings.py" on github. Within next couple of days I'll do my to finish the code for this step (namely, to convert the resulting csv-files with "OSM buildings' full_id -> MAD address" concordances into import-ready osc/osm files). </div><div><span style="background-color:transparent"><br></span></div><div><span style="background-color:transparent">I would appreciate your feedback, especially, suggestions on any
additional approaches for checking the quality of MAD address points.<br></span><br></div><div>With kind regards,</div>-- <br><div dir="ltr" class="gmail-m_8670355766083079440gmail-m_-7127943295631977246gmail_signature">Yury Yatsynovich</div></div></div></div></div></div></div></div>