<div>Interesting data.<br></div><div><br></div><div>I've discovered an import process that works using QGIS, JOSM, OpenData plugin and Conflation plugin. I'll go into more detail in a little bit, but in involves using QGIS to modify the all capitals in the shapefile to partially lowercase (yes, this breaks things like McCabe Street, but I think that's acceptable. Community feedback, please?), and JOSM's Conflation plugin to assign the points to the closest building.<br></div><div><br></div><div>There's a lot of little hiccups I'm discovering along the way, like how JOSM won't download town sized maps from the server, and you can't upload changesets greater than 10,000 edits. I'm not sure how to get around those hurdles at the moment.</div><div><br></div><div>Another facet -- should one person do the data conversion, and others upload the changesets? (that's fine with me, but it's going to take me some time going through 350 towns of data if I do this)<br></div><div><br></div><div>‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐<br></div><div> On July 17, 2018 12:57 PM, Yury Yatsynovich <yury.yatsynovich@gmail.com> wrote:<br></div><div> <br></div><blockquote class="protonmail_quote" type="cite"><div dir="ltr"><div>Thanks for creating the wiki page, Angela!<br></div><div><div><br></div><div>I did some simple spatial joins of MassGIS address points with existing buildings without addresses (either house number or street name missing) using python (geopandas and osmnx). Here are some stats from such joins by counties:<br></div></div><div><br></div><div><div>County    OSM buildings w/o addresses    MassGIS points    Matched points    1-to-1 matches    Share of matched points    Share of 1-to-1 matches<br></div><div>Barnstable    188370    192619    157235    121330    0.82    0.77<br></div><div>Berkshire    89520    79138    62324    39290    0.79    0.63<br></div><div>Bristol    233590    284883    247625    112776    0.87    0.46<br></div><div>Dukes    23647    20330    13639    11236    0.67    0.82<br></div><div>Essex    268122    379036    328679    147073    0.87    0.45<br></div><div>Franklin    50091    40853    31336    18146    0.77    0.58<br></div><div>Hampden    206111    225352    198221    100958    0.88    0.51<br></div><div>Hampshire    78709    73675    60417    34122    0.82    0.56<br></div><div>Middlesex    429556    779421    594647    219696    0.76    0.37<br></div><div>Nantucket    14048    12963    8408    6445    0.65    0.77<br></div><div>Norfolk    361719    337260    302017    147594    0.90    0.49<br></div><div>Plymouth    233374    244200    207421    134116    0.85    0.65<br></div><div>Suffolk    118763    457611    426855    36796    0.93    0.09<br></div><div>Worcester    383670    407001    347611    173147    0.85    0.50<br></div><div>TOTAL    2679290    3534342    2986435    1302725    0.84    0.44<br></div></div><div><br></div><div>Most of the address points (84%) lie within boundaries of buildings w/o addresses, almost half of which (44%) are unique address point within the corresponding buildings.<br></div><div><br></div><div>For those 1-to-1 matches the address info can be added directly to the buildings. For the many-to-1 matches (several addresses within one building) the options are either creating separate address points within a building or combining addresses of all such points and adding it to the building (e.g. addr:housenumber = 11,13,15 as suggested in <a href="https://wiki.openstreetmap.org/wiki/Addresses#Buildings_with_multiple_house_numbers">https://wiki.openstreetmap.org/wiki/Addresses#Buildings_with_multiple_house_numbers</a>). It seems that  the second approach has been used for the existing addresses in Malden and Boston. If points in the many-to-1 matches have different street names then adding separate address points seems to me the only solution. <br></div><div><br></div><div>Having visualized the data in QGIS I've noticed couple of issues:<br></div><div>1) some points lie outside, yet, very close to a building so that it is unambiguous to which building they belong. Maybe creating a small buffer (5-10m) around such points and merging them with unique buildings that these buffers intersect can help match them.<br></div><div><br></div><div>2) some points, as it was mentioned in previous messages, are assigned to parcels. E.g. there are many cases when a group of buildings (a house and, say, barns)  have an address point next to them. It could be possible to identify a house among those building manually and add the address only to it, yet, as there might be several thousands of such cases, it can be very time consuming. So, for parcels I would suggest simply adding an address point in the middle of a parcel (as it is placed in MassGIS) without identifying the exact building to which the address belongs.<br></div><div><br></div><div><div>-- <br></div><div class="gmail-m_3601745856523827591gmail_signature" dir="ltr">Yury Yatsynovich<br></div></div></div></blockquote><div><br></div>