<div dir="ltr"><div>Hi,</div><div><br></div><div>In Groton and Littleton, MAD ended up being correct most of the time. Remember, 99.9% of our road names were imported from MassGIS. Most conflicts that we are now noticing is basically corrections that MassGIS has made over the past 11 years to their own data. Of the two towns I did this weekend, the address data is certainly not perfect, but it is in much better shape them OSM currently is. <br></div><div><br></div><div>9,000 conflicts on the road names is a lot! Clearly, we can't import addresses conflict with the OSM.  <br></div><div><br></div><div>I will sign up for setting up the MapRoulette using the fuzzy search. I have time this weekend.<br></div><div><br></div><div>Yury, no rush, but could you create a second data set (keep the fuzzy search data set available), and do a straight case-insensitive match. I would like to pick through Groton and Acton again and see what percentage are issues in OSM again... <br></div><div><br></div><div>Jason<br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr">On Wed, Aug 15, 2018 at 2:10 PM Yury Yatsynovich <<a href="mailto:yury.yatsynovich@gmail.com">yury.yatsynovich@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Greetings!<br>There is definitely no presumption that in any conflict between MAD and OSM MAD is correct.<br>I've gone through problem address points (from fuzzy matches) in several towns in Berkshire and my impression is that MAD is correct in 80-90% of cases when OSM has some road names (I was looking at GIS maps by local authorities, and Mapillary images for road signs -- that's why it also takes me around 1 hour per town).<br>Another observation -- MAD points with housenumber=0 have much higher probabilities of being at a wrong location than others.<br><br>Here is the spreadsheet with streets that are in the unmatched MAD points (after the fuzzy match), but not in the boundaries of corresponding towns (9K in total, median -- 15 streets per town): <a href="https://mega.nz/#!TxlABapS!4MNK5R4UQEkeLjj1pNISufQMNgGs2Vl1YvLGFU4RU3A" target="_blank">https://mega.nz/#!TxlABapS!4MNK5R4UQEkeLjj1pNISufQMNgGs2Vl1YvLGFU4RU3A</a><br><br>As I posted earlier, the link to the files after the exact match (split by towns): <a href="https://mega.nz/#F!ToFnGI6C!jcjnjc3753w4DcfaSLLAJg" target="_blank">https://mega.nz/#F!ToFnGI6C!jcjnjc3753w4DcfaSLLAJg</a><br>Ideally, we would want to address all discrepancies (including those like "Street" vs "Lane", "Muller's" vs "Mullers", "Hilltop" vs "Hill Top"), yet, the amount of them is even larger than of those after the fuzzy match. So, I would suggest posting on MapRoulette first the list of 9K streets from the fuzzy match and, once those are done (manually, with checking multiple sources on street names), we can address the discrepancies from the exact match.  <br><br>Talking about the stacked points, I would import them (those that pass our regular checks), converting into 1 point and combining the same fields as addr:housenumber=1;3;5 etc. The share of addresses assigned to stacked points in MAD is substantial: most multi-unit buildings have address points at their centroids rather than at entrances.<div class="m_7489029612767988660gmail-yj6qo m_7489029612767988660gmail-ajU" style="margin:2px 0px 0px"></div><div><br></div>-- <br><div dir="ltr" class="m_7489029612767988660gmail_signature">Yury Yatsynovich</div></div>
_______________________________________________<br>
Talk-us-massachusetts mailing list<br>
<a href="mailto:Talk-us-massachusetts@openstreetmap.org" target="_blank">Talk-us-massachusetts@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-us-massachusetts" rel="noreferrer" target="_blank">https://lists.openstreetmap.org/listinfo/talk-us-massachusetts</a><br>
</blockquote></div>