<div dir="ltr">Thanks a lot for sharing the methodology of the French community.<div>I like this approach</div><div><br></div><div>regards</div><div><br></div><div>m</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Oct 24, 2014 at 9:38 PM, Christian Quest <span dir="ltr"><<a href="mailto:cquest@openstreetmap.fr" target="_blank">cquest@openstreetmap.fr</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><div>Addresses in France...</div><div><br></div><div>We started a project to collect addresses on a separate database called "BANO" (Base d'Adresses Nationale Ouverte : Open National Address Database).</div><div><br></div><div>We've recreated data from the national cadastre (scrapping 1.3 millions PDF files), opendata source and... OSM.</div><div><br></div><div>This database contains 15+ millions addresses so far, and we added almost 4 millions hamlet and locality names recently.</div><div>A full dump contains 19.7 millions locations ranging from housenumber to municipalities (no POI).</div><div><br></div><div>Why we did it that way ?</div><div><br></div><div>Import of millions of address can be done quick and dirty in a couple of days, but such a "blind" import does not really fit the import policy and we also learned from the TIGER import that fixing data is much less fun than creating new data.</div><div><br></div><div>Why import all this if the data is available (under ODbL) ?</div><div><br></div><div>It seems much better to take the required time to import these data street by street, reviewing it to make sure we improve its quality and not just copy it. This will take years, many years (from 5 to 20) depending on how deep to review the data before the upload. Some contributors have started this work, but it is really boring and I don't expect we can attract a large bunch of contributors on that project.</div><div><br></div><div>Anyway, BANO updates its content every night and collects new OSM addresses to replace other sources. So it also take advantage of address reviewing/fixing done in OSM during this import process or during any address related contribution.</div><div><br></div><div>What is much more interesting is that OSM contributors can use BANO to detect missing roads/streets and names (we have a BANO tiled overlay showing missing names like here <a href="http://layers.openstreetmap.fr/?zoom=18&lat=48.8474&lon=3.23191&layers=B0000FFFFFFFFFFFFFFFFFFFFFT" target="_blank">http://layers.openstreetmap.fr/?zoom=18&lat=48.8474&lon=3.23191&layers=B0000FFFFFFFFFFFFFFFFFFFFFT</a>).</div><div>This seems much more useful as we're far from having all roads and streets mapped and named in France.</div><div><br></div><div>We can even see this "BANO effect" on some graphs: <a href="http://osm2020.free.fr/qa-commune/popu-sans-route-name-france.png" target="_blank">http://osm2020.free.fr/qa-commune/popu-sans-route-name-france.png</a></div><div><br></div><div>Yes, something happened last may... BANO started to be available at that time and the population for which no nearby named road was present as decreased almost twice faster since then.</div><div><br></div><div>You can see also the missing names graph here: <a href="http://munin.openstreetmap.fr/osm12.free.org/osm104.openstreetmap.fr/bano_rapproche.html" target="_blank">http://munin.openstreetmap.fr/osm12.free.org/osm104.openstreetmap.fr/bano_rapproche.html</a></div><div>More than 100.000 names have been added since may.</div><div><br></div><div><br></div><div>To summarize... yes, address are really an important dataset, mainly because it allows to cross the boundary between non geographic data (postal addresses) and geographic data with the help of (good) geocoding algorithm.</div><div>This allows to bring a lot of new data users to OSM by providing the data fuel for services like routing from address A to address B. Some public services web sites have started using OSM + BANO that way.</div><div>This also allows to geocode new (open) datasets to improve OSM with more interesting data (we're about to do this for almost 30000 pharmacy).</div><div><br></div><div>Is it mandatory to have the huge address datasets in OSM ?</div><div>Maybe not, and not if the import process does not bring any improvement to the data.</div><div>Mappers' time seems to me much better used for less mechanical contributions.</div><span class="HOEnZb"><font color="#888888"><div><br></div>-- <br><div dir="ltr">Christian Quest - OpenStreetMap France</div>
</font></span></div></div>
<br>_______________________________________________<br>
talk mailing list<br>
<a href="mailto:talk@openstreetmap.org">talk@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk" target="_blank">https://lists.openstreetmap.org/listinfo/talk</a><br>
<br></blockquote></div><br></div>