<html>
  <head>
    <meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <div class="moz-cite-prefix">Ik heb het script nu verder uitgerust
      met een aantal data-integriteits-checks rond postcode / gemeente.
      Daaruit blijken toch nog wat bijzondere dingen waar ik het script
      op moet aanpassen. Zo blijkt dat een straat (zoals geïdentificeerd
      door zijn ID in de adressenlijst) in meerdere postcodes kan
      voorkomen, maar nooit in meerdere gemeenten. Een gemeente bestaat
      uiteraard uit meerdere postcodes. Daarnaast kan 1 postcode zich in
      meerdere gemeenten bevinden. Halleluja; lees deze alinea nog maar
      3 keer opnieuw...<br>
      <br>
      Op dit moment identificeren we op basis van postcode → straat. Dat
      houdt in dat we nu een aantal straten splitsen over de postcode,
      terwijl we op basis van de data die straten zouden kunnen
      samenhouden. Mogelijk (nouja; dat ben ik wel zeker) zijn straten
      ook gesplitst op gemeentegrenzen, maar deze dataset biedt daar
      geen mogelijkheden voor.<br>
      <br>
      Mijn script pikt nu deze over-postcodes-heen-gesplitste-straten
      op; het gaat om 1920 unieke straten die meestal over 2 maar soms
      over 3 postcodes heen gesplitst zijn. Mijn script biedt al heel
      wat mogelijkheden om hier mee om te gaan, maar we moeten het
      natuurlijk wel eens zijn over wat wenselijk is.<br>
      <br>
      Concreet betekent het in feite dat als we onderscheid maken op
      basis van een postcode, we onherroepelijk straten zullen splitsen.
      We kunnen ervoor kiezen om de data per gemeente te ordenen, maar
      dan wordt de hoeveelheid data per gemeente bijna 2 keer zo groot
      als de data nu per postcode (er zijn in totaal 308 gemeenten en
      519 postcodes). Gezien de nu vaak al grote hoeveelheid straten per
      postcode is dit misschien onwenselijk. Zeker omdat het volgens mij
      vaak al de stedelijke gemeenten zijn die meerdere postcodes
      hebben. Die gemeenten gaan dan van zeer grote stratenlijsten naar
      enorme stratenlijsten. Een alternatief is die straten in beide
      postcodegebieden op te nemen. Dat vind ik ook geen nette
      uitwerking omdat je dan redundancy krijgt in de de JSON-bestanden.
      <br>
      <br>
      Volgens mij is dan de beste optie om per straat in de
      postcode-JSON-bestanden een extra JSON-attribuut mee te geven die
      aangeeft of de straat doorloopt in een andere gemeente. Dat zie ik
      in de vorm van een lijst van postcodes per straat waar de straat
      in doorloopt. Dat kan met wat javascript uitgelezen worden. Die
      specifieke straat kan in datzelfde stuk javascript opgehaald
      worden en aan de betrokken straat toegevoegd worden. Als je het
      meer handmatig wil houden kun je vrij eenvoudig een knop toevoegen
      voor de gebruiker om die straat in de andere gemeenten mee in te
      laden. Op deze manier kan de opdeling per postcode gehandhaafd
      worden, maar is toch duidelijk op straat-niveau waar mappers mee
      rekening dienen te houden. Daarnaast is deze informatie mogelijk
      ook zeer belangrijk voor de scripts van Jo rond het koppelen van
      adressen/gebouwen aan een straat. Wat denken jullie hiervan?<br>
      <br>
      Daarnaast speelt dus het tweede punt dat er een aantal postcodes
      over meerdere gemeenten heen lopen. Althans: dat er adrespunten
      zijn met dezelfde postcode die tot een andere gemeente behoren.
      Voor mijn script en onze opzet is dat op zich geen probleem, maar
      ook hier kan ik deze punten specifiek eruit lichten. Het gaat
      overigens 54 van de 519 postcodes; toch zo'n 10%. Daarbij zijn 81
      gemeenten betrokken; een kwart van het totaal aantal gemeenten.
      Het totaal aantal adrespunten draait zo rond de 250 adrespunten in
      totaal. Ik moet mijn script nog wat aanpassen om preciese cijfers
      hierover te hebben. Ruimtelijke samenhang is er niet: het komt
      nergens in aanzienlijk grotere mate voor dan elders. Hoewel soms
      gesteld wordt dat postcodes helemaal niet samenvallen met
      gemeenten, blijkt dat dit dus maar in 1 op de 15.000 gevallen NIET
      zo is. Meestal gaat het over 1 postcode die over twee gemeenten
      valt. In 7 van de 54 gevallen gaat het om een postcode die binnen
      3 gemeenten valt. Nooit gaat het om meer dan 3 gemeenten. <br>
      <br>
      Kort samengevat: op basis van de bij de adrespunten behorende
      gemeente kunnen we straten die door een postcode gesplitst worden
      weer aan elkaar plakken. Mijn idee is om een lijst van postcodes
      aan de straat te koppelen in de JSON, zodat in het javascript die
      gegevens verwerkt kunnen worden. Daarnaast zijn het
      postcodesysteem en de gemeentelijke indeling gescheiden systemen.
      Wordt daar in de verdere verwerking in OSM rekening mee gehouden?
      Onder andere bij de verschillende scripts die matching regelen is
      dat een belangrijk punt. Met mijn script kan ik “afwijkende”
      punten aangeven, maar dan moeten we wel weten op welke manier. Wat
      moeten we hiermee? <br>
      <br>
      Groeten,<br>
      Thomas<br>
      <br>
      Sander Deryckere schreef op 29-10-2014 12:06:<br>
    </div>
    <blockquote
cite="mid:CABUOUO_J8MWNgxLoJYcUW1r-cMd+gmRjv88T=PVt=8sAKrtkkA@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div>
          <div>
            <div>
              <div>Hoi Thomas,<br>
                <br>
              </div>
              Net het script wat verder aangepast voor de nieuwe data,
              en geuploaded naar jouw repo. Dus aan iedereen, gelieve
              vanaf nu vooral <a moz-do-not-send="true"
                href="http://aptum.github.io/import.html">http://aptum.github.io/import.html</a>
              te testen,<br>
              <br>
            </div>
            Kan je de appartementsnummers en busnummers als aparte
            lijsten in de JSON zetten? Dan kan ik ook het script updaten
            om addr:flats te ondersteunen. Lijsten zijn het best
            aangezien ze gemakkelijker omgevormd kunnen worden naar de
            correcte formaat. Ook die best alfabetisch sorteren voor de
            diffs. En misschien enkel de lijsten aan de JSON toevoegen
            indien wel degelijk (dat zal bandbreedte sparen voor de vele
            adressen die geen busnummers of appartementsnummers hebben).<br>
            <br>
          </div>
          Aangezien de overlappende en de niet overlappende nummers nu
          in verschillende kolommen staan, is daar geen verschillende
          CSS voor nodig. Een verschillende CSS voor de herkomst kan wel
          helpen. Momenteel staat die herkomst nog in CRAB:source om de
          waarden gemakkelijk te kunnen aflezen. Dus momenteel die tags
          nog niet gaan uploaden.<br>
          <br>
        </div>
        Als het goed is voor iedereen, dan breng ik die tags naar de
        vorm <br>
        <ul>
          <li>odbl:note=CRAB:<span class="">manueleAanduidingVanGebouw</span></li>
          <li><span class=""></span><span class="">odbl:note=CRAB:<span
                class=""></span></span><span class=""><span class=""><span
                  class="">geinterpoleerdObvNevenliggendeHuisnummersGebouw</span></span></span></li>
          <li><span class="">...<br>
            </span></li>
        </ul>
        <span class="">odbl:note lijkt mij de meest neutrale van alle
          discardable tags, en het voorvoegsel CRAB: kan zorgen voor
          unieke CSS selectors.</span> <br>
        <div><span class=""><br>
          </span></div>
        <div><span class="">De grootste problemen momenteel zijn de
            huisnummers met een underscore. Ik kan moeilijk beslissen
            als ik die naar bis, ter, ... of naar /1, /2, /3, ... breng.
            Maar het overlaten aan de mapper kan er voor zorgen dat de
            huisnummers met een underscore rechtstreeks geuploaded
            worden.<br>
            <br>
          </span></div>
        <div><span class="">Het andere grote probleem is de spelling van
            de straatnaam. Dat is moeilijk om af te leiden met de
            beperkte OSM data die ik heb in de webpagina (vooral als er
            nog geen adressen in OSM zijn). Een spellingsverschil kan er
            voor zorgen dat huisnummers geuploaded worden waarbij
            addr:street verschilt van de straatnaam in OSM. Wat
            natuurlijk voor problemen zal zorgen. Maar hierbij kan Jo
            misschien helpen, of de JOSM validator. <br>
            <br>
            <br>
          </span></div>
        <div><span class="">Als die problemen opgelost zijn, dan lijken
            de tools klaar, en wordt het tijd om enkele definitieve
            beslissingen te maken:<br>
          </span>
          <ul>
            <li><span class="">Huizen tekenen of niet</span></li>
            <li><span class="">Aparte gebruikersnaam of niet</span></li>
            <li><span class="">Welke tags moeten op de changeset</span></li>
            <li><span class="">Hoe contacteren we het AGIV met
                opmerkingen?</span></li>
            <li><span class="">...</span></li>
          </ul>
        </div>
        <div><span class="">Groeten,<br>
            Sander<br>
          </span></div>
        <div><span class=""><br>
          </span></div>
      </div>
    </blockquote>
  </body>
</html>