<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <p>Hej igen!</p>
    <p>Jag tog en tit på v14 både dropped och tx_22.osm som är för
      Västernorrland.</p>
    <p>Jag tyckte det såg väldigt bra ut! Jag är imponerad av att du
      lyckats så bra med att sortera bort dupletter. Av alla 50-tals jag
      kollade manuellt hittade jag bara 1 duplett som jag manuellt
      skulle fixa till. (Gådeå i importen, Gådeå by i osm, troligtvis är
      Gådeå rätt)</p>
    <p>För min del är vi redo för nästa steg, import listan och sedan
      import. <br>
    </p>
    <p>När det är så bra som jag sett här, då kan vi för min del skippa
      både WMS och MapWithAI och bara importera varje fil i JOSM
      manuellt.</p>
    <p>När vi är klara med denna import skulle jag gärna se en import av
      vattendrag från Fjällkartan<br>
    </p>
    <p>Mvh</p>
    <p>pangoSE<br>
    </p>
    <div class="moz-cite-prefix">On 2020-01-22 01:34, Grigory Rechistov
      via Talk-se wrote:<br>
    </div>
    <blockquote type="cite"
      cite="mid:1579653275.94669849@f482.i.mail.ru">
      <meta http-equiv="content-type" content="text/html; charset=UTF-8">
      <div>
        <div>
          <div>Hej Ture, Andreas, Anders, pangoSE och andra,</div>
          <div>Längst ner följer mina kommentarer till dina svar.</div>
          <div> </div>
          <div>> Jag har för mig att LMV publicerade textlagren i två
            uppsättningar: en<br>
            ”kart”-uppsättning med snygga avstavningar, radbrytningar
            och så, och en<br>
            ”GIS”-uppsättning där namnen sitter ihop. Vilket av dem är
            det du tittar på?</div>
          <div> </div>
          <div>Jag använder den "GIS"-uppsättningen, men, som du lagt
            märke till...</div>
          <div> </div>
          <div>> Sedan misstänker jag att även ”GIS”-uppsättningen
            lider lite av att vara<br>
            > ”en karta i shapefile-format”, snarare än en geodatabas
            — namnen är placerade<br>
            > där det blir snyggt på en 50k-karta</div>
          <div> </div>
          <div>...det har jag också märkt. Därför finns olika
            förkortningar och radbrytningar<br>
            i källfiler vilka jag har kunnat åtgärda. Jag har i planer
            att kontakta<br>
            Lantmäteriet med en lista på ortnamns korrigeringar som jag
            samlat. Kanske blir<br>
            någon intresserad i att uppdatera deras kartinformation för
            framtiden.</div>
          <div> </div>
          <div>> För herrgårdar kanske man kan passa på att lägga
            till historic=manor samtidigt.<br>
            Jag har också tänkt på detta, men vågade inte räkna varje
            herrgård som en plats<br>
            av historiskt värde.<br>
            Då kanske missförstår jag "historic=manor":s betydelse. Den
            taggen används<br>
            förresten inte mycket i Sverige, enligt detta:
            <a class="moz-txt-link-freetext" href="http://overpass-turbo.eu/s/PY3">http://overpass-turbo.eu/s/PY3</a> .<br>
            Endast 77 träffar.</div>
          <div> </div>
          <div>> Vi har ju även en hel del ställen som har ett namn,
            men där det är ödehus<br>
            > eller sommarstugor eller fäbodar. Dessa borde även de
            klassas som locality.<br>
            Det är precis den ursprungliga meningen bakom
            "place=locality". Att importen<br>
            använder den taggen för herrgårdarna var en kompromiss som
            jag tillät eftersom<br>
            jag inte kunde hitta ett bättre alternativ för något mindre
            än "isolated_dwelling".<br>
            Då ansåg jag att "historic=manor" vore för specifikt. Men
            att bara kasta iväg<br>
            noderna ville jag inte heller.<br>
            Låt mig tänka på det lite mer, hur det bästa lösningen
            skulle se ut. Kanske skulle<br>
            jag omtagga dem till "isolated_dwelling", kanske till
            "manor", kanske kasta bort.</div>
          <div><br>
            > Stadsdelar bör väl inte vara hamlet, utan
            neighbourhood?<br>
            Nej, "neighbourhood" är visst bättre för dem. För varje
            kartruta som ligger nära<br>
            en större stad ska en uppladdare se till att "hamlet" blir
            till "neighbourhood".<br>
            Det skulle vara uppenbart att upptäcka visuellt och fixa
            manuellt.</div>
          <div>Det skulle inte finnas många sådana rutor som täcker
            stora städer. Stora städer<br>
            brukar dessutom vara mer färdigt kartlagda vilket betyder
            mindre nya noder att<br>
            importera runtom dem.</div>
          <div>Jag kunde kanske ha löst problemet genom att tagga de
            noder som finns inom städers<br>
            gränser på ett annat etikettsschema... Men det skulle ha
            varit för<br>
            beräkningsintensivt, och jag är inte redo att skriva en
            sådan algoritm (ännu).</div>
          <div> </div>
          <div>> även om jag själv hade föredragit en adress-import.<br>
            Det skulle jag ha också föredragit, om jag hade tillgång
            till en öppen databas<br>
            för ortnamn/adresser.</div>
          <div> </div>
          <div>> Gissar att merparten av de nya namnen inte längre
            används i vardagen.<br>
            Här kan vi endast tro på Lantmäteriets kompetens att hålla
            sina kartor aktuella.<br>
            Men det gäller även själva OSM-projektet. Man litar nämligen
            på att andra OSM:s<br>
            bidragsgivare har ritat något som stämmer i verkligheten. En
            gång hade jag cyklat<br>
            till en skogsväg som visade sig vara ett dike på marken
            ¯\_(ツ)_/¯</div>
          <div>Det är kanske också en ständig fråga för OSM: när blir
            historiska data<br>
            irrelevanta och bör suddas ur OSM-databasen? Jag är till
            exempel lätt irriterad<br>
            att man tillåter ha "abandoned=railway" (drygt 256 tusen
            sträckor enligt Taginfo!)</div>
          <div> </div>
          <div>> Vissa platser ser mer ut som "locality" medan några
            namn har helt klart<br>
            > felaktigt blivit "hamlet" fast det bara är en gård, om
            ens det.</div>
          <div>Det finns sådan risk som jag skrivit i importplanen. Jag
            bedömer att ett sådant<br>
            fel, om tillåtet vid importen, är av mindre vikt. Man kan
            väl strida om "rätta"<br>
            etiketter till världens slut. Att det finns en plats med ett
            namn skulle dock hjälpa<br>
            att upptäcka platsen och sedan att bedöma dess storlek och
            sedan rätta till<br>
            "place=hamlet" till "locality" eller tvärtom.</div>
          <div><br>
            > Är det i såna fall möjligt att genereras nya filer
            efterhand, så man ser vad<br>
            > som blir till övers på slutet?</div>
          <div>Att generera ny filer efter jag korrigerat skript/input
            tar liksom 20 minuter<br>
            eller ännu mindre. Det är bara cirka 100 000 noder i hela
            landet vi talar om.<br>
            Den nuvarande uppdelningen beror på Lantmäteriets eget
            schema. Men jag kan enkelt<br>
            skära de nuvarande "regionerna" i bitar som täcker enstaka
            kommuner eller till<br>
            någon annan nivås administrativa gränser som nu finns.</div>
          <div> </div>
          <div>> Jag rekommenderar att du sätter dig in i
            hemmansbegreppet och de olika<br>
            > skiftesreformer som gjorts i Sverige.<br>
            Tack, det ska jag göra. Angående de dubbletter som troligen
            skapas vid<br>
            kartbladens kanter, kan de åtgärdas genom att märkas som
            tveksamma eller<br>
            till och med raderas bort för säkerhets skull. Någonting var
            inte kartlagt<br>
            förut, och det blir inte tillagd efter, right?</div>
          <div> </div>
          <div>> Nej, så ska vi inte tagga. Ett objekt ska taggas en
            gång. Detta är en<br>
            grundläggande osm-regel</div>
          <div>Ja, det är rimligt att importer följer denna regel. Då
            modifierar jag skriptet att<br>
            vara mer aggressivt med att radera de nya noder som står i
            konflikt med gamla lika<br>
            nämnda sträckor. Skriptet behöver även ta hänsyn till fler
            befintliga etiketter<br>
            både på sträckor och noder så att det undvikas så många
            dubbletter som<br>
            möjligt.</div>
          <div><br>
            > Några fler exempel som är fel är Skanörsgården,
            Falsterbo vång och<br>
            > Falsterbohus. Den förstnämnda är namnet på ett
            bostadsområde, den andra är<br>
            > knappt i allmänt bruk och den tredje syftar på ett känt
            före detta<br>
            > badhotell: ...<br>
            > Jag har tittat i Malmö, Lund, Landskrona och
            Helsingborg. Samtliga<br>
            > stadsdelar där är felaktigt angivna, och dessutom redan
            taggade på annat sätt.</div>
          <div> </div>
          <div>Framförallt är jag imponerad hur väl landets södra delar
            är kartlagda. Det vore<br>
            kul om de norra delarna blir lika bra en dag.</div>
          <div> </div>
          <div>> Tittar jag i din exempelfil ser jag att Ropsten är
            inlagd som isolated<br>
            > dwelling, vilket naturligtvis är fel (det är snarare
            ett industriområde).<br>
            > Jag är inte tillräckligt bekant med Stockholm för att
            kommentera större<br>
            > delen av exemplen där, men samtliga ligger i tätbebyggt
            område och där<br>
            > använder vi inte place=hamlet över huvud taget.<br>
            > ...<br>
            > Ärtholmen (koloniområde), Söderkulla, Jägersro<br>
            > villastad, Stenkällan, Virentofta, Hohög, Kungshälla
            (namn som fallit ur<br>
            > bruk), Riseberga, Bulltofta, Valdemarsro, Segevång och
            "Västra Hamnområden"<br>
            > (inte en etablerad term). Jag tror de flesta kan se
            bara på namnen att<br>
            > dessa inte är lämpliga att tagga som hamlet.</div>
          <div>Tack för din utförliga feedback!</div>
          <div>> Vad som är officiellt namn är mindre viktigt för vad
            som är taggat på OSM.</div>
          <div> </div>
          <div>Nu undrar jag hur stor andel platser är där officiella
            och allmänna namn inte<br>
            stämmer med varandra.</div>
          <div> </div>
          <div>> och inte sällan har platsnamn helt tolkats fel av
            lantmäterianställda som<br>
            > inte förstått lokala dialekter.<br>
            När någon felstavar mitt namn (och det händer ofta) kan jag
            ändå oftast begripa<br>
            att det verkligen handlar om mig. Det gör inget, för man kan
            rätta det till senare.<br>
            Om någon inte känner till mitt namn blir det svårare att
            urskilja mig från alla<br>
            andra personer vilkas namn är okända.</div>
          <div> </div>
          <div>> Då officiellt namn skiljer sig från det populärt
            använda namnet kan man<br>
            > använda sig av sidotaggen official_name</div>
          <div>Och det finns också alt_name, name:sv, name:sju och
            dylika etiketter för att<br>
            förvara så många namn. Mitt skript använder även dem för att
            hitta dubbletter.<br>
            Visst kan det hända att Lantmäteriets data innehåller ett
            namn som är såpass<br>
            dåligt stavat att dess närvaro på kartan är uppenbart
            skadligt, men tror man att<br>
            det kan bli såpass farligt?</div>
          <div> </div>
          <div>> Vi bör inte importera data om vi inte kan vara säkra
            på att den är bra.</div>
          <div>Nej, vi bör inte importera några noder *blint*. Därför
            poängterar importplanen<br>
            på manuella granskningens stor roll. Därför delas
            importfilerna i små rutor med<br>
            200-400 noder (kan enkelt bli till ännu färre). En person
            skulle kunna göra<br>
            översikt på en ruta i taget, utan att det blir för
            påfrestande. För varje ruta<br>
            beslutar uppladdaren om några redigeringar/rensningar
            behövs, eller att till och<br>
            med hela rutan är värdelös.</div>
          <div> </div>
          <div>> Att data är inhämtad av myndigheter är ingen garant
            för att den är bra.<br>
            Inget är något garanti att det nuvarande OSM-innehållet är
            aktuellt heller. Vi<br>
            bara tror på andra användares vett och välvilja.<br>
            Vad man kan dock garantera att den "vita rymden" på
            OSM-kartan aldrig stämmer<br>
            mot verkligheten.</div>
          <div> </div>
          <div>> Nej, införda fel kan aldrig rättfärdigas av att det
            redan finns fel i databasen</div>
          <div> </div>
          <div>Jag anser två typer fel. Att en nod har ett fel namn
            eller position är fel sort 1.<br>
            Om en nod motsvarande till en fysisk plats inte finns är fel
            sort 2. När man<br>
            importerar (blint, utan redigeringar för enkelheten) data
            händer följande:<br>
            A. Gamla fel sort 1 stannar kvar<br>
            B. Gamla fel sort 2 tas bort<br>
            C. Nya fel sort 1 läggs till<br>
            D. Nya fel sort 2 läggs till</div>
          <div>Hela balansen beror på att man tror att antal B-händelser
            är mycket större än<br>
            C-händelser, och att D är litet.<br>
            Om man dessutom granskar och redigerar rutor innan
            uppladdningen kan man även<br>
            minska A och C. Att minska D är det svåraste för att det
            kräver 100% aktuell<br>
            kännedom på verkligheten.</div>
          <div> </div>
          <div>> att den totala andelen fel kanske minskar något för
            att den mängd data som<br>
            > importeras är extremt omfattande.</div>
          <div>Min beräkning var jätteenkelt och hade en variabel vilken
            var 1%<br>
            andel fel dolda i nya data. Även om andelen höjs till 20%
            förblir det<br>
            resulterande förhållandet bättre än utan importen. Man måste
            dock tycka att<br>
            felen sort 1 och sort 2 har samma vikt, det vill säga att de
            är lika dåliga att ha.</div>
          <div> </div>
          <div>> så undrar jag om vi inte ska byta strategi och i
            stället sätta upp en server<br>
            som via MapWithAI serverar datan per område för manuel
            bearbetning?</div>
          <div>Man kan alltid pröva! Det låter lovande för mig, fast jag
            inte har använt detta<br>
            hittills. Jag undrar om dess RapiD-redigerare kan tolka
            noder, eller att fokusen<br>
            ligger endast på gator/vägar. Hursomhelst, de importfiler
            som jag publicerar är<br>
            öppna för alla att använda som kartunderlag eller på vilket
            sätt.</div>
          <div>Jag vill dock fortfarande fokusera mig på att förbättra
            taggvalet och<br>
            namnjämförelseprocessen. Syftet är fortfarande att hjälpa
            förenkla manuellt<br>
            arbete för varje ruta.</div>
          <div> </div>
          <div>Tack!</div>
        </div>
        <div> </div>
        <div data-signature-widget="container">
          <div data-signature-widget="content">
            <div>Med vänliga hälsningar,<br>
              Grigory Rechistov<br>
              With best regards,<br>
              Grigory Rechistov</div>
          </div>
        </div>
        <div> </div>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <pre class="moz-quote-pre" wrap="">_______________________________________________
Talk-se mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Talk-se@openstreetmap.org">Talk-se@openstreetmap.org</a>
<a class="moz-txt-link-freetext" href="https://lists.openstreetmap.org/listinfo/talk-se">https://lists.openstreetmap.org/listinfo/talk-se</a>
</pre>
    </blockquote>
  </body>
</html>