<html><head></head><body>Hej igen 😃<br>Tusen tack för dina utförliga svar.<br>Jag är nu mera positivt inställd till importen. Jag ska titta närmare på en fil och återkommer. <br>Jag tror det går bra att vi med lokalkännedom laddar upp för ett område vi känner. Frågan är hur vi skal göra för dem delar av landet (i norr) där ingen av oss har lokalkännedom? <br><br><div class="gmail_quote">On January 22, 2020 1:34:35 AM GMT+01:00, Grigory Rechistov via Talk-se <talk-se@openstreetmap.org> wrote:<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">

<div>

<div>

<div>Hej Ture, Andreas, Anders, pangoSE och andra,</div>


<div>Längst ner följer mina kommentarer till dina svar.</div>


<div> </div>


<div>> Jag har för mig att LMV publicerade textlagren i två uppsättningar: en<br>

”kart”-uppsättning med snygga avstavningar, radbrytningar och så, och en<br>

”GIS”-uppsättning där namnen sitter ihop. Vilket av dem är det du tittar på?</div>


<div> </div>


<div>Jag använder den "GIS"-uppsättningen, men, som du lagt märke till...</div>


<div> </div>


<div>> Sedan misstänker jag att även ”GIS”-uppsättningen lider lite av att vara<br>

> ”en karta i shapefile-format”, snarare än en geodatabas — namnen är placerade<br>

> där det blir snyggt på en 50k-karta</div>


<div> </div>


<div>...det har jag också märkt. Därför finns olika förkortningar och radbrytningar<br>

i källfiler vilka jag har kunnat åtgärda. Jag har i planer att kontakta<br>

Lantmäteriet med en lista på ortnamns korrigeringar som jag samlat. Kanske blir<br>

någon intresserad i att uppdatera deras kartinformation för framtiden.</div>


<div> </div>


<div>> För herrgårdar kanske man kan passa på att lägga till historic=manor samtidigt.<br>

Jag har också tänkt på detta, men vågade inte räkna varje herrgård som en plats<br>

av historiskt värde.<br>

Då kanske missförstår jag "historic=manor":s betydelse. Den taggen används<br>

förresten inte mycket i Sverige, enligt detta: http://overpass-turbo.eu/s/PY3 .<br>

Endast 77 träffar.</div>


<div> </div>


<div>> Vi har ju även en hel del ställen som har ett namn, men där det är ödehus<br>

> eller sommarstugor eller fäbodar. Dessa borde även de klassas som locality.<br>

Det är precis den ursprungliga meningen bakom "place=locality". Att importen<br>

använder den taggen för herrgårdarna var en kompromiss som jag tillät eftersom<br>

jag inte kunde hitta ett bättre alternativ för något mindre än "isolated_dwelling".<br>

Då ansåg jag att "historic=manor" vore för specifikt. Men att bara kasta iväg<br>

noderna ville jag inte heller.<br>

Låt mig tänka på det lite mer, hur det bästa lösningen skulle se ut. Kanske skulle<br>

jag omtagga dem till "isolated_dwelling", kanske till "manor", kanske kasta bort.</div>


<div><br>

> Stadsdelar bör väl inte vara hamlet, utan neighbourhood?<br>

Nej, "neighbourhood" är visst bättre för dem. För varje kartruta som ligger nära<br>

en större stad ska en uppladdare se till att "hamlet" blir till "neighbourhood".<br>

Det skulle vara uppenbart att upptäcka visuellt och fixa manuellt.</div>


<div>Det skulle inte finnas många sådana rutor som täcker stora städer. Stora städer<br>

brukar dessutom vara mer färdigt kartlagda vilket betyder mindre nya noder att<br>

importera runtom dem.</div>


<div>Jag kunde kanske ha löst problemet genom att tagga de noder som finns inom städers<br>

gränser på ett annat etikettsschema... Men det skulle ha varit för<br>

beräkningsintensivt, och jag är inte redo att skriva en sådan algoritm (ännu).</div>


<div> </div>


<div>> även om jag själv hade föredragit en adress-import.<br>

Det skulle jag ha också föredragit, om jag hade tillgång till en öppen databas<br>

för ortnamn/adresser.</div>


<div> </div>


<div>> Gissar att merparten av de nya namnen inte längre används i vardagen.<br>

Här kan vi endast tro på Lantmäteriets kompetens att hålla sina kartor aktuella.<br>

Men det gäller även själva OSM-projektet. Man litar nämligen på att andra OSM:s<br>

bidragsgivare har ritat något som stämmer i verkligheten. En gång hade jag cyklat<br>

till en skogsväg som visade sig vara ett dike på marken ¯\_(ツ)_/¯</div>


<div>Det är kanske också en ständig fråga för OSM: när blir historiska data<br>

irrelevanta och bör suddas ur OSM-databasen? Jag är till exempel lätt irriterad<br>

att man tillåter ha "abandoned=railway" (drygt 256 tusen sträckor enligt Taginfo!)</div>


<div> </div>


<div>> Vissa platser ser mer ut som "locality" medan några namn har helt klart<br>

> felaktigt blivit "hamlet" fast det bara är en gård, om ens det.</div>


<div>Det finns sådan risk som jag skrivit i importplanen. Jag bedömer att ett sådant<br>

fel, om tillåtet vid importen, är av mindre vikt. Man kan väl strida om "rätta"<br>

etiketter till världens slut. Att det finns en plats med ett namn skulle dock hjälpa<br>

att upptäcka platsen och sedan att bedöma dess storlek och sedan rätta till<br>

"place=hamlet" till "locality" eller tvärtom.</div>


<div><br>

> Är det i såna fall möjligt att genereras nya filer efterhand, så man ser vad<br>

> som blir till övers på slutet?</div>


<div>Att generera ny filer efter jag korrigerat skript/input tar liksom 20 minuter<br>

eller ännu mindre. Det är bara cirka 100 000 noder i hela landet vi talar om.<br>

Den nuvarande uppdelningen beror på Lantmäteriets eget schema. Men jag kan enkelt<br>

skära de nuvarande "regionerna" i bitar som täcker enstaka kommuner eller till<br>

någon annan nivås administrativa gränser som nu finns.</div>


<div> </div>


<div>> Jag rekommenderar att du sätter dig in i hemmansbegreppet och de olika<br>

> skiftesreformer som gjorts i Sverige.<br>

Tack, det ska jag göra. Angående de dubbletter som troligen skapas vid<br>

kartbladens kanter, kan de åtgärdas genom att märkas som tveksamma eller<br>

till och med raderas bort för säkerhets skull. Någonting var inte kartlagt<br>

förut, och det blir inte tillagd efter, right?</div>


<div> </div>


<div>> Nej, så ska vi inte tagga. Ett objekt ska taggas en gång. Detta är en<br>

grundläggande osm-regel</div>


<div>Ja, det är rimligt att importer följer denna regel. Då modifierar jag skriptet att<br>

vara mer aggressivt med att radera de nya noder som står i konflikt med gamla lika<br>

nämnda sträckor. Skriptet behöver även ta hänsyn till fler befintliga etiketter<br>

både på sträckor och noder så att det undvikas så många dubbletter som<br>

möjligt.</div>


<div><br>

> Några fler exempel som är fel är Skanörsgården, Falsterbo vång och<br>

> Falsterbohus. Den förstnämnda är namnet på ett bostadsområde, den andra är<br>

> knappt i allmänt bruk och den tredje syftar på ett känt före detta<br>

> badhotell: ...<br>

> Jag har tittat i Malmö, Lund, Landskrona och Helsingborg. Samtliga<br>

> stadsdelar där är felaktigt angivna, och dessutom redan taggade på annat sätt.</div>


<div> </div>


<div>Framförallt är jag imponerad hur väl landets södra delar är kartlagda. Det vore<br>

kul om de norra delarna blir lika bra en dag.</div>


<div> </div>


<div>> Tittar jag i din exempelfil ser jag att Ropsten är inlagd som isolated<br>

> dwelling, vilket naturligtvis är fel (det är snarare ett industriområde).<br>

> Jag är inte tillräckligt bekant med Stockholm för att kommentera större<br>

> delen av exemplen där, men samtliga ligger i tätbebyggt område och där<br>

> använder vi inte place=hamlet över huvud taget.<br>

> ...<br>

> Ärtholmen (koloniområde), Söderkulla, Jägersro<br>

> villastad, Stenkällan, Virentofta, Hohög, Kungshälla (namn som fallit ur<br>

> bruk), Riseberga, Bulltofta, Valdemarsro, Segevång och "Västra Hamnområden"<br>

> (inte en etablerad term). Jag tror de flesta kan se bara på namnen att<br>

> dessa inte är lämpliga att tagga som hamlet.</div>


<div>Tack för din utförliga feedback!</div>


<div>> Vad som är officiellt namn är mindre viktigt för vad som är taggat på OSM.</div>


<div> </div>


<div>Nu undrar jag hur stor andel platser är där officiella och allmänna namn inte<br>

stämmer med varandra.</div>


<div> </div>


<div>> och inte sällan har platsnamn helt tolkats fel av lantmäterianställda som<br>

> inte förstått lokala dialekter.<br>

När någon felstavar mitt namn (och det händer ofta) kan jag ändå oftast begripa<br>

att det verkligen handlar om mig. Det gör inget, för man kan rätta det till senare.<br>

Om någon inte känner till mitt namn blir det svårare att urskilja mig från alla<br>

andra personer vilkas namn är okända.</div>


<div> </div>


<div>> Då officiellt namn skiljer sig från det populärt använda namnet kan man<br>

> använda sig av sidotaggen official_name</div>


<div>Och det finns också alt_name, name:sv, name:sju och dylika etiketter för att<br>

förvara så många namn. Mitt skript använder även dem för att hitta dubbletter.<br>

Visst kan det hända att Lantmäteriets data innehåller ett namn som är såpass<br>

dåligt stavat att dess närvaro på kartan är uppenbart skadligt, men tror man att<br>

det kan bli såpass farligt?</div>


<div> </div>


<div>> Vi bör inte importera data om vi inte kan vara säkra på att den är bra.</div>


<div>Nej, vi bör inte importera några noder *blint*. Därför poängterar importplanen<br>

på manuella granskningens stor roll. Därför delas importfilerna i små rutor med<br>

200-400 noder (kan enkelt bli till ännu färre). En person skulle kunna göra<br>

översikt på en ruta i taget, utan att det blir för påfrestande. För varje ruta<br>

beslutar uppladdaren om några redigeringar/rensningar behövs, eller att till och<br>

med hela rutan är värdelös.</div>


<div> </div>


<div>> Att data är inhämtad av myndigheter är ingen garant för att den är bra.<br>

Inget är något garanti att det nuvarande OSM-innehållet är aktuellt heller. Vi<br>

bara tror på andra användares vett och välvilja.<br>

Vad man kan dock garantera att den "vita rymden" på OSM-kartan aldrig stämmer<br>

mot verkligheten.</div>


<div> </div>


<div>> Nej, införda fel kan aldrig rättfärdigas av att det redan finns fel i databasen</div>


<div> </div>


<div>Jag anser två typer fel. Att en nod har ett fel namn eller position är fel sort 1.<br>

Om en nod motsvarande till en fysisk plats inte finns är fel sort 2. När man<br>

importerar (blint, utan redigeringar för enkelheten) data händer följande:<br>

A. Gamla fel sort 1 stannar kvar<br>

B. Gamla fel sort 2 tas bort<br>

C. Nya fel sort 1 läggs till<br>

D. Nya fel sort 2 läggs till</div>


<div>Hela balansen beror på att man tror att antal B-händelser är mycket större än<br>

C-händelser, och att D är litet.<br>

Om man dessutom granskar och redigerar rutor innan uppladdningen kan man även<br>

minska A och C. Att minska D är det svåraste för att det kräver 100% aktuell<br>

kännedom på verkligheten.</div>


<div> </div>


<div>> att den totala andelen fel kanske minskar något för att den mängd data som<br>

> importeras är extremt omfattande.</div>


<div>Min beräkning var jätteenkelt och hade en variabel vilken var 1%<br>

andel fel dolda i nya data. Även om andelen höjs till 20% förblir det<br>

resulterande förhållandet bättre än utan importen. Man måste dock tycka att<br>

felen sort 1 och sort 2 har samma vikt, det vill säga att de är lika dåliga att ha.</div>


<div> </div>


<div>> så undrar jag om vi inte ska byta strategi och i stället sätta upp en server<br>

som via MapWithAI serverar datan per område för manuel bearbetning?</div>


<div>Man kan alltid pröva! Det låter lovande för mig, fast jag inte har använt detta<br>

hittills. Jag undrar om dess RapiD-redigerare kan tolka noder, eller att fokusen<br>

ligger endast på gator/vägar. Hursomhelst, de importfiler som jag publicerar är<br>

öppna för alla att använda som kartunderlag eller på vilket sätt.</div>


<div>Jag vill dock fortfarande fokusera mig på att förbättra taggvalet och<br>

namnjämförelseprocessen. Syftet är fortfarande att hjälpa förenkla manuellt<br>

arbete för varje ruta.</div>


<div> </div>


<div>Tack!</div>

</div>


<div> </div>


<div data-signature-widget="container">

<div data-signature-widget="content">

<div>Med vänliga hälsningar,<br>

Grigory Rechistov<br>

With best regards,<br>

Grigory Rechistov</div>

</div>

</div>


<div> </div>

</div>


</blockquote></div></body></html>