<HTML><BODY><div>
<div>Hej Andreas, stort tack för feedback! Här är mina kommentarer.</div>

<div> </div>

<div>> Exempelvis förekommer Hjortseryd två gånger, med en brytlinje mellan två<br>
> kartblad mellan dem båda. Kommer sådana dubbletter kollas av?</div>

<div>Sådan koll kan jag enkelt lägga till i skriptet. Men ditt exempel med Hjortseryd<br>
visar bara att det kan finnas två platser med samma namn på bara 1,16 km avstånd.</div>

<div> </div>

<div>Här är varför.</div>

<div>Importsfilerna har tre noder med namn "Hjortseryd":</div>

<div>tx_07.osm: lat="56.706179333" lon="13.412860079"<br>
tx_10.osm: lat="56.385103802" lon="15.291224794"<br>
tx_10.osm: lat="56.374758939" lon="15.292829751"</div>

<div>En by ligger lång bortifrån andra, och två byar finns nära varandra.<br>
Här är de på Terrängkartan.<br>
Alla tre noder: <a href="https://i.stack.imgur.com/2hKsL.png">https://i.stack.imgur.com/2hKsL.png</a><br>
De två nära: <a href="https://i.stack.imgur.com/yWzRN.png">https://i.stack.imgur.com/yWzRN.png</a></div>

<div> </div>

<div>Trots att det verkligen är konstigt att man kallar två närliggande byar samma<br>
namn, är de verkligen två enstaka gårdar, men sina egna gränser osv.</div>

<div>Även Ekonomiska kartan håller med detta: https://i.stack.imgur.com/NpZQw.png</div>

<div>Nu får man kanske inte kolla på icke-öppna data... Hur som helst, andra källor<br>
tycker också att de är enstaka lika nämnda byar.</div>

<div>1. Eniro.se visar samma två byar som "Hjortseryd, ERINGSBODA".<br>
2. Hitta.se visar dem som "Hjortseryd, Eringsboda" och "Hjortseryd, Ronneby".<br>
   De har till och med olika postnummer.</div>

<div> </div>

<div>Oavsett alla bevis kan det ändå bli ett enormt fel i namn, men alla partier verkar<br>
tro på det.</div>

<div> </div>

<div>> Detta har jag gjort genom att rita en farmyard runt gården och sätta<br>
> name-tagg på denna. Dessa dubbletter måste det kontrolleras mot.</div>

<div>På detta har jag redan funderat. Det är enkelt att implementera (jag<br>
utelämnar nu tekniska detaljer om hur), men frågan är om det verkligen behövs.</div>

<div>Jag har sett flera exempel när t ex ett bostadsområde har sitt namn på den<br>
sträcka som omger det *samt* som en enstaka nod någonstans inuti. Det är vettigt<br>
när områdets logiska center inte sammanfaller med dess geometriskt center. Till<br>
exempel kan ett logiskt center finnas på ett torg medan det geometriska centret<br>
kan hamna i ett skogsparti.</div>

<div> </div>

<div>> Dessa bör antagligen städas bort, då de naturligtvis inte ska<br>
> taggas som village eller liknande och datan troligen dubblerar sådant som<br>
> ligger inlagt med boundary-taggar.</div>

<div> </div>

<div>Jag har öppnat tx_01.osm för Stockholm och har laddat ner befintliga platser<br>
(med Overpass-API) för samma område. Här är jämförelsen.</div>

<div> </div>

<div>Befintliga data: <a href="https://i.stack.imgur.com/BCQ4i.jpg">https://i.stack.imgur.com/BCQ4i.jpg</a><br>
De flesta noderna är place=suburb, place=town, bara ett fåtal place=village.</div>

<div> </div>

<div>Nya data: <a href="https://i.stack.imgur.com/8DZn2.jpg">https://i.stack.imgur.com/8DZn2.jpg</a><br>
Hela filen innehåller endast place=isolated_dwelling, place=hamlet (småort),<br>
place=locality och ett fall place=town. Inga place=village alls.</div>

<div>Småort är ett officiellt begrepp vilket jag tror är rimligt att använda även nära<br>
stora städer: https://sv.wikipedia.org/wiki/Sm%C3%A5ort : "definieras som en<br>
samlad bebyggelse med 50–199 invånare, där det är högst 150 meter mellan husen."</div>

<div>Om du kan förse mig med ett exempel där du tror etiketterna var felvalda då kan<br>
jag försöka åtgärda detta.</div>

<div> </div>

<div>> I Lund såg jag att "Norra Fäladen" radbrutits och detta gjort att datan av<br>
> någon anledning blivit dubblerad, med en place-tagg med namn "Norra" och en<br>
> med namn "Fäladen".</div>

<div>Orsaken till detta förklarades i importplanen. Eventuell radbrytning är åtgärdad<br>
i skriptet, jag behöver lära det känna igen fler mönster. Det kommer jag att göra.</div>

<div> </div>

<div>> "Gullåkra" har inte fått träff mot "Gullåkra by", trots att noderna är<br>
> placerade nästan på varandra.</div>

<div>Jag har sökt i Internet, och det verkar att "Gullåkra by" inte är byns<br>
officiella namn, däremot är "Gullåkra" det korrekta namnet. Importen kan<br>
inte rätta mänskliga fel i befintliga data, men den kan hjälpa med att upptäcka<br>
dem, precis som du har gjort.</div>

<div> </div>

<div>> efter att ha tvättat den i områden de har hyfsad lokalkännedom så<br>
> de kan bedöma datans lämplighet.</div>

<div>Hela poängen i vilken import finns i att man inte behöver personligen undersöka<br>
en plats. Istället använder man information samlad av myndigheterna (för vilket<br>
betalar man skatt för, bland annat). Värför spendera hundratals människaår ideella<br>
arbete för att kartlägga samtliga ortnamn när Lantmäteriet redan har spenderat<br>
massor tid och pengar på detta?</div>

<div> </div>

<div>Det kommer säkert att förekomma enstaka fel i importdatan, men fördelar<br>
överstiger betydligt nackdelar. Låt mig illustrera det med siffror.</div>

<div> </div>

<div>Sveriges OSM-kartan har just nu ungefär 68000 noder med ortnamn. Lantmäteriets data<br>
innehåller cirka 154000 ortnamn. Om vi föreställer oss att Lantmäteriet känner<br>
samtliga ortnamn, betyder det att OSM-kartan saknar 86000 noder,<br>
eller har 55% fel. Då räknar jag en utebliven nod som fel. Här struntar vi i<br>
OSM:s befintliga stavfel, positionsfel osv., annars skulle förhållandet ha blivit<br>
ännu värre.</div>

<div> </div>

<div>När vi importerar nya noder kommer vi säkert introducera nya fel:<br>
dubbletter, felstavningar osv. Låt oss föreställa oss att importen går såpass<br>
dåligt att vi introducerar 1% fel på nya noder. Det betyder att vi lägger till<br>
860 nya fel in i databasen.</div>

<div> </div>

<div>Efter importen har vi således total 154000 noder i databasen varav 860 är felaktiga.<br>
Det resulterande felförhållandet blir bara 0.6%.</div>

<div>Med andra ord, att riskera introducera få nya fel med importen är passande om<br>
det förbättrar databasens täckning.</div>

<div> </div>
 

<div> </div>

<div data-signature-widget="container">
<div data-signature-widget="content">
<div>С наилучшими пожеланиями,<br>
Григорий Речистов.<br>
Med vänliga hälsningar,<br>
Grigory Rechistov<br>
With best regards,<br>
Grigory Rechistov</div>
</div>
</div>

<div> </div>
</div>
</BODY></HTML>