<html><head></head><body>Hej igen đŸ˜ƒ<br>Tusen tack för dina utförliga svar.<br>Jag Ă€r nu mera positivt instĂ€lld till importen. Jag ska titta nĂ€rmare pĂ„ en fil och Ă„terkommer. <br>Jag tror det gĂ„r bra att vi med lokalkĂ€nnedom laddar upp för ett omrĂ„de vi kĂ€nner. FrĂ„gan Ă€r hur vi skal göra för dem delar av landet (i norr) dĂ€r ingen av oss har lokalkĂ€nnedom? <br><br><div class="gmail_quote">On January 22, 2020 1:34:35 AM GMT+01:00, Grigory Rechistov via Talk-se <talk-se@openstreetmap.org> wrote:<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
<div>
<div>
<div>Hej Ture, Andreas, Anders, pangoSE och andra,</div>

<div>LĂ€ngst ner följer mina kommentarer till dina svar.</div>

<div> </div>

<div>> Jag har för mig att LMV publicerade textlagren i tvĂ„ uppsĂ€ttningar: en<br>
”kart”-uppsĂ€ttning med snygga avstavningar, radbrytningar och sĂ„, och en<br>
”GIS”-uppsĂ€ttning dĂ€r namnen sitter ihop. Vilket av dem Ă€r det du tittar pĂ„?</div>

<div> </div>

<div>Jag anvĂ€nder den "GIS"-uppsĂ€ttningen, men, som du lagt mĂ€rke till...</div>

<div> </div>

<div>> Sedan misstĂ€nker jag att Ă€ven â€GIS”-uppsĂ€ttningen lider lite av att vara<br>
> â€en karta i shapefile-format”, snarare Ă€n en geodatabas â€” namnen Ă€r placerade<br>
> dĂ€r det blir snyggt pĂ„ en 50k-karta</div>

<div> </div>

<div>...det har jag ocksĂ„ mĂ€rkt. DĂ€rför finns olika förkortningar och radbrytningar<br>
i kĂ€llfiler vilka jag har kunnat Ă„tgĂ€rda. Jag har i planer att kontakta<br>
LantmĂ€teriet med en lista pĂ„ ortnamns korrigeringar som jag samlat. Kanske blir<br>
nĂ„gon intresserad i att uppdatera deras kartinformation för framtiden.</div>

<div> </div>

<div>> För herrgĂ„rdar kanske man kan passa pĂ„ att lĂ€gga till historic=manor samtidigt.<br>
Jag har ocksĂ„ tĂ€nkt pĂ„ detta, men vĂ„gade inte rĂ€kna varje herrgĂ„rd som en plats<br>
av historiskt vĂ€rde.<br>
DĂ„ kanske missförstĂ„r jag "historic=manor":s betydelse. Den taggen anvĂ€nds<br>
förresten inte mycket i Sverige, enligt detta: http://overpass-turbo.eu/s/PY3 .<br>
Endast 77 trĂ€ffar.</div>

<div> </div>

<div>> Vi har ju Ă€ven en hel del stĂ€llen som har ett namn, men dĂ€r det Ă€r Ă¶dehus<br>
> eller sommarstugor eller fĂ€bodar. Dessa borde Ă€ven de klassas som locality.<br>
Det Ă€r precis den ursprungliga meningen bakom "place=locality". Att importen<br>
anvĂ€nder den taggen för herrgĂ„rdarna var en kompromiss som jag tillĂ€t eftersom<br>
jag inte kunde hitta ett bĂ€ttre alternativ för nĂ„got mindre Ă€n "isolated_dwelling".<br>
DĂ„ ansĂ„g jag att "historic=manor" vore för specifikt. Men att bara kasta ivĂ€g<br>
noderna ville jag inte heller.<br>
LĂ„t mig tĂ€nka pĂ„ det lite mer, hur det bĂ€sta lösningen skulle se ut. Kanske skulle<br>
jag omtagga dem till "isolated_dwelling", kanske till "manor", kanske kasta bort.</div>

<div><br>
> Stadsdelar bör vĂ€l inte vara hamlet, utan neighbourhood?<br>
Nej, "neighbourhood" Ă€r visst bĂ€ttre för dem. För varje kartruta som ligger nĂ€ra<br>
en större stad ska en uppladdare se till att "hamlet" blir till "neighbourhood".<br>
Det skulle vara uppenbart att upptĂ€cka visuellt och fixa manuellt.</div>

<div>Det skulle inte finnas mĂ„nga sĂ„dana rutor som tĂ€cker stora stĂ€der. Stora stĂ€der<br>
brukar dessutom vara mer fĂ€rdigt kartlagda vilket betyder mindre nya noder att<br>
importera runtom dem.</div>

<div>Jag kunde kanske ha löst problemet genom att tagga de noder som finns inom stĂ€ders<br>
grĂ€nser pĂ„ ett annat etikettsschema... Men det skulle ha varit för<br>
berĂ€kningsintensivt, och jag Ă€r inte redo att skriva en sĂ„dan algoritm (Ă€nnu).</div>

<div> </div>

<div>> Ă€ven om jag sjĂ€lv hade föredragit en adress-import.<br>
Det skulle jag ha ocksĂ„ föredragit, om jag hade tillgĂ„ng till en Ă¶ppen databas<br>
för ortnamn/adresser.</div>

<div> </div>

<div>> Gissar att merparten av de nya namnen inte lĂ€ngre anvĂ€nds i vardagen.<br>
HĂ€r kan vi endast tro pĂ„ LantmĂ€teriets kompetens att hĂ„lla sina kartor aktuella.<br>
Men det gĂ€ller Ă€ven sjĂ€lva OSM-projektet. Man litar nĂ€mligen pĂ„ att andra OSM:s<br>
bidragsgivare har ritat nĂ„got som stĂ€mmer i verkligheten. En gĂ„ng hade jag cyklat<br>
till en skogsvĂ€g som visade sig vara ett dike pĂ„ marken ÂŻ\_(ツ)_/ÂŻ</div>

<div>Det Ă€r kanske ocksĂ„ en stĂ€ndig frĂ„ga för OSM: nĂ€r blir historiska data<br>
irrelevanta och bör suddas ur OSM-databasen? Jag Ă€r till exempel lĂ€tt irriterad<br>
att man tillĂ„ter ha "abandoned=railway" (drygt 256 tusen strĂ€ckor enligt Taginfo!)</div>

<div> </div>

<div>> Vissa platser ser mer ut som "locality" medan nĂ„gra namn har helt klart<br>
> felaktigt blivit "hamlet" fast det bara Ă€r en gĂ„rd, om ens det.</div>

<div>Det finns sĂ„dan risk som jag skrivit i importplanen. Jag bedömer att ett sĂ„dant<br>
fel, om tillĂ„tet vid importen, Ă€r av mindre vikt. Man kan vĂ€l strida om "rĂ€tta"<br>
etiketter till vĂ€rldens slut. Att det finns en plats med ett namn skulle dock hjĂ€lpa<br>
att upptĂ€cka platsen och sedan att bedöma dess storlek och sedan rĂ€tta till<br>
"place=hamlet" till "locality" eller tvĂ€rtom.</div>

<div><br>
> Ă„r det i sĂ„na fall möjligt att genereras nya filer efterhand, sĂ„ man ser vad<br>
> som blir till Ă¶vers pĂ„ slutet?</div>

<div>Att generera ny filer efter jag korrigerat skript/input tar liksom 20 minuter<br>
eller Ă€nnu mindre. Det Ă€r bara cirka 100 000 noder i hela landet vi talar om.<br>
Den nuvarande uppdelningen beror pĂ„ LantmĂ€teriets eget schema. Men jag kan enkelt<br>
skĂ€ra de nuvarande "regionerna" i bitar som tĂ€cker enstaka kommuner eller till<br>
nĂ„gon annan nivĂ„s administrativa grĂ€nser som nu finns.</div>

<div> </div>

<div>> Jag rekommenderar att du sĂ€tter dig in i hemmansbegreppet och de olika<br>
> skiftesreformer som gjorts i Sverige.<br>
Tack, det ska jag göra. AngĂ„ende de dubbletter som troligen skapas vid<br>
kartbladens kanter, kan de Ă„tgĂ€rdas genom att mĂ€rkas som tveksamma eller<br>
till och med raderas bort för sĂ€kerhets skull. NĂ„gonting var inte kartlagt<br>
förut, och det blir inte tillagd efter, right?</div>

<div> </div>

<div>> Nej, sĂ„ ska vi inte tagga. Ett objekt ska taggas en gĂ„ng. Detta Ă€r en<br>
grundlĂ€ggande osm-regel</div>

<div>Ja, det Ă€r rimligt att importer följer denna regel. DĂ„ modifierar jag skriptet att<br>
vara mer aggressivt med att radera de nya noder som stĂ„r i konflikt med gamla lika<br>
nĂ€mnda strĂ€ckor. Skriptet behöver Ă€ven ta hĂ€nsyn till fler befintliga etiketter<br>
bĂ„de pĂ„ strĂ€ckor och noder sĂ„ att det undvikas sĂ„ mĂ„nga dubbletter som<br>
möjligt.</div>

<div><br>
> NĂ„gra fler exempel som Ă€r fel Ă€r SkanörsgĂ„rden, Falsterbo vĂ„ng och<br>
> Falsterbohus. Den förstnĂ€mnda Ă€r namnet pĂ„ ett bostadsomrĂ„de, den andra Ă€r<br>
> knappt i allmĂ€nt bruk och den tredje syftar pĂ„ ett kĂ€nt före detta<br>
> badhotell: ...<br>
> Jag har tittat i Malmö, Lund, Landskrona och Helsingborg. Samtliga<br>
> stadsdelar dĂ€r Ă€r felaktigt angivna, och dessutom redan taggade pĂ„ annat sĂ€tt.</div>

<div> </div>

<div>Framförallt Ă€r jag imponerad hur vĂ€l landets södra delar Ă€r kartlagda. Det vore<br>
kul om de norra delarna blir lika bra en dag.</div>

<div> </div>

<div>> Tittar jag i din exempelfil ser jag att Ropsten Ă€r inlagd som isolated<br>
> dwelling, vilket naturligtvis Ă€r fel (det Ă€r snarare ett industriomrĂ„de).<br>
> Jag Ă€r inte tillrĂ€ckligt bekant med Stockholm för att kommentera större<br>
> delen av exemplen dĂ€r, men samtliga ligger i tĂ€tbebyggt omrĂ„de och dĂ€r<br>
> anvĂ€nder vi inte place=hamlet Ă¶ver huvud taget.<br>
> ...<br>
> Ă„rtholmen (koloniomrĂ„de), Söderkulla, JĂ€gersro<br>
> villastad, StenkĂ€llan, Virentofta, Hohög, KungshĂ€lla (namn som fallit ur<br>
> bruk), Riseberga, Bulltofta, Valdemarsro, SegevĂ„ng och "VĂ€stra HamnomrĂ„den"<br>
> (inte en etablerad term). Jag tror de flesta kan se bara pĂ„ namnen att<br>
> dessa inte Ă€r lĂ€mpliga att tagga som hamlet.</div>

<div>Tack för din utförliga feedback!</div>

<div>> Vad som Ă€r officiellt namn Ă€r mindre viktigt för vad som Ă€r taggat pĂ„ OSM.</div>

<div> </div>

<div>Nu undrar jag hur stor andel platser Ă€r dĂ€r officiella och allmĂ€nna namn inte<br>
stĂ€mmer med varandra.</div>

<div> </div>

<div>> och inte sĂ€llan har platsnamn helt tolkats fel av lantmĂ€terianstĂ€llda som<br>
> inte förstĂ„tt lokala dialekter.<br>
NĂ€r nĂ„gon felstavar mitt namn (och det hĂ€nder ofta) kan jag Ă€ndĂ„ oftast begripa<br>
att det verkligen handlar om mig. Det gör inget, för man kan rĂ€tta det till senare.<br>
Om nĂ„gon inte kĂ€nner till mitt namn blir det svĂ„rare att urskilja mig frĂ„n alla<br>
andra personer vilkas namn Ă€r okĂ€nda.</div>

<div> </div>

<div>> DĂ„ officiellt namn skiljer sig frĂ„n det populĂ€rt anvĂ€nda namnet kan man<br>
> anvĂ€nda sig av sidotaggen official_name</div>

<div>Och det finns ocksĂ„ alt_name, name:sv, name:sju och dylika etiketter för att<br>
förvara sĂ„ mĂ„nga namn. Mitt skript anvĂ€nder Ă€ven dem för att hitta dubbletter.<br>
Visst kan det hĂ€nda att LantmĂ€teriets data innehĂ„ller ett namn som Ă€r sĂ„pass<br>
dĂ„ligt stavat att dess nĂ€rvaro pĂ„ kartan Ă€r uppenbart skadligt, men tror man att<br>
det kan bli sĂ„pass farligt?</div>

<div> </div>

<div>> Vi bör inte importera data om vi inte kan vara sĂ€kra pĂ„ att den Ă€r bra.</div>

<div>Nej, vi bör inte importera nĂ„gra noder *blint*. DĂ€rför poĂ€ngterar importplanen<br>
pĂ„ manuella granskningens stor roll. DĂ€rför delas importfilerna i smĂ„ rutor med<br>
200-400 noder (kan enkelt bli till Ă€nnu fĂ€rre). En person skulle kunna göra<br>
översikt pĂ„ en ruta i taget, utan att det blir för pĂ„frestande. För varje ruta<br>
beslutar uppladdaren om nĂ„gra redigeringar/rensningar behövs, eller att till och<br>
med hela rutan Ă€r vĂ€rdelös.</div>

<div> </div>

<div>> Att data Ă€r inhĂ€mtad av myndigheter Ă€r ingen garant för att den Ă€r bra.<br>
Inget Ă€r nĂ„got garanti att det nuvarande OSM-innehĂ„llet Ă€r aktuellt heller. Vi<br>
bara tror pĂ„ andra anvĂ€ndares vett och vĂ€lvilja.<br>
Vad man kan dock garantera att den "vita rymden" pĂ„ OSM-kartan aldrig stĂ€mmer<br>
mot verkligheten.</div>

<div> </div>

<div>> Nej, införda fel kan aldrig rĂ€ttfĂ€rdigas av att det redan finns fel i databasen</div>

<div> </div>

<div>Jag anser tvĂ„ typer fel. Att en nod har ett fel namn eller position Ă€r fel sort 1.<br>
Om en nod motsvarande till en fysisk plats inte finns Ă€r fel sort 2. NĂ€r man<br>
importerar (blint, utan redigeringar för enkelheten) data hĂ€nder följande:<br>
A. Gamla fel sort 1 stannar kvar<br>
B. Gamla fel sort 2 tas bort<br>
C. Nya fel sort 1 lĂ€ggs till<br>
D. Nya fel sort 2 lĂ€ggs till</div>

<div>Hela balansen beror pĂ„ att man tror att antal B-hĂ€ndelser Ă€r mycket större Ă€n<br>
C-hĂ€ndelser, och att D Ă€r litet.<br>
Om man dessutom granskar och redigerar rutor innan uppladdningen kan man Ă€ven<br>
minska A och C. Att minska D Ă€r det svĂ„raste för att det krĂ€ver 100% aktuell<br>
kĂ€nnedom pĂ„ verkligheten.</div>

<div> </div>

<div>> att den totala andelen fel kanske minskar nĂ„got för att den mĂ€ngd data som<br>
> importeras Ă€r extremt omfattande.</div>

<div>Min berĂ€kning var jĂ€tteenkelt och hade en variabel vilken var 1%<br>
andel fel dolda i nya data. Ă„ven om andelen höjs till 20% förblir det<br>
resulterande förhĂ„llandet bĂ€ttre Ă€n utan importen. Man mĂ„ste dock tycka att<br>
felen sort 1 och sort 2 har samma vikt, det vill sĂ€ga att de Ă€r lika dĂ„liga att ha.</div>

<div> </div>

<div>> sĂ„ undrar jag om vi inte ska byta strategi och i stĂ€llet sĂ€tta upp en server<br>
som via MapWithAI serverar datan per omrĂ„de för manuel bearbetning?</div>

<div>Man kan alltid pröva! Det lĂ„ter lovande för mig, fast jag inte har anvĂ€nt detta<br>
hittills. Jag undrar om dess RapiD-redigerare kan tolka noder, eller att fokusen<br>
ligger endast pĂ„ gator/vĂ€gar. Hursomhelst, de importfiler som jag publicerar Ă€r<br>
öppna för alla att anvĂ€nda som kartunderlag eller pĂ„ vilket sĂ€tt.</div>

<div>Jag vill dock fortfarande fokusera mig pĂ„ att förbĂ€ttra taggvalet och<br>
namnjĂ€mförelseprocessen. Syftet Ă€r fortfarande att hjĂ€lpa förenkla manuellt<br>
arbete för varje ruta.</div>

<div> </div>

<div>Tack!</div>
</div>

<div> </div>

<div data-signature-widget="container">
<div data-signature-widget="content">
<div>Med vĂ€nliga hĂ€lsningar,<br>
Grigory Rechistov<br>
With best regards,<br>
Grigory Rechistov</div>
</div>
</div>

<div> </div>
</div>

</blockquote></div></body></html>