[Talk-ee] Aadressidest

Jaak Laineste jaak at nutiteq.com
Wed May 4 13:57:16 BST 2011


 Andmebaasi normaliseerimise mõte pole andmemahu kokkuhoiuks. Tänapäeval mõnisada MB pole midagi tõesti. Küsimus on hilisemas halduses: kui palju käsitsitööd on vaja kui kaks omavalistust liituvad, tehakse haldusreform (nagu Lätis tehti ära) vms. Normaliseeritud andmebaasis muudad täpselt seda mis muutus, kui on normaliseerimata siis hakkad baasist taga otsima andmeid. Search/replace saab ka teha tõesti, või skripte kirjutama hakata, aga kui palju vigu see omakorda tekitab ja käsitsitööd nõuab?

 OSM geograafilised andmed on normaliseeritud (topoloogiliselt puhtad) - topelt-node-d on OSM-is keelatud. See on kõva edasiminek tavalise keskmise GIS-iga võrreldes. Minumeelest peaks sama mustrit jälgima ka tag-ide puhul, ja ilma asjata mitte dubleerima miljonikordselt infot, mis on juba baasis sisuliselt olemas. Eelkõige pika perspektiivi halduse peale ja andmebaasi puhtuse peale mõeldes.

Jaak


On 04.05.2011, at 15:47, Vitali Balandin wrote:

> 
>> Mahust   niipalju,  et  ADS  andmed  tekstikujul  on  pakkimata  sadu
>> magabaite.  OSM  Eesti  baas  on  XML-kujul  monisada  MB.  Kui  koik
>> aadressid   sisse   lugeda  ilma  normaliseerimata,  siis  voib  maht
>> suureneda margatavalt: voibolla 2x mitte, aga 1.5 korda kull.
> 
> Tanaseks Estonia.osm - 646 Mb
> OSM  fail koikide aadressite tegidega addr:province, addr:city, ... on
> 67.8 Mb (ilma taludeta), kui lisada talud, siis tuleb umbes 100 Mb.
> Aga,  OSMis  on  juba  aadressite  osa,  ja  aadressite  OSM failid ka
> sisaldavad  andmed,  mis  juba  on  OSM  baasil.
> Arvutage  ise, mis Estonia.osm maht tuleb valja, ja kui palju korda ta
> suureneb. Pakkun umbes + 10%
> 
> 
> _______________________________________________
> Talk-ee mailing list
> Talk-ee at openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-ee




More information about the Talk-ee mailing list