[Talk-ee] Aadressidest
Jaak Laineste
jaak at nutiteq.com
Wed May 4 13:57:16 BST 2011
Andmebaasi normaliseerimise mõte pole andmemahu kokkuhoiuks. Tänapäeval mõnisada MB pole midagi tõesti. Küsimus on hilisemas halduses: kui palju käsitsitööd on vaja kui kaks omavalistust liituvad, tehakse haldusreform (nagu Lätis tehti ära) vms. Normaliseeritud andmebaasis muudad täpselt seda mis muutus, kui on normaliseerimata siis hakkad baasist taga otsima andmeid. Search/replace saab ka teha tõesti, või skripte kirjutama hakata, aga kui palju vigu see omakorda tekitab ja käsitsitööd nõuab?
OSM geograafilised andmed on normaliseeritud (topoloogiliselt puhtad) - topelt-node-d on OSM-is keelatud. See on kõva edasiminek tavalise keskmise GIS-iga võrreldes. Minumeelest peaks sama mustrit jälgima ka tag-ide puhul, ja ilma asjata mitte dubleerima miljonikordselt infot, mis on juba baasis sisuliselt olemas. Eelkõige pika perspektiivi halduse peale ja andmebaasi puhtuse peale mõeldes.
Jaak
On 04.05.2011, at 15:47, Vitali Balandin wrote:
>
>> Mahust niipalju, et ADS andmed tekstikujul on pakkimata sadu
>> magabaite. OSM Eesti baas on XML-kujul monisada MB. Kui koik
>> aadressid sisse lugeda ilma normaliseerimata, siis voib maht
>> suureneda margatavalt: voibolla 2x mitte, aga 1.5 korda kull.
>
> Tanaseks Estonia.osm - 646 Mb
> OSM fail koikide aadressite tegidega addr:province, addr:city, ... on
> 67.8 Mb (ilma taludeta), kui lisada talud, siis tuleb umbes 100 Mb.
> Aga, OSMis on juba aadressite osa, ja aadressite OSM failid ka
> sisaldavad andmed, mis juba on OSM baasil.
> Arvutage ise, mis Estonia.osm maht tuleb valja, ja kui palju korda ta
> suureneb. Pakkun umbes + 10%
>
>
> _______________________________________________
> Talk-ee mailing list
> Talk-ee at openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-ee
More information about the Talk-ee
mailing list