[Talk-cz] RUIAN a inkrementální aktualizace

Petr Vejsada osm na propsychology.cz
Neděle Srpen 10 19:49:18 UTC 2014


Ahoj,

Dne Ne 10. srpna 2014 20:56:00, Petr Morávek [Xificurk] napsal(a):

> Ahoj,
> 
> mám nemilou zprávu pro vás, co pracujete s RUIAN (přes ruian2pgsql) a
> provádíte inkrementální aktualizace - "nefunguje" to.

jestli chápu vše správně, tak nelze říci "nefunguje TO", pokud TO jsou 
inkrementální aktualizace. Obdobně by se za TO dalo dosadit, že nefunguje 
nahrání celku ;-).

Mám schema, vzniklé z dat ke dni 30.4. plus aktualizace. Od začátku těch 
aktualizací tam mám ten patch, co ignoruje čísla transakcí, tedy *ignoruje*, 
není tam >=, jak je asi v poslední -dev, viz debata na Githubu. To jen pro 
pořádek. Ač není pravděpodobné, že by se čísla transakcí někdy dekrementovala, 
vyloučit to asi nemůžeme!

> * SO 78153263 je v červencovém dumpu (20140731_OB_554791_UKSH.xml.gz),
> ale není v dumpu z června ani žádném změnovém souboru.

select deleted,id_trans_ruian,definicni_bod is not NULL as definicni_bod,hranice 
is not NULL as hranice,plati_od,item_timestamp from ruian.rn_stavebni_objekt 
where kod=78153263;

 deleted | id_trans_ruian | definicni_bod | hranice |  plati_od  |       
item_timestamp
---------+----------------+---------------+---------+------------+----------------------------
 f       |         627026 | t             | f       | 20.06.2014 | 22.06.2014 
11:38:58.947812

je tedy ve změnovém souboru z průběhu června. Nahráno 22.6., takže asi soubor 
z 21.6., ale nevím jistě. Nenahrávám každý den, jen skoro každý den.

V dumpu z června by ovšem být měl.

> 
> * SO 78258294 je v červencovém dumpu (20140731_OB_576000_UKSH.xml.gz) -
> tam má IdTransakce=648617 a IsknBudovaId=15680609010. V červnovém dumpu
> není, ale je v jednom jediném změnovém souboru
> (20140728_ST_ZKSH.xml.gz), ale tam nemá nastaveno IsknBudovaId a
> IdTransakce=648063.

Toto souhlasí, přesně toto mám v DB včetně absence budova_id

Z toho nám vyplývá, že chyby jsou v obojím - jak v dumpech, tak ve změnových 
souborech :(

> Na ostatní tabulky jsem nekoukal, ale je dost možné, že trpí podobným
> problémem.

Vzpomínám si, že jsme si srovnávali count(*),count(definicni_bod) a kde je 
relevantní, tak i count(hranice). U tabulky adres jsme se, kupodivu, shodli 
:-). Ostatní si nepamatuji.

--
Petr





Další informace o konferenci talk-cz