[Talk-cz] Statistiky uživatelů

hanoj ehanoj na gmail.com
Pondělí Prosinec 21 10:19:32 UTC 2009


> Tak jsem to udělal ještě jinak. U každého nodu lze zjistit poslední editace, tj.
> mám-li rozdílový soubor za nějaké období a není-li to období příliš dlouhé, lze
> podle data poslední editace zjistit průběh mapování. Takže teď je granularita
> činnosti přesně 1 den, navíc data nejsou posunuta a grafy nezkreslují.
>
> To omezení max. počtu změn se mi jeví jako rozumné; standardní hranici jsem dal
> 8.000 za den (jen zřídkakdy - cca 30x - je těch nodů víc a tam už podezření na
> import mám), všechno co je nad 8.000 se nepočítá. Tento počet lze změnit v
> políčku nahoře.
*** perfektni. Jeste je otazka, zda nevyhazet cely den, kdyz prekroci
magickou hranici. Pri praci s importem je spojena spousta cinnosti a
tezko se clovek zabyva jeste necim jinym. I kdyby tak to nebude hrat v
celku vyznam.
Napr. 28/7-30/7 oprava importu UIR-ADR
http://www.openstreetmap.org/user/Radom%C3%ADr%20%C4%8Cernoch/edits?page=2

Jako priklad velkeho mnozstvi rucne vkladanych nodu by mohl slouzit
napr. Petr Dlouhy. Ten systematicky vynasel silnice III. trid a
importu se tusim neucastnil...
Vzdycky je to presna hra s nepresnymi cisly.


Pravdou je, ze tech importu zas az tak moc nebylo a lze je casove vymezit:
* UIR-ADR 2x (tj. import, oprava)
* lesy CR
* silnice I a II. trid HS-RS
* nazvy obci, geonames


>>>   >  jeste mne napada zpracovat pro tech 1000 uzivatelu v CR jejich
>>>   >  changesety a podle pocetniho rozsahu changesetu vyhazet ty, ktere
>>>   >  statisticky nedopovidaji rozsahu beznych editaci (napr. tisice nodu).
>>>
>>> Co máte na mysli? Resp. kde stáhnu changesety jednotlivých uživatelů v nějakém
>>> pěkném tvaru?
>> *** napr. neco jako Read: GET /api/0.6/changeset/#id
>> http://wiki.openstreetmap.org/wiki/API_v0.6
>>
>> nemam to podrobne prostudovane, ale jeden ze zpusobu uziti je tady:
>> http://www.openstreetmap.org/user/hanoj/edits?page=55
>> http://www.openstreetmap.org/browse/changeset/257060
>
> Zajímavý nápad, ale narazil jsem na několik nevýhod:
>  - nevím jaké changesety mám stahovat
*** mame seznam uzivatelu v CR, podle orezane planet, cca 1000 dle
tvych statistik, ti jiz maji sve changesety

>  - i když se dá stáhnout seznam changesetů, špatně se to přiřazuje k
> jednotlivým oblastem
*** to je pravda...

>  - když to budu třídit podle uživatelů, špatně se odhaduje kterých a navíc se
> tam míchají ti, kteří mají primární působiště mimo ČR
*** ale muzu najit dny, kdy frekvence changesetu a mnozstvi zmen
neodpovida realne fyzicke praci a tyto cele dny vyhazet. Ale asi to je
prace bez vyrazneho zlepseni vysledku.



diky
hanoj




Další informace o konferenci talk-cz