[Talk-cz] Vyhledavani v MHD

Pavel Machek pavel na ucw.cz
Čtvrtek Březen 10 11:42:33 UTC 2016


AhoJ!

On Wed 2016-03-09 10:24:42, Jethro wrote:
> On Mon, Mar 07, 2016 at 02:52:05PM +0100, Ladislav Nesnera wrote:
> > Pokud jsem správně pochopil, je tu vícero datových zdrojů
> > <http://wiki.openstreetmap.org/wiki/Ve%C5%99ejn%C3%A1_hromadn%C3%A1_doprava_v_%C4%8CR#Prosba_o_pomoc_p.C5.99i_p.C5.99echodu_na_nov.C3.A9_zna.C4.8Den.C3.AD>.
> > Poměrně nedávno byly jízdní řády spojů uvolněny jako otevřená data ve
> > formátu JDF. ČD se vymyká jako vždy
> > <http://www.cnews.cz/chaps-kvuli-monopolu-na-jizdni-rady-dostal-od-uohs-pokutu-ve-vysi-22-mil-korun>
> > (nebo odkaz z MVČR
> > <http://www.mdcr.cz/cs/verejna-doprava/kalendare-pro-jizdni-rady-a-cis/kalendare-pro-jizdni-rady-verejne-linkove-osobni-dopravy.htm>)
> > Nestálo by za to přejít na tento zdroj? Možná by bylo fajn je
> > předžvejknout i jiným zájemcům, neb bych v tom čekal zas nějaké
> > CHAPSoviny (např. vypadá to, že místo diffu přegenerovávají úplně vše
> > tj. zip má skoro 70 MB, nevidím k tomu žádný popis, ..)
> > 
> > Aktualizace je průběžná, tudíž nad tímto už by dávalo smysl postavit
> > nějaké vyhledávání spojení (s někým jsem se na tohle téma bavil po
> > brněnské hospůdce, žel v době, kdy jsem o těchto datech ještě nevěděl.
> > Sázím na Jethra, ale mám binec v jménech..)

No, ja jsem kdysi nejake vyhledavani psal, je na timetab.sf.net .

Bohuzel tech formatu dat je docela dost, a konverze mezi nima nejsou
jednoduchy. ... a vyhledavani neni taky uplne med.

Otazka je, jaky je "zakladni" format dat. Ja mam vlastni, .tt, ale ma
nejaky omezeni. Dalsi popularni je gtfs. Pak je ceska republika... a
jeji silene formaty.

Umim castecne konvertovat gtfs do tt, a castecne cis do tt... a
vyhledavat v tt (rychle i kvalitne).

Dalsi moznost by samozrejme byla naimportovat data do osm a pak hledat
nad tim osm.... ale dost pochybuju ze aktualni system tagovani umi
vyjadrit veci jako "linka jede kazdy sudy utery mezi 1.10 a
15.11.". ... coz je mimochodem centralni problem tech formatu. (A pak
nevim jestli chcem mit v osm informace o vsech jednotlivych odjezdech.)

.tt umi na vyjadreni, kdy spoj jede, RLE komprimovanou bitmasku po
tydnech -- v tom se vyhledava snadno a umi to pomerne kompaktne zapsat
vetsinu rozumnych udaju.

Priklad .tt formatu je dole. Tohle je konverze z CIS.
									Pavel

#  390090_1  (  tmp/1 1.11 )
	06:05	~	0	Tábor,,aut.nádr.
		~	0	Tábor,,poliklinika
		~	0	Tábor,,Křižíkovo nám.
	06:07	~	2	Tábor,,Nový ráj
		~	2	Tábor,,Písecké rozc.
	06:11	~	3	Tábor,,nem.
	06:12	~	4	Tábor,Klokoty,
	06:14		6	Tábor,Všechov,
	06:16		8	Balkova Lhota,,Výrec
				Balkova Lhota,,
				Radkov,,
				Radkov,Paseka,
				Balkova Lhota,,Černý Les
	06:23		10	Balkova Lhota,,Knížata rozc.1.0
	06:26		12	Jistebnice,Vlásenice,
			12	Jistebnice,Vlásenice,Makov rozc.1.5
	06:29		13	Jistebnice,Makov,Pazderna
				Jistebnice,Makov,
				Jistebnice,Hůrka,
	06:31		15	Jistebnice,,Tisová rozc.1.0
	06:33		16	Jistebnice,,Žofín
06:34	06:35		16	Jistebnice,,
	06:38		19	Jistebnice,Zvěstonín,
	06:41		20	Jistebnice,Hodkov,
	06:43		21	Nadějkov,,Petříkovice I
06:45			22	Nadějkov,,
Remarks:  X
#  390090_2  (  tmp/1 1.11 )
	04:30		0	Nadějkov,,

-- 
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html




Další informace o konferenci talk-cz