Katalog dat České republiky

9.3.2012 · Aktuální zprávy · Bez komentářů »

CKAN logoNalezitelnost a přehlednost jsou po přístupnosti na webu klíčové požadavky na otevřená data. Pokud data uživatel nenajde a nenajdou je ani webové vyhledávače, pak data jakoby neexistovala. Proto vznikají datové katalogy, které pomahájí lidem data najít a uspořádat. O založení Katalogu dat České republiky, stěžejní součásti otevřené datové infrastruktury ČR, se postarala iniciativa OpenData.cz.

Obsah katalogu

Tento zatím neoficiální “veřejný registr” dat byl do světa díky zapojení grantového projektu Vysoké školy ekonomické vypraven s náplní popisující data veřejného sektoru ČR. Obsahuje tak například informace o datových zdrojích o trhu práce nebo o školství. Příkladem dat zaznamenaných do katalogu může být Seznam ekologických včelařů registrovaných u Ministerstva životního prostředí ČR. Patří do něj všechna na webu dostupná data, která jsou vytvářena v České republice a mají alespoň jeden stažitelný zdroj (např. XLS nebo CSV soubor). Nemusí jít o data otevřená, třebaže ta jsou preferována.

Český datový katalog - CKAN

Český datový katalog - CKAN

Datový katalog neobsahuje data samotná, ale pouze jejich popisy. V tom je podobný katalogům v knihovnách, kde sice vlastní texty dokumentů nenaleznete, ale zato se z nich dozvíte například to, jak se k těmto textům dostat. Katalog obsahuje popisná (např. název nebo tagy) a přístupová metadata (např. odkaz, kde jsou data ke stažení). Kromě toho jsou v něm popsány vztahy, které mají data mezi sebou. Katalog například obsahuje vzájemné odkazy, vazby celek/část, propojení mezi daty popisujícími stejné oblasti nebo provázání mezi následnými časovými snímky dat. Zaznamenáním těchto vztahů jsou data zasazena do kontextu, který je umožňuje lépe zpracovat: interpretovat, propojit nebo zkombinovat.

Jeho účelem je zajistit dohledatelnost existujících dat. Ta tvoří předpoklad pro to, aby nebyla vytvářena duplicitní data a pro zprostředkování přístupu k datům, která by jinak někteří uživatelé vůbec nenašli. Katalog by měl být užitečnou pomůckou jak pro tvůrce dat, tak jejich uživatele. Tvůrci mohou jeho prostřednictvím dát uživatelům vědět o datech jimi vytvářených a umožnit tak, aby data byla používána. Zadáním do katalogu se data automaticky promítnou do katalogu dat Evropské unie, takže je mohou nalézt také zahraniční uživatelé. Uživatelům by katalog měl pomoci například při hledání dat z určité oblasti, a to třeba pro tvorbu aplikací na datech založených, analýz, článků nebo studentských prací. Všechny popisy dat obsažené v Katalogu dat České republiky jsou k dispozici ve strukturované podobě přes API a s otevřenou licencí, takže je může použít kdokoli za jakýmkoli účelem.

Software CKAN

Katalog je založen na nástroji CKAN, za nímž stojí Open Knowledge Foundation. Tento software dosáhl stavu de facto standardu pro katalogy dat, kdy na něm běží třeba britský portál data.gov.uk a bude jej používat datový katalog Evropské komise. O jeho českou lokalizaci se postarala Vysoká škola ekonomická. V nejbližší době by český katalog měl být spravován nově vznikající českou pobočkou Open Knowledge Foundation s podporou evropského projektu LOD2 a počítá se s ním pro zapojení České republiky k Open Government Partnership.

Struktura datasetu

Struktura datasetu

Mapování dat České republiky

V katalogu nyní vzniká neúplná mapa dat České republiky. Je v podobném stavu, jako byly středověké mapy; obsahuje spoustu bílých, nepopsaných míst. Množství zdrojů dat, které nemají určenu licenci a nechávají tak uživatele na pochybách, za jakých podmínek je lze použít, představuje neprozkoumané oblasti; “Hic sunt leones” otevřených dat.

Na zlepšení kvality této mapy českých dat se může podílet každý. Nástroj CKAN, na němž katalog funguje, je založen stejných principech jako Wikipedie. Přispět může kdokoli, ale zároveň jsou ukládány všechny změny, k nimž se lze v případě potřeby vrátit. CKAN tak slouží jako platforma pro crowdsourcing; kolaborativní skládání střípků mapy dostupných dat. Cestu kartografa českých dat vám můžou usnadnit dokumenty o práci s katalogem připravené členy OpenData.cz. Na začátečníky čeká návod k CKANu, pokročilí si mohou prohlédnout rovnou detailní metodiku práce se software CKAN. Víte o českých datech, která by si zasloužila více pozornosti? Přidejte je do Katalogu dat ČR.

Přišel vám tento článek přínosný? Přispějte na něj přes Flattr:

Tagy: , , , ,

Přidejte komentář