• AktuálněICT, IS, SW

Data.gov.cz: Perzistentní IRI: nenápadná chyba, která rozbíjí propojení dat

Identifikátory dat mají být pevné jako kotva. V praxi se ale často mění a tím narušují celé datové ekosystémy.

Článek z portálu Data.gov.cz ukazuje, proč je práce s perzistentními IRI klíčová a kde poskytovatelé dat nejčastěji chybují.

Jedním ze základních stavebních kamenů otevřených a propojených dat jsou IRI (Internationalized Resource Identifiers) tedy jednoznačné identifikátory, které umožňují propojit informace napříč systémy. Aby však plnily svou roli, musí být perzistentní, tedy trvalé a neměnné.

Právě zde ale podle článku z portálu data.gov.cz vzniká častá chyba: IRI jsou někdy navázána na technické detaily infrastruktury, například konkrétní úložiště nebo server.

Jakmile se tato infrastruktura změní (např. migrace systému nebo změna provozovatele), změní se i samotné IRI. Tím se přeruší vazby mezi daty, které na těchto identifikátorech závisí.

Důsledky jsou zásadní:

  • ztráta interoperability mezi datovými sadami,
  • nefunkční odkazy v aplikacích,
  • komplikace při integraci dat napříč veřejnou správou.

Správná praxe proto říká, že identifikátory mají být oddělené od fyzického umístění dat. Řešením je využití tzv. referenčních IRI, které zůstávají stabilní a pomocí směrovacích služeb odkazují na aktuální umístění dat. Díky tomu lze data přesouvat bez narušení jejich propojení.

Perzistentní IRI tak nejsou jen technický detail, ale klíčový předpoklad pro:

  • dlouhodobou použitelnost dat,
  • jejich propojitelnost v rámci eGovernmentu,
  • a efektivní sdílení informací napříč systémy.

Celý článek: