Struktury informačních zdrojů: studijní opora

2. Terminologie

Většinu informačních zdrojů můžeme zpravidla chápat jako hierarchicky strukturované celky, jež tvoří strukturované jednotky (entity členěné na označené elementy) obsahující informace.

úrovně granularity

Obr. 2 Úrovně granularity organizovaných zdrojů

médium
  • Jakýkoli prostředek umožňující komunikovat znalosti a informace.
  • Potenciální zdroj informací (má schopnost obsahovat informaci).
informační zdroj / informační pramen / zdroj (information source, information resource, resource)
  • Médium obsahující informaci: prostředek společenské komunikace (tj. médium) tvořený množinou informací a sloužící k jejich fixaci (záznamu) a/nebo přenosu v čase a prostoru
  • Objekt, který je nositelem, zprostředkovatelem nebo šiřitelem informací (knihovna, archiv, počítačová databáze, CD-ROM, databázové centrum, informační středisko, televize, rozhlas, vlastní paměť, osobní informační systém, jiné osoby, jednotlivé dokumenty...)
  • Samostatná jednotka komunikace nebo zpracování informací
dokument
  • Zdroj informací, který má hmotný nosič
  • Druh informačního zdroje tvořený nosičem informací v podobě hmotného předmětu (viz např. https://www.scientificamerican.com/article/dna-data-storage-is-closer-than-you-think/) a množinou uspořádaných dat či informací na něm zaznamenaných, tj. hmotně fixovaných, sloužící k jejich přenosu v čase a prostoru
  • Samostatná jednotka z hlediska obsahu: může se identifikovat, zpracovávat a vyměňovat jako celek (jednotka) mezi uživateli a/nebo systémy.
  • Obvykle je psaný, ale může být též tvořen obrazy nebo zvukem; v elektronické podobě mají dokumenty zpravidla formu souboru nebo záznamu v databázi, případně údajů v datových sadách
  • Dle ISO/IEC 8613: strukturovaná jednotka (entita, množina) obsahující informace, určená pro smyslové vnímání člověkem
kolekce

Též korpus / sbírka / fond / báze / databáze / datová sada/ repozitoř (angl. information store, collection, stock, asset, dataset, repository)
Množina uspořádaných dokumentů.

element (prvek) dokumentu (data/information element, datový/informační element/prvek)
  • Jakákoli část menší než samotný dokument a zároveň větší než základní stavební jednotka (např. bit, pixel)
  • Dle ISO/IEC 8613: Základní jednotka identifikovatelných a definovatelných dat (informací). Má jméno, představované např. tagem, a jednu nebo více hodnot vyjadřujících konkrétní fakt/a prostřednictvím kódů, číslic nebo přirozeného jazyka. Jednotka dat, pro kterou se prostřednictvím množiny atributů specifikují: definice, identifikace, prezentace a přípustné hodnoty.

Elektronické publikování = tvorba (editace) + prezentace + výměna
Editace

Vykonávání činností spojených s vytvářením a změnou struktury a/nebo obsahu dokumentu.

Možnosti vytvoření elektronického dokumentu:

  1. prvotním pořizováním
    např. napsání dopisu na klávesnici počítače s použitím textového editoru (současně vytváříme obsah - text a značky - strukturování či formátování), vyplnění údajů do formuláře
  2. konverzí z externího zdroje
    např. převedení dopisu ve Wordu do PDF, digitalizace tištěných dokumentů
  3. generováním z jiných informací
    např. tvorba reportů (sestav) z dat uložených v databázi, mash-up

Podíl ruční práce, obtížnost algoritmizace: 1 - nejvyšší, 3 - nejnižší

Možnost ovlivnit obsah: 1 - ano, 2 - ne, 3 - zpravidla ne

Prezentace

Realizuje se jen tehdy, pokud bude příjemcem dokumentu uživatel – člověk (není zajímavé pro počítačové aplikace).

  • postup interpretování dokumentu ve smyslově vnímatelné podobě
  • formátování dokumentu na prezentačním médiu

prezentační médium
nosič informace ve smyslově vnímatelné podobě (např. papír, obrazovka počítače)

Výměna (interchange)

Proces přenášení dokumentu ze systému původce do systému příjemce pomocí prostředků datové komunikace nebo výměnou paměťového média. Je zajímavé tehdy, bude-li se dokument předávat mezi dvěma (či více) různými systémy (tj. musí-li v průběhu výměny dojít k překódování, resp. k přeformátování).