Systémová analýza: studijní opora

Stránky: Moodle UK pro výuku 1
Kurz: Klasifikace a systémová analýza - AISPV1001
Kniha: Systémová analýza: studijní opora
Vytiskl(a): Nepřihlášený host
Datum: sobota, 4. května 2024, 08.17

Popis

Zpracovala: Helena Kučerová

1. Úvod

Systémový přístup je především díky svému využití v oblasti informačních technologií natolik všudypřítomný, až se stal takřka "neviditelným" pozadím či základnou specifických metod, které už ani nevnímáme. Jeho integrace do teoretických i praktických aktivit souvisejících s životním cyklem informací a znalostí je podmínkou i stimulem jejich dramatického rozvoje v posledním půlstoletí. I v případě procesu organizace znalostí lze konstatovat, že obecným rámcem všech metod organizace znalostí je systémový přístup a jejich obecnou metodologií je systémová analýza.

Připomeňme, že je třeba rozlišovat mezi systémovou analýzou a systémovým přístupem. Systémový přístup [1] je způsobem myšlení, jež chápe předmět svého zájmu jako komplexní celek s vnitřními i vnějšími vztahy. Nemá své vlastní specifické metody ani formální aparát. Obojí je záležitostí až systémové vědy (teorie systémů) jako standardního vědního oboru se specifickým předmětem zkoumání (tj. systémy) a specifickými metodami, jejichž jádrem je systémová analýza.

Význam systémového přístupu, jeho teoretické báze v podobě systémové vědy a aplikace v podobě systémové analýzy konstatují četní autoři. Univerzální charakter systémové analýzy umožňuje její aplikaci prakticky v jakémkoli oboru a je tak významnou podporou interdisciplinarity a transdisciplinarity. Stačí připomenout zdánlivě odtažitý příklad z oblasti humanitních věd: strukturalistická lingvistická škola uplatňovala systémový přístup k jazyku. Systémová věda, jež má sama interdisciplinární charakter, tvoří společný sjednocující rámec, umožňující komunikaci mezi speciálními vědními disciplínami. Kenneth Boulding obrazně nazývá systémovou vědu kostrou vědy, jejímž cílem je „poskytnout rámec nebo strukturu systémů, na něž se zavěsí svalový a oběhový systém jednotlivých disciplín a konkrétních předmětů do řádného a koherentního souboru znalostí“. Zároveň upozorňuje na to, že systémová věda se může stát i "kostlivcem ve skříni" – „skříní v tomto případě je neochota vědy přiznat velmi nízkou úroveň svých úspěchů v systematizaci a její tendence zavírat dveře před problémy a předměty, které nezapadají snadno do jednoduchých mechanických schémat.“[2] Jaroslav Habr a Jaromír Vepřek rovněž konstatují, že „…roste vliv teorie obecných systémů na jiné systémové disciplíny, které tato teorie ovlivňuje jak terminologicky, tak metodologicky. Pro všechny systémové disciplíny mají značný význam práce vedené v teorii obecných systémů na přípravě formálních metajazyků vhodných pro popis pojmů a vztahů mezi nimi.“[3]

Je patrné, že pojmová báze organizace znalostí je zejména ve své části pokrývající organizaci digitálních zdrojů odvozena z pojmového aparátu systémové vědy. Jak bude ukázáno v tématu Kategorizace a klasifikace, systémová věda poskytuje i teoretický a metodologický základ pro kategorizaci v procesu organizace znalostí. Význam systémové vědy pro obor organizace znalostí vyzdvihuje Douglas J. Foskett, který je přesvědčen, že spojením obsahové analýzy a klasifikace se systémovou vědou lze pokrýt veškeré univerzum poznání.[4]



[1] BURIÁNEK, Jiří. Přístup systémový. In: Sociologická encyklopedie [online]. Zdeněk R. Nešpor, ed. Sociologický ústav AV ČR, 2017-12-11 [cit. 2023-02-11]. ISBN 978-80-7330-308-2. Dostupné z: https://encyklopedie.soc.cas.cz/w/P%C5%99%C3%ADstup_syst%C3%A9mov%C3%BD.

[2] BOULDING, Kenneth E. General systems theory – the skeleton of science. In: Management science. April 1956, 2(3), s. 208.

[3] HABR, Jaroslav, VEPŘEK, Jaromír. Systémová analýza a syntéza: zdokonalování a projektování systémů. 2. přeprac. vyd. Praha: SNTL, 1986, s. 52.

[4] FOSKETT, Douglas J. Systems theory and its relevance to documentary classification. In: International classification: a journal devoted to concept theory, organization of knowledge and data, and to systematic terminology. 1980, 7(1), 2-5.

1.1. Definování systému

Postup při definování systému lze na nejobecnější úrovni rozčlenit na následující tři fáze:

1) Vymezení hlediska zkoumání, stanovení cíle systému
Tato fáze se někdy označuje jako vymezení univerza diskurzu[1], případně jako volba úhlu pohledu, perspektivy, aspektu či hlediska. Jejím cílem je odlišení navrhovaného systému od jiných systémů, jež lze na objektu definovat. Toto vymezení je určeno tím, jaký cíl (účel) je systému stanoven.

Příklad: Organizační řád děkanátu FF UK (Opatření děkana č. 6/2020), čl. 2 Poslání děkanátu.

2) Vymezení hranic systému, zahrnutí prvků a procesů
V této fázi probíhá odlišení systému od jeho okolí tím, že se sestavuje seznam prvků a procesů. K tomu můžeme dospět induktivní metodou zvanou bottom-up (od instance ke třídě), deduktivní metodou zvanou top-down (od nejvyšší třídy k instanci), eventuálně uplatněním metody zvané middle-out, při níž se postupuje od nejdůležitějších tříd (tzv. bázové kategorie) „vzhůru“ k nadřazeným třídám a „dolů“ k instancím.

Příklad: Organizační řád děkanátu FF UK (Opatření děkana č. 6/2020), čl. 4 (prvky), čl. 11, 12, 13 (procesy).

3) Proces strukturování
Během této fáze se odlišují podstatné a nepodstatné prvky a procesy a definují se jejich vzájemné vztahy.

Jak je uvedeno v části 2.1, je typickou vlastností systému hierarchická struktura. V rámci hierarchizace systému se uplatňuje sestupná nebo vzestupná příčinná souvislost (angl. downward/upward causation). Sestupná příčinná souvislost spočívá v odvozování vlastností/zákonitostí prvků či subsystémů ze zákonitostí (nadřazeného) systému. Vzestupná příčinná souvislost spočívá v odvozování vlastností/zákonitostí celého systému ze zákonitostí jeho subsystému či prvku.


[1] Viz např. metafora světlometů v ISO/TR 9007 (obr. 3): https://www.brcommunity.com/articles.php?id=b479.

1.2. Typologie systémů

Typologii systémů lze vytvořit

  • podle vlastností prvků, z nichž jsou složeny
  • podle toho, jakého typu jsou vztahy mezi prvky
  • podle stavu a chování systému

Níže uvedené dvojice zpravidla představují krajní póly plynulého spektra. Přiřazení konkrétního systému k určitému typu je navíc často závislé na kontextu a hledisku - z určité perspektivy se tentýž systém může jevit jako složitý a z jiného pohledu jako jednoduchý.

přirozené – umělé

rozlišující kritérium: způsob vzniku objektu (s přispěním / bez přispění člověka; objekt záměrně vytvořený člověkem za určitým cílem se nazývá artefakt)

statické – dynamické

rozlišující kritérium: stabilita stavu systému v čase

abstraktní – konkrétní

rozlišující kritérium: prvky (vlastnosti) a jejich vztah k realitě (pojmy / fyzikální objekty)

uzavřené – otevřené

rozlišující kritérium: vstupy – výstupy (vztah k okolí)

jednoduché – složité

rozlišující kritérium: prvky a vazby (počet)

deterministické – indeterministické (pravděpodobnostní, stochastické)

rozlišující kritérium: chování, resp. možnost jeho předvídání. Chování deterministického systému je určité, chování indeterministického systému je neurčité.

vertikální – horizontální

rozlišující kritérium: vazby (existence / neexistence hierarchických vztahů)

homogenní – heterogenní

rozlišující kritérium: podobnost atributů (vlastností) prvků, funkcí či vztahů

Homogenní systém je složen z částí stejné velikosti, stejného typu. To platí i pro procesy a vztahy v systému. Heterogenní systém tedy tvoří rozdílné prvky/procesy/vztahy.

black box white box

rozlišující kritérium: znalost / neznalost vnitřní struktury systému

„tvrdé“ – „měkké“

rozlišující kritérium: míra určitosti při definování systému


Informační systém

Organizovaný / navržený / řízený / jasně definovaný informační ekosystém.

ekosystém
součást životního prostředí, na niž uplatňujeme systémový přístup

informační ekosystém
součást informačního prostředí
typ ekosystému umožňující komunikaci informací

informační prostředí
součást životního prostředí
informační entity, které obklopují člověka a umožňují komunikaci informací

2. Vymezení základních pojmů

Nejprve stručně připomeneme základní pojmy a principy systémového přístupu, systémové vědy a systémové analýzy.

Proces analýzy, který je jádrem systémové analýzy, se na nejobecnější úrovni chápe jako

„základní myšlenkový postup, který rozkládá vymezený celek na jeho prvky … Klasicky se rozlišuje mezi analýzou ‚látkovou‘ (např. v chemii), analýzou ‚gramatickou‘ a analýzou ‚ideovou‘ či ‚mentální‘ (analýzou nějakého pojmu). V širším smyslu nazýváme analýzou každou metodu, jež se snaží předmět nebo událost vysvětlit z jeho složek.“[1]

Klasický newtonovský (mechanistický) přístup k analýze je konkrétní (ve smyslu výše uvedené definice "látkový") – zajímají nás fyzické komponenty / prvky

  • celek zkoumáme jeho rozdělením na fyzické části a studiem jejich vlastností (tj. redukcionisticky[2])
  • vztahy mezi částmi se neuvažují

Systémový přístup k analýze je abstraktní (ve smyslu výše uvedené definice "gramatický" nebo "ideový", "mentální") – zajímají nás logické komponenty / prvky (tj. pojmy, ideje)

  • celek zkoumáme prostřednictvím vztahů mezi jeho částmi (tj. konstrukčně, synteticky, holisticky[3]) – viz příklad na obrázku 1
  • celek může mít vlastnosti nevyplývající přímo z vlastností jeho částí

DataInformaceZnalosti

Obr. 1 Systémový přístup k vymezení dat, informací a znalostí prostřednictvím jejich vztahů[4]

[1] DUROZOI, Gérard, ROUSSEL, André. Filozofický slovník. Přeložili Jan Binder aj. 1. vyd. Praha: EWA, 1994, s. 11. ISBN 80-85764-07-5.
[2] PETRUSEK, Miloslav. Redukcionismus. In: Sociologická encyklopedie [online]. Ed. Zdeněk R. Nešpor. Praha: Sociologický ústav AV ČR, 2017-12-11 [cit. 2023-02-11]. Dostupné z: https://encyklopedie.soc.cas.cz/w/Redukcionismus.
[3] PETRUSEK, Miloslav. Holismus. In: Sociologická encyklopedie [online]. Ed. Zdeněk R. Nešpor. Praha: Sociologický ústav AV ČR, 2017-12-11 [cit. 2023-02-11]. Dostupné z: https://encyklopedie.soc.cas.cz/w/Holismus.

[4] Zdroj: KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. Praha: Karolinum, 2017, s. 81.

2.1. Systém

Ústředním pojmem systémové analýzy je systém. Autoři významné české monografie Systémová analýza a syntéza Jaroslav Habr a Jaromír Vepřek zformulovali definici, jež výstižně zachycuje všechny podstatné rysy systému:

„Za systém považujeme složitý reálný nebo abstraktní objekt, v němž rozlišujeme části, vztahy mezi nimi, vlastnosti. Vůči okolí vystupuje systém jako celek. Části systému jsou ve vzájemné interakci a interagují i se systémem jako celkem. Označujeme je jako prvky systému a vztahy mezi nimi nazýváme vazbami systému. Pro to, abychom považovali složitý reálný objekt za systém, je rozhodující náš přístup k tomuto objektu, způsob jeho pojetí, způsob práce s ním, nikoli jeho věcná povaha.“[5]

Tento arbitrární charakter systému podtrhuje jeden ze zakladatelů systémové vědy Brian Gaines výrokem „systém je to, co je za systém považováno“.[6] Obecně platí, že jakmile na objektu dokážeme definovat jeho prvky (části) a jejich vztahy, tedy strukturu a fungování objektu, pak jsme do tohoto objektu zavedli systém. Je důležité chápat systém nikoli jako „objektivní“, „reálný“ objekt, ale jako výtvor lidské mysli, myšlenkový artefakt, záměrně vytvářený v procesu poznávání, reprezentace či návrhu nové skutečnosti.

Systém je chápán jako jednota struktury a funkce, jež má definován svůj cíl.

Struktura a funkce

Obr. 2 Systém jako jednota struktury a funkce

Vztah nebo též vazba je jakékoli spojení prvků, funkcí či systémů, jež umožňuje jejich interakci (tj. vzájemné působení).

Strukturou se míní víceméně stálý způsob uspořádání prvků systému, tj. množina prvků a jejich vzájemných vztahů. Typická struktura systémů je hierarchická, tj. systém se skládá z podmnožin zvaných subsystémy. Jako subsystém se označuje systém, který je částí jiného systému. Systém, který obsahuje jiné systémy, se někdy označuje jako supersystém.


[5] HABR, Jaroslav, VEPŘEK, Jaromír. Systémová analýza a syntéza: zdokonalování a projektování systémů. 2. přeprac. vyd. Praha: SNTL, 1986, s. 25.

[6] GAINES, Brian R. General systems research: quo vadis? In: General systems: yearbook of the Society for General Systems Research. 1979, vol. 24, s. 1. Dostupné z: http://pages.cpsc.ucalgary.ca/~gaines/reports/ [cit. 2023-02-11]

2.2. Prvky a funkce

Prvek systému „lze chápat jako primitivní pojem, nebo jej pro naše účely můžeme charakterizovat jako při dané rozlišovací úrovni dále nedělitelnou část celku“[7].

Funkce systému představují procesy, jež jsou opět spjaty vzájemnými vztahy. Množina funkcí systému a jejich vzájemných vztahů se nazývá chování.

Proces je základní dynamická jednotka systému, vymezená svým počátkem a koncem. Základními systémovými procesy jsou proces zpracování, který transformuje vstupy na výstupy, a proces řízení (regulace), jenž upravuje chování systému s ohledem na definované cíle. Podmínkou řízení je fungování zpětné vazby, která poskytuje odpověď na otázku, zda je stav a/nebo chování systému v souladu s jeho stanoveným cílem. Zpětná vazba ovšem není proces, ale informace o výstupu systému, která se vrací zpět jako jeho vstup [8].

Funkce systému

Obr. 3 Funkce systému

Podle typu aktivit v systému jsou rozlišovány následující typy prvků a funkcí:

  • vnitřní neboli interní
  • hraniční – vstupní, výstupní (tj. rozhraní)
    Příkladem hraničního prvku v systému knihovny je knihovní katalog a v něm obsažené selekční údaje (tj. přístupové body)
  • tranzitivní (angl. transient) – procházejí systémem, určitou dobu jsou jeho součástí
  • vnější neboli externí (okolí, prostředí, kontext systému)

Slovo "jednota" z definice systému upozorňuje na to, že prvky ani procesy nemohou v systému existovat izolovaně, ale vzájemně na sobě závisejí. Aby mohl proběhnout proces, potřebuje prvky, na nichž se uskuteční. Prvky systému se zase dynamicky mění v čase a tuto dynamiku realizují právě procesy. Jakkoli jsou ovšem v realitě všechny zmíněné komponenty pevně propojeny vzájemnými vztahy a fyzicky neoddělitelné, díky abstraktní povaze systémové analýzy, jež je analýzou myšlenkovou, si můžeme dovolit uvažovat jednotlivé entity odděleně.

Během systémové analýzy není vždy jednoduché rozlišit, co je prvek a co funkce/proces.[9] Základní rozdíl spočívá v závislosti na čase: zatímco prvek je v každém časovém okamžiku přítomný celý (je trojrozměrný – 3D), proces „prochází časem“ a je v určitém časovém okamžiku přítomný jen v jedné své části (je čtyřrozměrný – 4D). Vztahy celek–část v prvcích a procesech jsou odlišného typu: zatímco součásti prvku (např. maso a brambory jako suroviny, z nichž se uvaří oběd) mohou existovat společně v jednom čase, části procesu tvoří časové úseky (např. aperitiv, předkrm, hlavní jídlo a dezert jako posloupnost chodů oběda), jež nemohou existovat společně v jednom časovém okamžiku či úseku.


[7] HABR, Jaroslav, VEPŘEK, Jaromír. Systémová analýza a syntéza: zdokonalování a projektování systémů. 2. přeprac. vyd. Praha: SNTL, 1986, s. 26-27.

[8] Viz např. konkrétní využití zpětné vazby v tzv. zesilujícím zpětnovazebním učení umělé inteligence pomocí technik RLHF nebo HITL.

[9] V pojmovém aparátu středověké filozofie (s původem v Aristotelově filozofickém systému) se v obdobném smyslu používají termíny endurant a perdurant. Endurant (angl. continuant) označuje prvek a perdurant (angl. event, occurent) označuje proces. Tyto termíny jsou dnes zpopularizované a opětovně používané v ontologickém inženýrství.

2.3. Třída

Třída je množina prvků či funkcí se stejnými vlastnostmi. Obsahem (intenzí) třídy jsou vlastnosti zahrnutých prvků či funkcí, rozsahem (extenzí) třídy je množina zahrnutých prvků či funkcí (instancí).

Důležitou úlohu při definování systému hraje rozlišení třídy a jejího prvku / instance. Z tohoto rozhodnutí vyplývají pro dané entity významné důsledky. Zatímco třídy mohou mít instance, instance už další instance mít nemohou, tj. mají pouze intenzi, nikoli extenzi. Rozlišení třídy a instance je důležité pro určení vztahu mezi těmito entitami: vztah třídy a instance se označuje jako instanční hierarchie, hierarchický vztah tříd může být buď generický nebo partitivní. Určitou pomůckou pro rozlišení třídy a instance se mohou stát specifické typy jejich označení. Pro slovní označení instance se používá vlastní jméno (proprium); v současné literatuře se o instancích často hovoří jako o pojmenovaných entitách.[9] Třídy se označují obecnými jmény (apelativy), v odborném jazyce pak jsou nejčastěji používanými typy obecných jmen termíny.


[9] Viz např. heslo Rozpoznávání pojmenovaných entit v Novém encyklopedickém slovníku češtiny: https://www.czechency.org/slovnik/ROZPOZN%C3%81V%C3%81N%C3%8D%20POJMENOVAN%C3%9DCH%20ENTIT.

2.4. Vlastnost

Vlastnost určuje prvek či funkci po kvalitativní nebo kvantitativní stránce. Určení se děje buď samotnou existencí vlastnosti (např. každý člověk má krevní skupinu) nebo prostřednictvím její hodnoty (např. člověk s krevní skupinou AB Rh negativní).

Tab. 1 Typologie vlastností

(1)
podle
počtu entit
(2)
podle stupně
abstrakce
(3)
podle významu
pro existenci
entity
(4)
z hlediska
definování /
klasifikace
(5)
podle existence
v životním cyklu
entity
(6)
podle
trvalosti
(7)
podle vztahu
ke třídě
(8)
podle funkce
v informačním
systému
(9)
podle
obsahu
atribut abstraktní podstatné nezbytné vnitřní statické sdílené identifikační formální
funkce konkrétní nepodstatné postačující vnější dynamické odlišující popisné obsahové
vztah podstatné vyhledávací

(1) Vlastnosti se obvykle ještě rozlišují podle toho, zda jsou přisuzovány pouze jednomu prvku (například jméno osobě), či zda jsou sdíleny více prvky (například vlastnost autorství sdílená osobou a knihou, vlastnost manželství sdílená dvěma různými osobami). V prvním případě jsou vlastnosti často označované jako (jednomístné neboli unární) atributy (přívlastky) a v druhém případě se v běžném jazyce mluví o (vícemístných, n-árních) vztazích. Zatímco atributy jsou naplňovány nějakými hodnotami (například atribut věk lze naplnit hodnotou "18"), vztahy jsou "naplněny" nějakým prvkem (například vztah manželství je "naplněn" konkrétní osobou manžela/manželky). V souvislosti se vztahy se také někdy mluví o kontextových vlastnostech, protože podávají informaci o souvislosti daného prvku s jinými prvky v jeho okolí.
V rámci objektově orientovaného přístupu se mezi vlastnosti uvažovaných entit počítají i funkce (operace, metody). Funkce jsou dynamickou alternativou k atributům, které jsou chápány jako statické.
V jazyce RDF (Resource description framework) se pro vyjádření hodnoty atributů používá literál, vztahy se vyjadřují odkazem na IRI příslušného objektu.

(2) Další rozlišení vlastností je možné vést v rovině třída – instance. Zatímco třídy mají definované abstraktní vlastnosti (například pes má jméno), instance tříd mají konkrétní vlastnosti "naplněné" hodnotami (například pes má jméno Alík). Někdy jsou hodnoty označovány jako instance vlastností. Norma ISO 704 pro terminologickou práci používá pro odlišení abstraktních a konkrétních vlastností tyto termíny: abstraktní vlastnosti tříd (v terminologii ISO 704 pojmů) nazývá charakteristiky (angl. characteristics) a termínem vlastnosti (angl. properties) označuje konkrétní vlastnosti objektů.[10]

(3) Význam (důležitost) vlastnosti se vztahuje k existenci entity – posuzuje se, zda je vlastnost pro existenci entity nezbytná. Aristotelská tradice rozlišuje vlastnosti podle tohoto kritéria na podstatné (esenciální, tzv. propria) a nepodstatné (tzv. akcidenty).[11] Zjednodušeně řečeno, podstatná vlastnost říká "co to je" a nepodstatná vlastnost vypovídá o tom, "jaké to je". Podstatná vlastnost představuje souhrn obecných stálých určení dané věci. Podstatné vlastnosti spadají pod aristotelskou kategorii podstaty, lze je vyjádřit substantivně. Nepodstatné vlastnosti spadají pod kategorii kvality a lze je vyjádřit pouze adjektivně. Tyto vlastnosti mohou či nemusí být přítomné, aniž by se tím změnila povaha věci, jíž náležejí. Zatímco bez podstatné vlastnosti by prvek přestal být tím, čím je (tj. přestal by patřit do dané třídy), ztráta nepodstatné vlastnosti neovlivní jeho existenci. Kupříkladu jablko nepřestane být jablkem, pokud nebude mít stanovenou prodejní cenu, tato vlastnost je tedy nepodstatná. Pokud by ovšem stejný atribut, tj. prodejní cenu, neměl prodejní artikl v obchodě s ovocem (například to samé jablko jako v předchozím příkladu), přestal by být prodejním artiklem. V kontextu obchodu s ovocem je tedy prodejní cena podstatnou vlastností jablka.

(4) Obdobnou typologii vlastností podává norma ISO 704 pro terminologickou práci, jež uvádí v části 5.4.5 tři typy vlastností objektů, potřebných pro vymezení rozsahu (extenze) třídy: nezbytné (angl. necessary), postačující (angl. sufficient) a podstatné (angl. essential). Vlastnosti nezbytné musí mít každý objekt/instance dané třídy (tvoří podmínku nutnosti). Vlastnosti postačující samy o sobě stačí k přiřazení objektu/instance k dané třídě (tvoří podmínku postačitelnosti). Vlastnosti podstatné splňují jednak podmínky nutnosti, jednak jsou postačující (blíže k tomu v části 4.1).

(5) Podle vztahu k životnímu cyklu entity se vlastnosti člení na vnitřní (vlastní, přirozené, inherentní, angl. intrinsic) a vnější (zevní, cizí, přidělené, angl. extrinsic). Za vnitřní vlastnosti se považují ty, s nimiž objekt vznikl (například krevní skupina osoby, zeměpisná poloha nemovitosti), vnější vlastnosti jsou získané v průběhu jeho existence (například jméno, rodinný stav osoby, aktuální cena nemovitosti).

(6) Podle trvalosti vlastnosti se rozlišují statické (neměnné v čase) a dynamické vlastnosti (proměnlivé v čase – existencí či hodnotou). Například osoba může během svého života změnit jméno (resp. hodnotu atributu jméno), může získat i ztratit řidičské oprávnění, nemůže ovšem přestat mít krevní skupinu. Statické vlastnosti tvoří (statickou) strukturu nazývanou též stav systému, dynamické vlastnosti určují jeho chování.

(7) Z hlediska určení vztahů v systému je významné členit vlastnosti na sdílené a odlišující. Vlastnosti mohou sdílet jak prvky jedné třídy, tak prvky různých tříd. Sdílené (též společné nebo obecné, angl. shared) vlastnosti tak v prvním případě umožňují seskupit prvky do třídy, v druhém případě jsou vodítkem k rozpoznání vztahů mezi třídami. Odlišující (též distinktivní, vymezující, angl. delimiting) vlastnosti umožňují rozpoznat prvky různých tříd. Jinými slovy, sdílené vlastnosti umožňují klasifikaci a odlišující vlastnosti umožňují identifikaci.

Vlastnosti uvedené v bodech (1) - (7) lze považovat za univerzální, jsou rozpoznatelné na libovolné entitě. Následující vlastnosti (8) a (9) se vztahují specificky k informačním zdrojům.

(8) Podle jejich účelu v informačním systému lze vlastnosti rozdělit na identifikační, popisné a vyhledávací. Identifikační vlastnosti věc odlišují od všech ostatních. Popisné vlastnosti tvoří maximální (úplná) množina atributů, které věc reprezentují (zastupují) nebo doplňují. Vyhledávací nebo též přístupové vlastnosti, podle nichž lze věc vyhledat, jsou často označované jako přístupové body (angl. access points). V českém překladu hesláře Ustanovení mezinárodních zásad katalogizace se pro jejich označení používá termín selekční údaj. [12]

(9) Podle vztahu k obsahu či formě prvku se rozlišují vlastnosti formální a obsahové. Formální vlastnosti se zaměřují na vzhled či strukturu objektu, vlastnosti obsahové zachycují jeho význam, smysl. Obsahové vlastnosti informačních zdrojů jsou kupříkladu téma, syžet, libreto, obvykle se označují jako předmět nebo aboutness.

I vlastnosti mohou mít vlastnosti:

Pro označení počtu hodnot vlastnosti se používají termíny násobnost nebo kardinalita. Počet větší než 1 se obvykle nevyjadřuje číselně, ale pomocí zobecňujícího symbolu, např. N, M, *, ∞. Obvyklé jsou způsoby binárního vyjadřování násobnosti vztahů: jedna–jedna (1 : 1, angl. one–to–one), jedna–více (jeden k mnoha, 1 : N, angl. one–to–many), více–jedna (N : 1, angl. many–to–one), více–více (mnohý k mnoha, N : M, angl. many–to–many). Dalším kvantitativním parametrem je tzv. povinnost výskytu vlastnosti či členství (účasti) ve vztahu. Jazyk UML umožňuje vyjádřit současně násobnost i povinnost výskytu vlastnosti: právě 1 (1..1, 1), 0 nebo 1 (0..1), 0 až více (0..*, *), 1 až více (1..*).

Tranzitivitu neboli přenositelnost vlastnosti lze vyjádřit formulí: když platí A→B→C, platí, že A→C. Dalším příkladem tranzitivity je přenos sémantiky vztahu tříd na konkrétní vztah jejich instancí.


[10] Viz výklad vlastností v HAVLÍK, Vladimír. Vlastnost. In: Sociologická encyklopedie [online]. Ed. Zdeněk R. Nešpor. Praha: Sociologický ústav AV ČR, 2017-12-11 [cit. 2023-02-11]. Dostupné z: https://encyklopedie.soc.cas.cz/w/Vlastnost.

[11] ČSN ISO 704. Terminologická práce – Principy a metody. 3. vyd. Praha: Česká agentura pro standardizaci, březen 2018. 92 s. Třídící znak 01 0505.

[12] Ustanovení mezinárodních zásad katalogizace: heslář. 1. česká verze. 2017-08-31 [cit. 2023-02-11]. Dostupné z: https://www.nkp.cz/o-knihovne/odborne-cinnosti/zpracovani-fondu/informativni-materialy/ustanoveni-mezinarodnich-zasad-katalogizace.

3. Vztahy a struktury

Pojem vztahu je natolik obecný, že je velmi obtížné jej definovat jinak než nominálně (tj. vyjádřením pomocí jiných termínů). Pro příklad uvádíme dva výklady z českých jazykových slovníků, jež uvádějí i konkrétní příklady užití slova "vztah" v jazyce:

Slovník spisovné češtiny
vzájemná spojitost, souvislost mezi jevy, poměr
příbuzenský, přátelský, vlastnický vztah; vztah mezi učitelem a žáky; mezilidské vztahy; obchodní, mezinárodní vztahy; ekon. výrobní vztahy
relace
mít (dobrý) vztah k lidem, k práci

Slovník spisovného jazyka českého
(~; ke komu, čemu; mezi kým, čím) okolnost, že někdo, něco je v nějaké souvislosti, spojitosti s někým, něčím jiným; poměr
rodinný, příbuzenský, přátelský, milostný v.; mít dobrý v. k lidem; živý v. k národní minulosti; kladný v. k životu, k práci; v. mezi rodiči a dětmi; v. mezi příčinou a následkem souvislost, spojitost, relace; vzájemné vztahy podniků; vztahy majetkové, hospodářské, obchodní; zahraniční, mezinárodní vztahy; ekon. výrobní vztahy společenské v procesu výroby; zúčtovací vztahy vyjadřující pohledávky a dluhy mezi jednotlivými složkami národního hospodářství; jaz. větný, syntaktický v.

Pojem struktura je na rozdíl od vztahu poměrně snadno definovatelný - jedná se o množinu prvků a jejich vzájemných vztahů. Pro pojmenování rozmanitých celků, jež mohou vzniknout kombinací těchto dvou základních entit, se tradičně používají metaforická označení, například

3.1. Vztahy

1. Vztahy jsou klíčovým pojmem systémové analýzy. Viděno z druhé strany, při určování vztahů je užitečné uplatnit systémovou analýzu.

2. Vztahy jsou založeny na určení vlastností organizovaných prvků, případně na jejich hodnotách. Vztahy jsou vlastnosti, jež jsou sdílené organizovanými prvky. Někdy jsou též označované jako kontextové atributy nebo jako vícemístné (n-ární) predikáty.

Příklad: Prvek Osoba sdílí atribut „autorství“ s prvkem Dílo (osoba je autorem díla, dílo má autora, jímž je osoba).

Podmínkou určení vztahů je tedy poznání prvků, jež jsou ve vztahu. Jsou-li organizovanými prvky zaznamenané znalosti, tj. informační zdroje/dokumenty, je podmínkou určení jejich vztahů obsahová analýza.

3. Formálně úplné vymezení vztahu tvoří tři komponenty: 1. samotný vztah (tj. sdílený atribut), 2. účastník vztahu (tj. prvek nebo třída), 3. role účastníka ve vztahu[1].

Příklad: Vztah mezi osobou a dílem v modelu IFLA-LRM

Popis vztahu:  Vytvoření - Work was created by Agent (Dílo bylo vytvořeno Agentem) / Agent created Work (Agent vytvořil Dílo).
Účastníci vztahu:
LRM-E2 Work (Dílo): https://www.iflastandards.info/lrm/lrmer#E2
LRM-E6 Agent (Agent): https://www.iflastandards.info/lrm/lrmer#E6
Role účastníků:
LRM-R5 was created by (bylo vytvořeno): https://www.iflastandards.info/lrm/lrmer#R5
LRM-R5i created (vytvořil/a): https://www.iflastandards.info/lrm/lrmer#R5i

Agent-Dilo

Obr. 4 Komponenty vztahu

Podle toho, zda jsou role účastníků vztahu stejné nebo rozdílné, rozlišujeme symetrické a asymetrické vztahy.

Podle počtu účastníků vztahu určujeme násobnost (kardinalitu) a aritu vztahu.

4. Definování vztahů prostřednictvím atributů je základem nejdůležitějších procesů organizace znalostí:

kategorizace: vztah ekvivalence atributů prvků, zahrnutých v kategorii (výstup procesu = kritérium členění / kritérium ekvivalence)

identifikace: vztah ekvivalence atributů či hodnot identifikovaných prvků (výstup procesu = identifikátor, primární/cizí klíč, identifikační klíč, vyhledávací klíč)

řazení: vztah posloupnosti hodnot atributů řazených prvků (výstup procesu = řadicí klíč)

strukturování, klasifikace: atributy sdílené více prvky tvoří jejich vztahy

5. Při testování paradigmatických vztahů mezi organizovanými jednotkami uplatňujeme následující postup:

Analýza vztahů

Obr. 5 Postup při určování paradigmatických vztahů

6. Ve vztahu ekvivalence nevyžadujeme totožnost, ale shodu ve vlastnostech (atributech), které považujeme pro daný účel za podstatné.

7. Vztah hierarchie je obecně chápán jako vztah inkluze, tj. zahrnutí (subsumpce) jedné jednotky organizace v druhé (nikoli nadřazenost či podřazenost organizovaných prvků – to je pouze jeden specifický případ hierarchie!). Podle toho, zda může být jednotka zahrnuta pouze v jedné, či ve více jiných jednotkách, se rozlišuje monohierachie a polyhierarchie.

8. Rozlišujeme hierarchii obecnou a speciální.

  • Obecná nebo též extenzionální či hledisková hierarchie znamená, že jedna jednotka organizace má širší/užší rozsah (extenzi) nebo obsah (intenzi) než druhá. Často se uplatňuje u pojmů, u nichž nelze striktně určit význam (zejm. polysémy, vágní, víceznačné pojmy).

Příklady: jídlopomeranč, aritmetikasčítání, budovastřecha, domácí mazlíčcikřeček, třída MDT 023 Řízení a správa knihoven (023 je širší téma, 023.1 je dílčí, užší téma).

  • Speciální („logická“, intenzionální) hierarchie umožňuje na rozdíl od obecné hierarchie odvozování. Uplatňuje se tehdy, pokud jsme schopni rozlišit následující typy hierarchických vztahů:
    • generická (rododruhová, někdy též označovaná jako taxonomická) hierarchie je založena na sdílených atributech: druh „dědí“ vlastnosti „rodu“ a přidává k nim své specifické vlastnosti
      Příklady: strompamátný strom, třída MDT 677.1/.5 Textilní vlákna
    • partitivní (celek – část) hierarchie je založena na seskupování (agregaci či kompozici) částí do větších celků. Vlastnosti nejsou sdíleny, celek i každá část mají svou specifickou sadu atributů.
      Příklad: stromvětevlist
    • instanční (třída–instance, někdy též označovaná jako třída–člen, angl. class–member) hierarchie je specifickým případem generické hierarchie: instance „dědí“ vlastnosti třídy, ale nemá žádné své specifické vlastnosti. Z hlediska rozsahu (extenze) představuje množinu o jednom prvku. V obdobném smyslu se v počítačové lingvistice používá termín pojmenovaná entita (angl. named entity) a v knihovnictví termín autorita (viz např. termín jmenná autorita v TDKIV). Instance bývají často označeny vlastními jmény (viz např. možnost použití individuálního zpřesnění v tabulce pomocných znaků 1h v MDT).
      Příklady: památný stromDub letní v Modřanech (50°0′15,28″ s. š., 14°24′58,92″ v. d.), třídník MDT 004.42 Počítačové programy-004.42Excel

9. Rozlišujeme odvozování deduktivní a induktivní:

  • Deduktivní odvozování směřuje od obecné (zahrnující) třídy ke třídě specifické (zahrnuté), přičemž všechny vlastnosti obecné třídy jsou přeneseny na specifické třídy. Tedy: ze znalosti vlastností obecné třídy usuzujeme na vlastnosti specifické třídy.
  • Induktivní odvozování směřuje od specifických (zahrnutých) tříd ke třídě obecné (zahrnující), přičemž vlastnostmi obecné třídy se stanou vlastnosti společné všem specifickým třídám. Tedy: ze znalosti vlastností specifických tříd usuzujeme na vlastnosti obecné třídy.

10. Pro určení, zda se skutečně jedná o generickou hierarchii, se doporučuje použít pomůcku „všichni – někteří“.

Příklad: hlodavcikřeček (všichni křečci jsou hlodavci, někteří hlodavci jsou křečci).
Tip: Vyzkoušejte, zda platí i pro dvojici domácí mazlíčcikřeček.

11. Pro rozlišení generické a instanční hierarchie se doporučuje zjistit, zda entita ve vztahu má ještě nějaké své specifické vlastnosti (kromě specifického označení) a/nebo zda může mít instance. Pro instanční hierarchii nelze použít pomůcku „všichni – někteří“.

Příklady: standardISO 690, státItálie, křečeknáš křeček Ferda, souborhttps://www.ff.cuni.cz/wp-content/uploads/2021/09/od-2011-2021-20harmonogram-20ar-202021-2022-20filozofick-c3-a9-20fakulty-20univerzity-20karlovy-.pdf.

12. Správně vytvořené definice podle vzorce "nejbližší rod – specifické rozdíly" jsou založeny na generické hierarchii.

13. Podle normy ISO 25964-1 jsou paradigmatické a monohierarchické partitivní vztahy, jež umožňují odvozování, omezeny na úzce vymezenou množinu objektů:

  • geografická místa
    Příklad: Třída MDT (438) Polsko
  • tělesné systémy a orgány
    Příklad: Třída MDT 591.43 Orgány výživy
  • disciplíny nebo oblasti rozpravy
    Příklad: Třída MDT 61 Lékařské vědy
  • hierarchické společenské struktury
    Příklad: Třída MDT 356/358 Jednotlivé druhy pozemních a leteckých vojsk

Ostatní typy partitivních vztahů (např. omeleta-vejce-skořápka, fotbalové utkání-rozhodčí, třída MDT 692 Konstrukční části a prvky staveb) jsou považovány za syntagmatické a odvozování neumožňují (např. to, že je skořápka součástí vejce, neznamená, že je i součástí omelety). Části definované v těchto typech vztahů mohou být začleněny do více různých celků (např. vejce může být součástí i jiných pokrmů než omelety), tj. umožňují polyhierarchii.


[1] Viz např. Kódy rolí MARC [informativní materiál zpracovaný v Národní knihovně ČR]. 2013-05-14 [cit. 2024-04-03]. Dostupné z: https://www.nkp.cz/o-knihovne/odborne-cinnosti/zpracovani-fondu/informativni-materialy/kody-roli.

3.2. Principy řazení

Proces řazení řeší problém uspořádání ekvivalentních prvků zahrnutých v rámci třídy / kategorie. Vždy uvažujeme jednu a právě jednu kategorii – nechceme tedy například studijní obory dále členit na subkategorie. Přestože uvnitř kategorie si jsou „všechny prvky rovny“ (jsou ekvivalentní – viz požadavek homogenity), při prezentaci (knihy na regále, záznamy v rešerši, studenti přihlášení na předmět, přehled literárních žánrů) potřebujeme prvky lineárně sekvenčně seřadit (angličtina to rozlišuje pomocí termínů categorize/classify  x  sort/rank; uvažujeme-li o kategorii v pojmech teorie množin, použili bychom termín uspořádaná množina).

V oblasti organizace znalostí jsou nejvýznamnějšími případy procesu řazení organizace obsahu indexových souborů a prezentace výsledků vyhledávání.

I v procesu řazení se uplatňuje systémový přístup, tj. rozlišujeme, co je (řazený) prvek, co je jeho atribut a co je hodnota atributu, podle níž se řadí. Během procesu řazení definujeme následující:

1) předmět řazení

2) řadicí / třídicí klíč

3) princip řazení

4) směr řazení

5) pořadí atributů ve složeném klíči

Atribut nebo kombinace atributů, jejichž hodnoty jednoznačně určují pozici prvku v řazené množině, se nazývá řadicí / třídicí klíč (angl. sort key). Jeho vlastnosti jsou stejné jako vlastnosti identifikátorů:

  • svou hodnotou odlišuje jednotlivé členy kategorie mezi sebou
  • je jednoznačný – nesmí mít 2x stejnou hodnotu
  • je minimální – žádný atribut z něj nelze vypustit
  • musí vždy obsahovat hodnotu
  • je perzistentní (trvalý) – jeho hodnota se v průběhu „života“ entity nemění

Stejně jako v případě identifikace lze i pro řazení použít složený klíč (angl. nested sorting/ordering - zanořené třídění), tj. kombinaci hodnot více atributů.

Řešené problémy složených klíčů:

1) princip řazení pro jednotlivé atributy složeného klíče
2) pořadí atributů

Příklad:

Složený klíč pro řazení přehledu kurzů v LMS Moodle UK

Vyjádření příkazu k seřazení seznamu kurzů v jazyce SQL (používáme kombinaci atributů fakulta, katedra, kurz, rok):

ORDER BY fakulta ASC, katedra ASC, kurz ASC, rok DESC

Analogický problém se řeší při lineární prezentaci vícekriteriálního fasetového třídění (tzv. citační pořadí).



Nejčastější principy řazení:
  • podle označení (tj. formální kritérium založené na formátu znaků, jimiž je vyjádřena hodnota atributu): abecední, číselné (např. abecední řazení názvů knih, číselné řazení údajů o naměřené teplotě)
  • podle složitosti (např. od jednoduchého k složitému) - souvisí s teorií integrativních úrovní
  • podle obecnosti (např. od obecného k zvláštnímu, od celku k části) - založeno na principu hierarchie
  • podle posloupnosti vývoje (evoluční princip) či pořadí (např. řazení zastávek tramvaje č. 3 v Praze)
  • prostorový, geografický či geometrický princip - viz principy sousedství v prostoru S. R. Ranganathana (např. Severní Evropa: Švédsko, Finsko, Norsko…)
  • chronologické (např. dny v týdnu), historické uspořádání
  • podle velikosti (např. oděvy)
  • podle frekvence použití (popularity) nebo podle pravděpodobnosti požadavku (obvykle vychází z průzkumu uživatelského chování, např. průzkumy MHD, marketingové výzkumy, analýza uživatelských logů…)
  • podle relevance
  • tzv. kanonický způsob – arbitrární řazení podle zavedených konvencí a nikoli podle atributu řazených objektů (např. posloupnost knih v bibli, pořadí písmen v abecedě)

Ve všech případech řazení se ještě volí směr - vzestupné nebo sestupné řazení.

Principy nápomocného pořadí S. R. Ranganathana

Princip pozdějšího v čase
Princip pozdějšího ve vývoji
Principy sousedství v prostoru
    Princip zdola nahoru
    Princip shora dolů
    Princip zleva doprava
    Princip zprava doleva
    Princip ve směru hodinových ručiček
    Princip proti směru hodinových ručiček
    Princip z okraje do středu
    Princip od středu k okraji
    Princip od dané pozice
Principy kvantitativního měřítka
    Princip zvyšování množství
    Princip snižování množství
Princip rostoucí složitosti
Princip kanonického pořadí
Princip "literary warrant"
Princip abecedního pořadí


Zdroje

KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. 1. vyd. Praha: Karolinum, 2017.
Kapitola 3.1.6 Řazení, s. 135-137.

ČSN 97 6030. Abecední řazení. Praha: Český normalizační institut, 1994. Třídicí znak 97 6030.

ČSN ISO 7154. Dokumentace – Zásady bibliografického pořádání. Praha: Český normalizační institut, 2003. 15 s. Třídicí znak 01 0141.

Principy abecedního řazení v češtině v Internetové jazykové příručce. http://prirucka.ujc.cas.cz/?id=885

3.3. Typy struktur

element strukturní prvek (dokument, záznam, či jejich prvky - elementy)

Lineární, stromové a síťové struktury

Lineární, stromové a síťové struktury jsou založeny na teorii grafů. Přístup k datům je realizován technikou navigace. Tato technika umožňuje přímý přístup (skok) od jednoho souvisejícího prvku ke druhému. Vztahy mezi prvky struktury jsou trvalé: vazby ve všech předpokládaných směrech jsou definovány před vyhledáváním/přístupem. Chceme-li vyjádřit jiné vztahy mezi prvky, musíme celý soubor fyzicky přeuspořádat.

graf (diagram)
určitý útvar (rovinný, prostorový), znázorňující vztahy (vazby, relace) mezi prvky systému prostřednictvím množiny uzlů a hran

uzel (angl. node)
při znázorňování grafu v rovině se uzly zobrazují zpravidla jako body této roviny
hrana (angl. edge)
spojnice dvou uzlů v grafu, popř. čára začínající a končící v témže uzlu (tzv. smyčka); hrany značíme koncovými uzly
cesta
posloupnost navazujících hran

Typy grafů

a) souvislý – nesouvislý

souvisly       nesouvisly
 souvislý graf   nesouvislý graf

 

souvislý graf: mezi každými dvěma uzly existuje alespoň jedno spojení (mezi libovolnou dvojicí uzlů existuje nějaká cesta)

b) orientovaný – neorientovaný

orientovany         neorientovany
orientovaný graf neorientovaný graf

hranám je/není přiřazena orientace (směr)
orientovaný graf (angl. directed graph) - též usměrněný graf, postupový diagram

c) ohodnocený – neohodnocený

ohodnoceny         neohodnoceny
ohodnocený graf neohodnocený graf

hranám či uzlům jsou/nejsou přiřazeny hodnoty
ohodnocená (angl. labeled) hrana či uzel: má přiřazenu sémantiku, tj. jednu nebo více hodnot (např. trvání, nároky na zdroje, vzdálenost, čas, náklady...)

d) hranově definovaný – uzlově definovaný

činnost/data (zdroj, informaci), jež chceme grafem znázornit, zobrazují buď hrany nebo uzly

Lineární (sekvenční) struktura

linearni struktura

Všechny údaje stejného typu jsou ukládány sekvenčně (za sebou) do jednoho souboru.

vztahy mezi strukturními prvky:

  • mezi údaji není žádný vzájemný vztah kromě posloupnosti jejich uložení (vztah sekvenční asymetrické asociace)
  • 1 : 1 - každý prvek může mít max. 1 následující a 1 předcházející, příp. 1 nadřazený a 1 podřazený prvek

technika přístupu:

sekvenční procházení celým souborem (dokumentem, kolekcí, databází) od začátku až do konce

klad   zápory
jednoduchost návrhu   
  • nemožnost vyjádření vztahů 1 : N a N : M (pouze za cenu redundance dat)
  • problémy s integritou dat
  • neexistuje způsob, jak přímo vyhledat určitý údaj (nutnost sekvenčního prohledávání)
  • obtížnost dodatečných změn struktury (celý soubor je nutné fyzicky znovu uspořádat)

užití standardy
  • zálohy dat (sekvenční ukládání na magnetickou pásku)
  • fulltextové systémy (doplněné indexovými soubory)
ISO 2709 – výměnný formát pro bibliografické záznamy

Stromová (hierarchická) struktura

terminologie: strom (angl. tree), kořen (angl. root), větev (angl. branch), potomek (angl. child), sourozenec (angl. sibling), rodič (angl. parent), list (angl. leaf)

stromová struktura

Údaje stejného typu jsou umístěny v jednotlivých úrovních. Mezi úrovněmi jsou definovány vztahy inkluze (nadřazenosti a podřazenosti). Prvek hierarchicky nadřazený může souviset s libovolným počtem prvků v podřazené úrovni, prvek v podřazené úrovni může souviset pouze s jedním hierarchicky nadřazeným prvkem.

vztahy mezi strukturními prvky:

  • 1 : N - jednosměrné (k podřazeným prvkům lze přistupovat pouze přes nadřazené prvky)
  • rodičovský vztah - synovský prvek obsahuje data, která doplňují rodičovský prvek

technika přístupu:

sekvenční procházení zvolenou větví stromu

klady   zápory
  • možnost vyjádřit hierarchické vztahy (nadřazenost - podřazenost, celek - část, 1 : N)
  • rychlejší vyhledávání dat (neprohledává se celý dokument, ale jen příslušné části - větve)
  
  • nemožnost jednoduchého vyjádření vztahů N : M mezi prvky (bez duplicit)
  • strukturu je třeba předem pevně stanovit
  • obtížnost dodatečných změn struktury
užití standardy
  • indexové soubory
  • HTML a XML dokumenty
  • objektově orientovaná technologie
ISO 8879 – SGML
HTML
XML

Typy hierarchických struktur

a) podle sémantiky vztahů (podrobněji viz kapitola 3.1 Vztahy)

založeno na nepodstatné vlastnosti
obecná, hledisková hierarchie
  založeno na podstatné (esenciální) vlastnosti
speciální, "logická hierarchie
  • vyjadřuje pouze vztah zahrnutí (inkluze) užší - širší obsah / rozsah
  
  • generická: zahrnutí rod - druh + dědičnost vlastností + vlastní specifické vlastnosti (vztah třída - třída)
  • instanční: zahrnutí + dědičnost vlastností + specifické označení (vztah třída - prvek)
  • partitivní: zahrnutí celek - část + rozdílné vlastnosti (vztah třída - třída)

b) podle počtu kritérií členění

stejné kritérium na všech úrovních členění
různá kritéria na různých úrovních členění
  • stromová (angl. tree) hierarchie
  • postupné zvyšování / zjemňování specializace / granularity
  
  • vnořená/zanořená (angl. nested) víceúrovňová / vícestupňová hierarchie
  • řetězení
Příklad - třídy MDT zahrnující textilní vlákna členěné jednotně na všech úrovních podle původu vlákna:    Příklad - třídy MDT zahrnující oděvy členěné na první úrovni podle určení (kdo nosí oděv) a na druhé úrovni podle stylu oděvu:
      
strom    nested


c) podle řešení složených témat
 

enumerativní
  fasetová (podrobněji viz kapitola 6 Fasetová analýza)
Příklad - třídy MDT zahrnující textilní vlákna:
677.1/.5 Textilní vlákna
    677.1/.3 Přírodní vlákna
        677.1/.2 Rostlinná vlákna
            677.1 Lýková vlákna
            677.2 Rostlinná vlákna ze semen nebo plodů
            677.3 Živočišná vlákna
                677.31 Ovčí vlna
            677.4 Umělá vlákna. Chemická vlákna
            677.5 Minerální a kovová vlákna. Pletivové materiály. Gumová vlákna. Papírové příze
              677.51 Přírodní minerální vlákna
              677.52 Umělá minerální vlákna
              677.53 Kovová vlákna
              677.54 Rostlinné materiály pro pletení a splétání
              677.55 Vlákna z gumy a podobných elastických materiálů
              677.57 Papírová vlákna a papírové příze
   Příklad - hypotetická fasetová struktura pro dané třídy MDT zahrnující textilní vlákna:
   původ vlákna materiál vlákna užití vlákna
   přírodní
   rostlinný
   živočišný
   nerostný
umělý  

guma
kov
lýko
minerál
papír
plod
semeno
vlna
pletení
splétání


Síťová struktura

síťová struktura

vztahy mezi strukturními prvky:

  • 1 : N, N : 1, N : M - obousměrné
  • každý prvek může být spojen libovolným způsobem se všemi ostatními prvky

technika přístupu:

sekvenční procházení zvolenou cestou v síti

klady   zápory
  • flexibilita při vytváření vztahů 1 : N, N : 1 a N : M
  • rychlé vyhledávání (neprohledáváme celý dokument, ale sledujeme přímou cestu k danému prvku stanovenou definovanou vazbou - přímé skoky)
  • odstranění duplicity údajů
  
  • vzájemné vztahy mezi množinami se mohou stát velmi komplikovanými a obtížně se mapují
  • strukturu je třeba předem pevně stanovit: jakmile je vytvořena, každá změna na jiný systém množin vyžaduje vytvoření zcela nové struktury
  • umožňuje rychle zodpovídat pouze předem připravené dotazy, komplikované dotazy vyžadují provést více kroků
užití standardy
  • hypertext, hypermédia
  • World Wide Web (uzly = zdroje/dokumenty, hrany = hypertextové odkazy)
  • znalostní grafy
CODASYL
RDF

Relační struktura

relační struktura

vztahy mezi strukturními prvky:

  • data jsou organizována do uspořádaných n-tic
  • možnost vyjádřit všechny typy vztahů (1 : 1, 1 : N, N : 1, N : M) prostřednictvím stejných údajů v dvojici položek v souvisejících záznamech
  • technická (fyzická) realizace: relace (podmnožina kartézského součinu)

technika přístupu:

množinové operace nad množinami vybraných sloupců a řádků (projekce, selekce, spojení, průnik)

klady:

  • flexibilita při vytváření vztahů mezi různými prvky (spojení není trvalé - vztahy definujeme až v okamžiku, kdy je potřebujeme např. k zodpovězení dotazu)
  • jednoduchost
  • změna struktury spočívá v pouhém přidání nebo zrušení sloupce v tabulce a nijak neovlivní ostatní tabulky (přínos pro zachování integrity dat)
  • neprocedurálnost (určujeme, co chceme s daty dělat, nikoli, jak toho dosáhnout)

zápory:

  • nároky na paměť a výkon počítače (pracuje se neprocedurálním způsobem s celými množinami dat)
  • neefektivní vyhledávání: načítáme nejprve do paměti celé množiny dat, z nichž pak vybíráme průnik

užití: transakční (relační) databáze

standardy:

ISO/IEC 9075 – SQL

4. Pravidla správné analýzy

Způsoby správného analytického uvažování na vysoké úrovni abstrakce tradičně zkoumá logika. V průběhu používání analytické metody v nejrůznějších oblastech se vyprofilovala řada pravidel, jejichž dodržování zvyšuje pravděpodobnost kvality a využitelnosti výsledků analýzy. Jedná se v podstatě o požadavky na ideální třídy/kategorie/pojmy, jež by měly být jasně ohraničené a jednoznačně definované/identifikované, co do způsobu dělení úplné (vyčerpávající) a vzájemně se vylučující, co do míry souvislosti zahrnutých prvků soudržné, vytvořené podle jednotného kritéria členění, a homogenní, tj. se stejnou úrovní granularity a stejnou úrovní abstrakce. Lze konstatovat, že tyto požadavky lze vztáhnout jak na analyzovaný celek, tak na jeho části a na jejich vzájemné vztahy.

V procesu organizace znalostí se principy správné analýzy uplatňují během obsahové analýzy organizovaných jednotek a samozřejmě v průběhu návrhu systému organizace znalostí. Při uplatňování principů správné analýzy v oboru ontologického inženýrství jde nejčastěji o jejich aplikaci v průběhu návrhu páteřní taxonomie, jejímž základem je konceptualizace (tj. tvorba ontologických tříd) a definování rododruhových vztahů, tj. generické hierarchie.

4.1. Jasné ohraničení

Tento požadavek se týká určení hranic analyzovaného celku i jeho částí. Každou třídu je třeba jednoznačně definovat v prostoru (rozsahem) a v čase. Hledáme tedy odpovědi na otázky: Které prvky do třídy patří a které ne? V jakém období / při jaké události je prvek součástí třídy? V jakém kontextu třída existuje? Například pro třídu "Čtenář" mohou být k dispozici tato vymezení: Čtenář je ten, kdo umí číst. Čtenář je ten, kdo právě čte. Čtenář je ten, kdo je registrovaným uživatelem knihovny. Čtenář je ten, kdo předčítá text audioknihy. Čtenář je ten, kdo poslouchá text audioknihy. Je zjevné, že každé z vymezení ohraničí jinou množinu objektů.

Tradičním nástrojem jednoznačného vymezení jsou identifikátory a definice, v ontologickém inženýrství plní tuto úlohu axiomy.

Definice je "relativně úplné, závazné a postačující vystižení obsahu pojmu (definiendum) jinými pojmy (definiens)"[1].

Správně vytvořené intenzionální definice podle vzorce „nejbližší rod – specifické rozdíly“ jsou založeny na generické hierarchii.

Příklad:

ÚISK FF UK Praha je škola pro budoucí informační profesionály.

nejbližší rod: škola

druhové rozdíly: pro budoucí informační profesionály

definice

Při striktním vymezování členství ve třídě lze na správně definované třídy uplatnit požadavek splnění logické podmínky nutnosti a logické podmínky postačitelnosti.

Podmínka nutnosti znamená: Jestliže je něco prvkem dané třídy, musí to nutně splňovat (všechny) stanovené podmínky. Jinými slovy, podmínka nutnosti definuje množinu vlastností povinných pro každý objekt v extenzi dané třídy. A platí jen tehdy, platí-li současně B. B je tedy nutnou podmínkou pro A. B implikuje A, B => A.

Příklad: Aby bylo možné říci o nějakém objektu, že je to kopretina (A), musí to být květina (B), tj. musí mít všechny vlastnosti, které má květina.

Podmínka postačitelnosti znamená: Jestliže něco splňuje stanovené podmínky, musí to být prvkem dané třídy. B platí jen tehdy, platí-li současně A. Není přitom nutné, aby tuto podmínku splňovaly všechny prvky dané třídy.

Příklad: Stačí, že jsme zjistili, že daný objekt je kopretina (A), tj. že má všechny vlastnosti kopretiny, a můžeme o něm tvrdit, že je to květina (B). Přitom není nutné, aby vlastnosti kopretiny měly všechny ostatní květiny, tj. aby to byla květina, nemusí to být kopretina.

Pokud jsou splněny obě podmínky současně, je vymezení třídy tzv. úplné. A je ekvivalentní B, A<=>B.

Třídy splňující podmínky nutnosti a postačitelnosti jsou někdy označovány jako monotetické, na rozdíl od tříd polytetických, v nichž tyto striktní podmínky nejsou uplatněny.



[1] NOVÁK, Lukáš, DVOŘÁK, Petr. Úvod do logiky aristotelské tradice. 1. vyd. České Budějovice: Teologická fakulta Jihočeské univerzity v Českých Budějovicích, 2007, s. 94. Opuscula; 5. ISBN 978-80-7040-959-6.

4.2. Úplnost

Části mají v úplnosti zachycovat celý rozsah analyzovaného celku. Úplné (angl. complete, exhaustive) členění zaručuje, že jsou vyjmenovány všechny prvky, které mohou příslušet do dané třídy. Jinými slovy, všechny instance či exemplifikace třídy musí být obsaženy v některé z jejích částí. V neúplném (angl. incomplete) členění může nastat i výskyt takového prvku, který není předem definován.

uplne cleneni

   

      

        neuplne cleneni

Obr. 6 Úplné a neúplné členění automobilů

Aplikace úplného a neúplného členění v organizaci znalostí a v ontologickém inženýrství vyplývá z přijetí logického předpokladu uzavřeného nebo otevřeného světa. Předpoklad uzavřeného světa v logice považuje vše, co není vyjmenováno, za nepravdivé. Předpoklad otevřeného světa připouští, že mohou existovat ještě jiné prvky třídy než ty, které jsou v ní uvedeny, a považuje je z hlediska pravdivosti za nerozhodnutelné. To má své důsledky ve způsobu odvozování (usuzování) v takto koncipovaném systému – v tzv. monotónním a nemonotónním usuzování. Zatímco monotónní usuzování vyžaduje při doplnění nových prvků zachovat beze změny stávající znalosti, nemonotónní usuzování připouští, že na základě nově přidaných prvků mohou být dosavadní prvky revidovány jak z hlediska svého obsahu, tak co do své příslušnosti ke třídě.

Pragmatickým způsobem řešení problému neúplného členění v praxi je doplnění třídy "ostatní", "jiné" či "různé", určené k zatřídění všech nevyjmenovaných prvků.

4.3. Vzájemně se vylučující části

Fenomén vylučujícího (disjunktního, angl. disjoint, mutualy exclusive, non-overlapping) a překrývajícího se (angl. overlapping) členění má své teoretické základy ve formální logice, v booleovské algebře a v množinové teorii. Vychází z principů, na nichž jsou založeny logické spojky disjunkce (konkrétně tzv. vylučující disjunkce označovaná symbolem ∨, resp. vzájemně disjunktní množiny, tj. ty, jejichž průnik označovaný symbolem ∩ představuje prázdná množina) a konjunkce (označovaná symbolem ∧).

disjunktním členění platí pravidlo "buď/nebo" (označované symbolem XOR) – prvek může být členem pouze jedné třídy. V rámci požadavku na vylučující se části lze ještě rozlišovat mezi vylučováním obsahovým (intenzí) a rozsahovým (extenzí). V prvním případě požadujeme vylučující se definice obsahu tříd, vlastnosti jedné třídy nemá mít žádná jiná. Požadavek na nepřekrývající se rozsah spočívá v tom, že prvek, zařazený do jedné třídy, už nezařazujeme do žádné jiné – požadujeme vylučující se extenze tříd.

disjunktní členění

Obr. 8 Disjunktní členění obuvi v e-shopu podle velikosti

Překrývající se členění umožňuje, aby jeden prvek byl zařazen do více než jedné třídy. Platí zde pravidlo "a zároveň" (označované symbolem AND). Jinými slovy – jedna instance může být členem více tříd (například kočka může být zařazena jak mezi šelmy, tak mezi domácí mazlíčky).

Příklad:
Při členění publikací na knihy a seriály lze přijmout rozlišující kritérium: knihy mají ISBN, zatímco seriály ISSN. Kam ale zařadit tuto publikaci, která má ISBN i ISSN?

4.4. Soudržnost

Členění má být sémanticky homogenní a konzistentní. V každé třídě mají být jen prvky, jejichž vlastnosti spolu těsně souvisejí. Soudržnost (koheze, koherence, bezespornost) má panovat jak uvnitř částí, tak mezi nimi navzájem, tj. ve vztazích.

Níže uvedená třída Osoba obsahuje množinu nesoudržných vlastností: atributy jménoOsoby a datumNarození jsou vlastnosti jiného typu, než manžel/ka, zaměstnavatelOsoby, objednanýProdukt a vystudovanáŠkola. V prvním případě se jedná o unární atributy, ve druhém případě o sdílené vlastnosti, vyjadřující vztah instance třídy Osoba k instancím jiných tříd. Specifickým případem je "manžel/ka", což opět není unární atribut osoby, ale vztah (tj. manželství) dvou instancí třídy Osoba.

Protože požadavek soudržnosti je snadnější splnit u jednodušších objektů s malým počtem homogenních vlastností, doporučuje se pro dosažení soudržnosti dekomponovat komplexní objekty na menší části propojené jasně definovanými vztahy.

    

Soudrznost

      

         => 

  

dekompozice

Obr. 7 Příklad dekompozice třídy Osoba

4.5. Homogenita - stejná úroveň granularity

V rámci tohoto pravidla je požadována homogenita rozsahu (extenze) tříd.

V kontextu klasifikačních schémat se podle míry podobnosti vlastností či velikosti částí, nejčastěji však podle počtu částí, na něž je členěn celek, rozlišují klasifikace homogenní a heterogenní. Zatímco homogenní klasifikace je tvořena na každé úrovni a v každé větvi stejným počtem prvků, heterogenní klasifikace má rozdílný počet prvků. Z hlediska potenciálních změn v budoucnu je homogenní klasifikace lépe předvídatelná a plánovatelná, heterogenní klasifikace ale zpravidla lépe odpovídá skutečné povaze analyzované reality.

4.6. Homogenita - stejná úroveň abstrakce

Podmínkou dodržení tohoto pravidla je homogenita obsahu (intenze) tříd na jedné úrovni hierarchie i v rámci různých úrovní členění. Obdobou tohoto pravidla je požadavek minimální syntaktické vzdálenosti mezi pojmy na stejné úrovni hierarchie, který stanoví, aby každý z těchto prvků byl definován pomocí stejných primitivů (konstrukčních prvků) a vzorů.

škola

Obr. 9 Nehomogenní granularita a abstrakce prvků v analýze školy

4.7. Homogenita - jednotné kritérium členění

Požadavku na jednotné kritérium členění je zpravidla obtížné vyhovět u komplexních objektů. Jeho splnění u složitého analyzovaného celku umožňuje technika fasetové analýzy.

Auta fasetyTridy fasetyText

Obr. 10 Nejednotné kritérium členění automobilů a jeho řešení pomocí fasetové analýzy

5. Principy systémové analýzy a jejich aplikace v organizaci znalostí

Kromě procesů kategorizace a klasifikace se v organizaci znalostí principy systémové analýzy uplatňují především v procesu návrhu systémů organizace znalostí (analogicky to platí i pro proces návrhu ontologií v ontologickém inženýrství).

Kupříkladu fakt, že jeden celek (soubor, množinu věcí) lze uspořádat různými způsoby, je aplikací obecného pravidla, že nad jedním objektem lze definovat více systémů.

Principy v kapitole 5.2 doplňují k obecným pravidlům systémové analýzy, popsaným v kapitole 4, ještě charakteristiky umožňující efektivní používání a správu systému organizace znalostí / ontologie v praxi. Požadavky na "ideální" systém lze kromě požadavků odvozených z logiky ještě doplnit o následující pragmatičtěji stanovené vlastnosti: interoperabilita, sémantická síla, jednoduchá struktura, flexibilita.

5.1. Aplikace systémových pojmů

Systém = struktura a funkce. Struktura = prvky a vztahy. Prvky mají vlastnosti.

Ve všech procesech organizace znalostí, založených na systémové analýze, je nezbytné jednoznačně rozlišit, co je třída/kategorie, co je prvek/instance, co je vlastnost/predikát/atribut a co je hodnota atributu.

Základní pojmy:       Odvozené pojmy:
Třída
Prvek
Atribut
Hodnota
  Vztah
Metadata
Faseta

1. Prvek <je instancí> třídy.

Třída/kategorie je množina prvků se stejnými vlastnostmi/atributy.

2. Prvek/třída/kategorie <má> vlastnost/atribut.

Atribut je vlastností prvku nebo třídy.

Třídy mohou existovat samostatně (bez atributů), atributy nikoli. Každý atribut musí patřit do nějaké třídy (tj. má definiční obor, angl. domain).

3. Vlastnost/atribut <má> hodnotu (tj. obor hodnot, angl. range).

Třídy ani prvky nemají hodnoty.

4. Vztah <je> atribut patřící více prvkům nebo třídám.

Vztahy jsou vlastnosti, jež jsou sdílené prvky systému a prvky jeho okolí (kontextu).

5. Metadata = atributy + hodnoty.

Metadata jsou informační zdroj, který se vztahuje k vlastnostem jiného informačního zdroje.

6. Atribut nebo třída => faseta

Fasetu je možné chápat jako kritérium členění odvozené z atributu, nebo jako množinu prvků patřících do jedné třídy (kategorie).

5.2. Sémantická síla, jednoduchá struktura, flexibilita, interoperabilita

Sémantická síla

Termín sémantická (vyjadřovací) síla označuje vlastnosti znakové soustavy umožňující vyjádřit přesně a v úplnosti obsah entity. Zpravidla je doprovázena nástroji umožňujícími zachytit co nejširší a nejrozmanitější spektrum vztahů mezi jednotkami obsahu. Lze konstatovat, že čím vyšší sémantická síla, tím širší použitelnost daného systému lze očekávat.

Jednoduchá struktura

Systém s jednoduchou strukturou představuje přínos jak pro své tvůrce, tak pro uživatele. Uživatelům umožní snadné používání a správcům snadnou správu a údržbu. Systém s jednoduchou strukturou tedy vykazuje vyšší míru opětovné použitelnosti. Tento požadavek je však v rozporu s předchozím, stejně legitimním požadavkem na sémantickou sílu, který vyžaduje, aby systém svým slovníkem, strukturou i gramatikou co nejvýstižněji modeloval pojmy a v konečném důsledku i jimi odráženou (složitou a proměnlivou) realitu. Platí tedy inverzní poměr použitelnost/znovupoužitelnost.

Flexibilita

Požadavek flexibility je diktován dynamikou univerza poznání, na jehož vývoj by měl být systém schopen reagovat. V systémech organizace znalostí je tato vlastnost někdy označována jako "pohostinnost" (angl. hospitality). Anthony C. Foskett ještě doplňuje rozdíl mezi tzv. otevřenými a uzavřenými systémy organizace znalostí spočívající v tom, zda umožňují provádět změny (například vkládání nových pojmů či změny jejich významu) jejich uživateli. Pokud je to možné, označuje takový systém za otevřený a ten systém, jehož změny a aktualizace jsou vyhrazeny pouze jeho tvůrcům, označuje za uzavřený.[1]

Opět se jedná o ambivalentní požadavek – schopnost schématu pružně reagovat na změny znamená zpravidla, že se i sám systém změní, což ohrožuje konzistenci (např. stejný obsah je v různých časových etapách indexován různými metadaty).

Interoperabilita

Tento požadavek vychází ze všeobecně přijímaného faktu, že nelze vytvořit univerzální systém organizace znalostí, použitelný pro všechny potenciální oblasti a případy užití, a že je tedy i do budoucna třeba počítat s koexistencí různých systémů. Interoperabilita je požadována jak na úrovni jejich formátů (struktur, syntaxe), tak na úrovni obsahu, tj. sémantiky, a to v rámci různých oborů i v rámci různých prostředí. Komplikaci na úrovni sémantiky představuje, že její vyjádření založené na přirozeném jazyce je vždy ovlivněno specifiky daného jazykového, kulturního či geopolitického prostředí, v jehož kontextu se používá, a nelze u něj očekávat takovou míru sémantické unifikace jako kupříkladu u vysoce formalizovaných logických výroků.

Z podstaty systémové tvorby (systém jako artefakt) vyplývá, že je možné v různých systémech najít entity se stejnou sémantikou, ale odlišného typu. Konkrétním příkladem jsou entity, používané několika významnými ontologiemi k vyjádření obsahu informačních zdrojů (tzv. aboutness). Metadatové schéma Dublin Core definuje obsah jako datovou (unární) vlastnost prostřednictvím prvku „dc:subject“. V ontologii CIDOC CRM je zavedena objektová (binární) vlastnost P129 „je o (je předmětem)“. Model FRBRER používá k vyjádření obsahu vztah „má jako předmět / je předmětem“. V modelu FRSAD je pro určení obsahu díla definována samostatná třída „Thema“ a v modelu IFLA LRM je opět zaveden vztah „má jako předmět / je předmětem“. Mapování těchto entit je sice možné, ale odvozování a usuzování nad takovou heterogenní množinou povede pravděpodobně ke ztrátě informace nebo dokonce k chybným výsledkům.



[1] FOSKETT, Anthony Charles. The subject approach to information. 5th ed. London: Library Association Publishing, 1996, s. 111. ISBN 978-1-85604-048-8.

6. Fasetová analýza

Fasetová analýza je typ systémové analýzy, který člení analyzovanou entitu podle více kritérií členění na vzájemně se vylučující sémanticky homogenní kategorie, tzv. fasety. Toto členění musí být v souladu se všemi ostatními principy správné analýzy:

Úplnost - fasety mají pokrývat všechny podstatné/vnitřní vlastnosti členěné entity.

Vzájemně se vylučující části - v každé fasetě je aplikováno jiné kritérium členění.

Soudržnost - obsah každé fasety je založen na jednom kritériu členění.

Stejná úroveň granularity a abstrakce – za účelem dosažení homogenity rozsahu i obsahu je možné fasety členit na subfasety.

Fasetová analýza vychází ze základního způsobu lidského myšlení, kterým je konceptualizace, tj. tvorba pojmů či kategorií. Jejím specifikem je, že je založena na jednom konkrétním typu "umělé" konceptualizace, jímž je kategorizace na základě společných vlastností, tj. uplatňuje objektivní, systémový přístup. Fasetová analýza tudíž vykazuje obdobné rysy jako systémová analýza. V obou případech se klade důraz na rozpoznání struktury, funkce a především vzájemných vztahů komponent. Fasetová analýza umožňuje provést vědecky správnou analýzu s jednotným kritériem členění a vzájemně se vylučujícími prvky a zároveň efektivní syntézu, tj. vícedimenzionální reprezentaci složených témat a komplexních objektů.

Podnětem k teoretickému rozvoji fasetové analýzy se stala nová fáze vývoje vědy ve 20. století, během níž byla dosavadní specializace vystřídána inter- a transdisciplinaritou. Komplexnost zkoumaných problémů, při jejichž analýze už nepostačuje jedno hledisko speciální disciplíny, vyvolala nutnost vícekriteriálního přístupu doprovázeného důrazem na zachycení vzájemných vztahů. Všestranné využití faset k různým účelům je příčinou různého chápání faset a různých metod fasetové analýzy.

6.1. Typologie faset

Pojem faseta vykazuje příbuznost s pojmy "multisystém" a "multistruktura", jež vystihují situaci, kdy se na témže objektu identifikuje současně více systémů.[1]

1. Filozofická (ontologická) rovina, vyjádřená v termínech systémové analýzy

  • fasety prvků/instancí

faseta jako kritérium členění
kritérium členění: atributy prvků/instancí
výsledek: kategorie/třídy uvnitř faset

Příklad instancí: zelené vlněné ponožky, červené bavlněné ponožky

ponožky fasety barva materiál

kategorie

červené

zelené

vlněné

bavlněné

  • fasety kategorií/tříd/pojmů

faseta jako typ kategorie/třídy/pojmu
kritérium členění: atributy kategorií/tříd/pojmů
výsledek: fasety uvnitř kategorie/třídy/pojmu

Příklad instancí: lámaismus v Tibetu v 18. století, východní křesťanství na řeckých ostrovech během 2. světové války

náboženství fasety kategorie

místo

Řecko
Tibet

Buddhismus

Hínajánový buddhismus
Lamaismus

Křesťanství

Východní
Západní

čas

18. století
2. světová válka


2. Sémantická rovina, vyjádřená v termínech sémiotického trojúhelníku

  • fasety věcí (prvků, denotátu, isness)
Sémiotický trojúhelník

proces: kategorizace / klasifikace

postup: ontologická (systémová) analýza věci -> atribut věci -> kritérium členění (faseta)

Příklad: Klasifikace stavebních děl CZ-CC – fasety Budovy a Inženýrská díla (http://apl.czso.cz/iSMS/klasstru.jsp?kodcis=80108)

  • fasety obsahu (témat, aboutness) informačních zdrojů

proces: indexace

postup: obsahová analýza informačního zdroje -> aboutness -> hledisko/typ obsahu -> kategorie (faseta)

Příklad: Mezinárodní desetinné třídění – specifické pomocné znaky pro náboženství (http://www.udcsummary.info/php/index.php?id=15988&lang=cs)

Poznámka: Aboutness je pojem konstruovaný na základě interpretace znaku (textu, sdělení vyjádřeného nějakým jazykem). Indexují se tedy nikoli věci/denotáty (např. ponožky, stavební díla, náboženské systémy) nebo dokumenty, ale obsahy/témata dokumentů.


3. Rovina složitosti členěných entit

Zahrnuje i problematiku kombinace/skládání atributů pro účely identifikace, řazení a vyhledávání: složený identifikátor, složený řadicí klíč, složený vyhledávací klíč.

  • jedna věc/pojem/téma

faseta=atribut entity
více charakteristik/atributů jedné věci/tématu

Příklad: kočky – barva srsti, délka srsti, krmení, plemena, pohlaví, věk, zdraví…

  • složený pojem/téma

faseta=dílčí pojem/téma

Příklad: Umísťovací výstavy opuštěných koček ve Středočeském kraji pořádané na jaře 2020 - typ akce, místo, čas


4. Podle struktury kategorií/tříd/pojmů uvnitř faset

  • enumerativní
    • seznam, výčet prvků
    • booleovské (binární, 1 – 0, ano – ne)
    • škála (letopočty, ceny)
  • hierarchické (taxonomické)

5. Fasety v tezauru (podle ISO 25964-1, s. 68)

  • faseta jako vlastnost (atribut / vztah)
    => kritérium členění

bottom-up (induktivní) analýza

charakteristika, vlastnost, aspekt, hledisko, kritérium, dimenze, parametr…
ukazuje, čím se seskupené pojmy liší od ostatních (princip identifikace)
generická hierarchie


Příklad:
Řešení požadavku na jednotné kritérium členění automobilů podle pravidel správné analýzy v kapitole 4.7.

  • faseta jako kategorie vlastností
    => nejvyšší, základní kategorie

top-down (deduktivní) analýza

množina entit vytvořená na základě jednoho kritéria členění
ukazuje, co mají seskupené pojmy společné (princip ekvivalence)
obecná hierarchie


[1] HABR, Jaroslav, VEPŘEK, Jaromír. Systémová analýza a syntéza: zdokonalování a projektování systémů. 2. přeprac. vyd. Praha: SNTL, 1986, s. 32-33.

6.2. Metodiky fasetové analýzy

Metoda fasetové analýzy je ojedinělým příkladem metody používané v četných oblastech, jejíž zdroje lze spatřovat v knihovní a informační vědě. Podle Vandy Broughtonové mají informatické ontologie „konceptuálně velmi blízko k fasetové struktuře a … fasetová analýza má hodně co nabídnout jako metoda pro tvorbu ontologií.“[1] Obdobně A. Neelameghan v komentáři k postulátům a normativním principům S. R. Ranganathana[2] konstatuje podobnost databázového datového modelu a fasetové struktury s tím, že „je pozoruhodné, že existuje paralela ve vývoji modelů klasifikačních a indexačních jazyků (například hierarchických, fasetových, relačních, volně fasetových) s vývojem datových modelů (hierarchických, síťových a relačních)“. Společné rysy spatřuje i v postupu návrhu[3]: jak návrh klasifikačních schémat, tak návrh databázových systémů lze členit do tří úrovní, jež Ranganathan pojmenoval jako úroveň idejí, úroveň slov a úroveň notace.

Tak jako existují různá pojetí faset, jsou k dispozici i rozdílné metodiky tvorby fasetového klasifikačního schématu, tezauru či jiné fasetově organizované struktury (např. konceptuálního modelu databáze).

Společným východiskem je metodika S. R. Ranganathana, jenž ji zformuloval prostřednictvím systému principů, kánonů a postulátů.[4] S určitým zjednodušením lze konstatovat, že z tohoto základu se vyvinuly dvě větve metodik, založené na rozdílném pojetí faset:

1. Metodiky Skupiny pro výzkum klasifikace (CRG) a 2. verze Blissova Bibliografického třídění (BC2)

faseta jako typ základní kategorie

aplikační oblast: knihovnictví, bibliografie

typický produkt: bibliografické klasifikační schéma, oborový tezaurus

2. Metodiky organizace webových sídel (W. Denton[5])

faseta jako kritérium členění

aplikační oblast: informační architektura

typický produkt: fasetová kategorizace webového obsahu, doménová ontologie


[1] BROUGHTON, Vanda. The need for a faceted classification as the basis of all methods of information retrieval. In: Aslib proceedings. 2006, 58(1/2), s. 66. doi:10.1108/00012530610648671. ISSN 0001-253X.

[2] NEELAMEGHAN, A., compiled. S. R. Ranganathan‘s postulates and normative principles: applications in specialized databases design, indexing and retrieval. Bangalore: Sarada Ranganathan Endowment for library science, 1997, s. 163. Dostupné z: http://hdl.handle.net/10150/105602 [cit. 2023-03-09].

[3] Tamtéž, s. 176-177.

[4] Seznam viz KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. 1. vyd. Praha: Karolinum, 2017, s. 155-159. - Kompletní přehled je obsažen v: NEELAMEGHAN, A., compiled. S. R. Ranganathan‘s postulates and normative principles: applications in specialized databases design, indexing and retrieval. Bangalore: Sarada Ranganathan Endowment for library science, 1997. 270 s. Dostupné z: http://hdl.handle.net/10150/105602 [cit. 2023-03-09].

[5] KUČEROVÁ, Helena. Metodiky ontologického inženýrství. In: Ikaros [online]. 2011, 15(5) [cit. 2023-03-09]. urn:nbn:cz:ik-13630. ISSN 1212-5075. Dostupné z: http://www.ikaros.cz/node/13630.

6.3. Příbuzné obory/metody fasetové analýzy

1. Induktivní metody zaměřené na řešení komplexních problémů/témat

  • metody vícekriteriálního rozhodování, operační výzkum
    podstata: vícekriteriální hodnocení variant řešení

  • teorie integrativních úrovní
    podstata: myšlenka postupně vzrůstající složitosti
    Objekty zájmu jsou analyzovány a vzniklé komponenty jsou řazeny lineárně tak, že objekt na vyšší úrovni zahrnuje všechny vlastnosti objektu na nižší úrovni a přidává ještě své specifické vlastnosti.
    Příklad aplikace: Zachmanův rámec - doménová ontologie podnikového systému (https://www.zachman.com/resources/zblog/item/enterprise-architecture-defined-primitives-and-composites), propojující teorii integrativních úrovní s kategoriálním systémem 5W1H.

  • zakotvená teorie (angl. grounded theory)
    podstata: analýza údajů získaných výzkumem daného jevu
    1. konceptualizace → pojmy
    2. kategorizace pojmů
    3. určení vlastností kategorií (tj. faset)
    4. určení dimenzí vlastností

2. Sémantické a lingvistické metody

  • teorie pojmové analýzy
  • teorie sémantického rozkladu[6]
  • teorie sémantických primitivů[7]

3. Metody návrhu softwaru


[6] SMETÁČEK, Vladimír. Sémantický analyzátor = a semantic analyser = Semantičeskij analizator: experimentální ověřování. 1. vyd. Olomouc: Univerzita Palackého, 1984. 296 s. Informatika ve výchově, vzdělávání, školství; 2.

[7] WIERZBICKA, Anna. Sémantika: elementární a univerzální sémantické jednotky. Praha: Karolinum, 2014. 549 s. ISBN 978-80-246-2289-7.

7. Aplikace systémového přístupu v softwarovém inženýrství

Systémový přístup bylo možné zaznamenat již v období tzv. strukturované metodiky programování. V plné míře se projevuje v rámci aktuální objektově orientované metodologie, resp. objektově orientovaného přístupu (OOP) k programování.

Množství diagramů UML je dokladem toho, že nad jedním objektem lze definovat více systémů.

struktura funkce UML

Obr. 11 Jednota struktury a funkce znázorněná diagramem tříd UML

Doporučené zdroje k OOP:

PAGE-JONES, Meilir. Základy objektově orientovaného návrhu v UML. 1. vyd. Praha: Grada, 2001. 367 s. Moderní programování. ISBN 80-247-0210-X. Dostupné prostřednictvím NDK z: https://ndk.cz/view/uuid:b861e5c0-4467-11e2-9b88-005056827e51.

SCHMULLER, Joseph. Myslíme v jazyku UML: knihovna programátora. 1. vyd. Praha: Grada, 2001. 359 s. ISBN 80-247-0029-8. Dostupné prostřednictvím NDK z: https://ndk.cz/view/uuid:386ebda0-e0ee-11e8-a5a4-005056827e52.

8. Omezení systémového a analytického přístupu

Přednosti systémového přístupu a systémové analýzy potvrzují četné úspěšné případy jejich aplikace v průběhu analýzy a návrhu organizačních systémů. V této části upozorníme na jejich omezení.

Praxe ukazuje, že skloubit statické a dynamické aspekty systémové analýzy do jednotného celku je nesmírně obtížné. Stejný problém nastane při pokusu integrovat analytickou a syntetickou metodu. I Jaroslav Habr a Jaromír Vepřek upozorňují na svého druhu paradox systémového přístupu, kdy snaha pohlížet na systém jako celek (tzv. holismus) je současně překážkou jeho dekompozice a klasifikace.[1]

Požadavky na správnou analýzu, jejíž výsledky by byly počítačově zpracovatelné, vycházejí ze zásad formální logiky a jsou relevantní v rámci klasické, dle George Lakoffa „tradiční“ teorie kategorizace a klasifikace. Jejich dodržování přináší tu výhodu, že systémy konstruované podle těchto pravidel budou zpracovatelné počítačovými programy a do jisté míry jim budou i srozumitelné, tj. umožní „inteligentní“ přístup a využití, například odvozování. Analyzovaná skutečnost se však často nedá začlenit do takového formálního rámce a vynucuje si pragmatická řešení. V jistém smyslu lze zaznamenat až určitou diskreditaci systémového přístupu v "tvrdé" podobě, v níž byl v polovině 20. století často naivně uplatňován na "měkký" materiál humánní, společenské komunikace. Je jistě žádoucí uplatnit v organizaci znalostí systémový přístup, je však zapotřebí respektovat výrazný lidský aspekt konceptualizace tak, jak to například nabízí metodologie měkkých systémů Petera Checklanda.[3] Když Ludwig Wittgenstein uvažoval o možnostech definování pojmu „hra“, dospěl k závěru, že je to pojem s nejasným ohraničením (mluví o „rozplývavých okrajích“), a klade si otázky:

’Ale je rozplývavý pojem vůbec pojmem?‘ – Je neostrá fotografie vůbec obrazem nějakého člověka? Ba může být neostrý obraz vždycky s výhodou nahrazen obrazem ostrým? Není často právě neostrý obraz tím, co potřebujeme?“[2]

Definování systému na objektu spočívá v rozhodnutí, co z univerza diskurzu bude považováno za třídu, co za prvek/instanci, a co bude vlastností či vztahem. Problém je v tom, že pojmy třída, instance, vlastnost a vztah jsou přes existenci odlišných definic ve skutečnosti relativní – jejich užití často závisí na kontextu, v němž se použijí, a především na stanoveném cíli definovaného systému. Knihu můžeme chápat jako třídu s instancemi v podobě konkrétních knižních publikací, je ale představitelná i jako kniha – instance, např. v případě uvažování o konkrétních instancích obecně vymezené třídy dokument. Knihu a jejího autora si lze představit jako dvě třídy spojené vztahem autorství, ale i jako třídu a její vlastnost (autor jako vlastnost knihy nebo kniha jako vlastnost autora). Výpůjčku knihy mohou představovat dvě třídy spojené asociací (kniha a její výpůjčka), dvojice třída–vlastnost (výpůjčka jako vlastnost knihy nebo kniha jako vlastnost výpůjčky), nebo dvojice třída–vztah (výpůjčka jako vztah mezi knihou a nějakou další třídou – např. čtenář). Dokonce ani zdánlivě jasné rozlišení vlastnosti a její hodnoty není vždy snadné. Jedním z problémů jsou vlastnosti s předpokládanými booleovskými hodnotami (např. „ano“ – „ne“), kupříkladu „pilný“ nebo „dospělý“. Specifické jsou i vlastnosti, jejichž hodnoty jsou naplňovány instancemi nějaké třídy (to je případ tzv. autoritních dat používaných v paměťových institucích).

Co je kniha? Co je autor? Co je výpůjčka?
co je kniha   co je autor co je vypujcka

Příklady z praxe dokládají, že principy analýzy uvedené v předchozí kapitole představují ideál, v reálném prostředí nedosažitelný. Některé požadavky dokonce vytvářejí navzájem se vylučující kombinace – například požadavek jasného ohraničení a úplnosti je v rozporu s požadavkem na flexibilitu a požadavek na sémantickou sílu koliduje s požadavkem na jednoduchost.

Navíc je potřeba si připomenout, že klasická formální logika, na níž jsou založeny obecně přijímané a aplikované principy analýzy, se zajímá o pravdivost, nikoli o obsah výroků. Její použitelnost pro obsahovou analýzu a konceptualizaci, jež je jádrem organizace znalostí, je tedy problematická. Problémy se projevují zejména v obsahové analýze znalostí vyjádřených v přirozeném jazyce, v němž se vyskytují metafory, umělecké obrazy a další specifické jazykové jevy. Zákony intenzionální logiky, jež se zabývá sémantikou a mohla by tedy nabídnout potřebná řešení, jsou zatím ve fázi formování a diskusí.

K tomuto problému se přidává problematika složených pojmů a s tím spojených analyticko-syntetických operací. Shiyali R. Ranganathan popisuje svou inspiraci k vytvoření analyticko-syntetické fasetové klasifikace v dětské stavebnici Meccano, umožňující vytvořit z malého počtu základních stavebních prvků libovolně složité a rozmanité celky. Předmětem fasetové analýzy jsou ale pojmy vyjádřené jazykovými výrazy. Analogie mechanických komponent stavebnice a strukturních prvků jazyka je tudíž sporná. I když lze jazyk dekomponovat na jednotlivé strukturní části (slova, syntaktická pravidla apod.), je zřejmé, že výsledný význam jazykového výrazu konstruovaného z těchto částí ovlivňují četné další faktory.

Lze tedy uzavřít, že systémová analýza je pouze jednou z metod organizace znalostí, byť metodou vysoce efektivní a postavenou na exaktních základech.



[1] HABR, Jaroslav, VEPŘEK, Jaromír. Systémová analýza a syntéza: zdokonalování a projektování systémů. 2. přeprac. vyd. Praha: SNTL, 1986, s. 15.

[2] WITTGENSTEIN, Ludwig. Filosofická zkoumání. Přel. J. Pechar. Praha: Filosofický ústav AV ČR, 1993, s. 48. ISBN 80-7007-040-4. Dostupné prostřednictvím NDK z: https://ndk.cz/view/uuid:9df7a2e0-726a-11e5-9690-005056827e51?page=uuid:ac8f4040-7c08-11e5-ac67-005056827e51.

[3] CHECKLAND, Peter, POULTER, John. Learning for action: a short definitive account of soft systems methodology and its use for practitioners, teachers and students. Chichester: John Wiley & Sons, 2006. xxiii, 200 s. ISBN 0-470-02554-9.

9. Literatura

ASHBY, William Ross. Kybernetika. Přel. Karel Berka. 1. vyd. Praha: Orbis, 1961. 366, [4] s. Praha: Orbis, 1961. Malá moderní encyklopedie, sv. 23. Dostupné prostřednictvím NDK z https://ndk.cz/view/uuid:6614f860-1e1e-11e4-8f64-005056827e52.

HEYLIGHEN, Francis. Basic concepts of the systems approach. 1998-10-14 [cit. 2020-03-07]. In: F. Heylighen, C. Joslyn, V. Turchin, ed. Principia Cybernetica Web [online]. Brussels: Principia Cybernetica, 1992- . Dostupné z: http://cleamc11.vub.ac.be/SYSAPPR.html.

HABR, Jaroslav, VEPŘEK, Jaromír. Systémová analýza a syntéza: zdokonalování a projektování systémů. 2. přeprac. vyd. Praha: SNTL, 1986. 316 s.

KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. 1. vyd. Praha: Karolinum, 2017. 269 s. ISBN 978-80-246-3587-3 (brož.). ISBN 978-80-246-3597-2 (pdf).
Kapitola 3.1.3 Analýza a její principy, s. 120-128.
Kapitola 3.1.6 Řazení, s. 135-137.
Kapitola 4.1 Formální vlastnosti vztahů, s. 164-167.
Kapitola 4.2 Způsoby vyjádření a implementace vztahů, s. 167-175.
Kapitola 4.3 Vztahy v jazyce, s. 175-184.