Ontologie: studijní opora
2. Definice informatické ontologie
V dnes již značně rozsáhlé literatuře je možné se setkat s četnými pokusy o vytvoření definice informatické ontologie. Za reprezentativní lze považovat definici publikovanou v dokumentu specifikace požadavků na ontologický jazyk OWL, na jehož vytvoření se podílel Leo Obrst[7]. Definice vyjadřuje přístup konsorcia W3C k chápání obsahu pojmu ontologie:
„Ontologie definuje termíny používané k popisu a reprezentaci oblasti znalostí. Ontologie používají lidé, databáze a aplikace, potřebující sdílet informace o určité doméně … Ontologie zahrnují počítačem použitelné definice základních pojmů v doméně a vztahy mezi nimi … Kódují znalosti v doméně a také znalosti o těchto doménách. Tím umožňují, aby tyto poznatky byly opětovně použitelné.“[8]
Shrnutí pohledů na informatické ontologie z pozic oborů umělé inteligence a znalostního inženýrství nabízí monografie Ontological engineering (Ontologické inženýrství)[9]. V kapitole 1.2 autoři uvádějí 16 různých definic ontologie, přičemž konstatují, že jde pouze o výběr z velkého množství dalších definic, jež je možné najít v literatuře. V závěru vyvozují vlastní definici, v níž konstatují, že cílem ontologií je „zachytit konsenzuální znalosti obecným způsobem, aby mohly být znovu použity a sdíleny mezi softwarovými aplikacemi a skupinami lidí“[10].
Většina definic informatické ontologie je založena na výčtu typů entit, jež jsou považovány za ontologie. Prvním pokusem o vymezení ontologie klasickým aristotelským způsobem (odkaz na nadřazený pojem, uvedení specifických rozdílů) je definice Thomase Grubera z roku 1993[1]. Tato obecně přijímaná a často diskutovaná definice informatické ontologie lapidárně vystihuje její gnozeologický a sémiotický základ:
„Ontologie je explicitní specifikace konceptualizace.“[11]
V roce 1997 byla Gruberova definice doplněná Willemem Nico Borstem do následující formulace:
„Ontologie je formální explicitní specifikace sdílené konceptualizace skutečnosti“.[12]
Tato značně kompaktní formulace si zaslouží podrobnější komentář, v němž se ji pokusíme propojit s teoretickým konstruktem sémiotického trojúhelníku (podrobněji viz kapitola 5) a ukázat, jak odkazuje na všechny tři jeho vrcholy.
Lze konstatovat, že pojem „explicitní specifikace“ z definice ontologie odpovídá straně sémiotického trojúhelníku (viz obr. 3 Sémiotický trojúhelník) označené jako „vyjádření pojmu znakem“. Slovo „formální“ znamená, že specifikace pojmu je zakódovaná v nějakém formálním jazyce a tedy srozumitelná i počítačovým programům. Zbývá doplnit komentář k významu adjektiva „sdílená“ u slova konceptualizace. Konceptualizace spočívá v tvorbě kognitivního odrazu skutečnosti prostřednictvím pojmů. „Sdílená konceptualizace“ znamená, že konceptualizace je využívána ke komunikaci (komunikace v pojetí sdílení a opakovatelné použitelnosti významu), a že se tedy nejedná o individuální pojmovou reprezentaci skutečnosti, nýbrž o výsledek dohody o významu vyjadřovaných pojmů v nějaké širší komunitě, například v rámci vědního oboru. Potřeba sdílené konceptualizace ve formě pojmového schématu byla konstatována již v normě ISO/TR 9007 (viz kapitola 4). Příčinou nutnosti dohody o významu pojmů je nejen vztah typu více–více mezi pojmy a znaky, který se projevuje jako synonymie a homonymie, ale i obecně známý fenomén vágnosti a různá míra ustálenosti (stability) významu zejména v přirozeném jazyce. Sám termín ontologie se svými různými významy proměňujícími se v čase je toho konkrétním příkladem. Dohoda uživatelů ontologie o významu používaných znaků (slov, termínů) je proto jedním z nejvýznamnějších typů ontologických závazků.
Jako stavební bloky pro vlastní pracovní definici ontologie pro účely tohoto textu použijeme následující pojmy, jež představují pojmovou základnu systémové analýzy: třída, prvek, atribut a hodnota, doplněné o specifické ontologické pojmy axiom a ontologický závazek. Význam použitých pojmů vymezíme pomocí těchto výroků:
Konceptualizace
Reprezentace skutečnosti prostřednictvím pojmů - proces tvorby pojmového modelu domény.
Třída
Výsledek konceptualizace množiny objektů. Obsahem třídy jsou vlastnosti zahrnutých objektů, rozsahem třídy je množina objektů se stejnými vlastnostmi, tj. instancí.
Poznámka: Takto definovaná třída je ekvivalentní s pojmem.
Pojmový model
Model vymezené domény vytvořený pomocí pojmů a jejich vztahů - výstup procesu konceptualizace.
Instance
Objekt, jenž má vlastnosti třídy, naplněné konkrétními hodnotami (daty).
Vyjádření
Zastoupení (specifikace) pojmu znakem (tj. jeho označení).
Vztah
Typ vlastnosti, sdílený více entitami (tj. třídami nebo instancemi).
Axiom
Výrok, tvrzení o třídě, které se nedokazuje a jehož účelem je upřesnit její význam (sémantiku).[13]
Ontologické závazky
Předpoklady, pravidla a omezení uplatňovaná při konceptualizaci a konstrukci ontologie. Jejich funkce je obdobná jako funkce axiomů. Avšak zatímco axiomy se týkají jednotlivých tříd, ontologické závazky se vztahují k ontologii jako celku.
S pomocí výše uvedených pojmů a jejich definic zkonstruujeme klasickou aristotelskou definici informatické ontologie prostřednictvím nejbližšího nadřazeného pojmu a určením druhových specifik.
Nejbližším nadřazeným pojmem pro informatickou ontologii je pojmový model.
Účelem informatické ontologie je komunikace, opakované využití a organizace znalostí, popis skutečnosti pro počítačové zpracování a automatické odvozování znalostí (podrobněji viz kapitola 5).
Obsah (složení): Jádrem každé informatické ontologie jsou třídy a jejich vlastnosti.
Specifické vlastnosti informatické ontologie jsou vyjádřeny následujícími výroky:
Informatická ontologie je inženýrský artefakt navržený s předem stanoveným cílem.
Informatická ontologie je opakovaně použitelná.[14]
Informatická ontologie je sdílena nějakým rozsáhlejším okruhem uživatelů.[15]
Výběr tříd, jejich atributů a způsob strukturování informatické ontologie je založen na implicitně či explicitně stanovených ontologických závazcích.
Význam tříd v informatické ontologii je vymezen pomocí axiomů.
Pracovní definice pro účely této studijní opory:
Informatická ontologie je typ pojmového modelu vymezené domény. Jejím účelem je komunikace, opakované využití a organizace znalostí, popis skutečnosti pro počítačové zpracování a automatické odvozování znalostí. Má formu inženýrského artefaktu, navrženého s předem stanoveným cílem. Je opakovaně použitelná a sdílená nějakým rozsáhlejším okruhem uživatelů. Obsah informatické ontologie tvoří třídy a jejich vlastnosti. Význam tříd je vymezen pomocí axiomů. Výběr tříd, jejich atributů a způsob strukturování ontologie je založen na implicitně či explicitně stanovených ontologických závazcích.
[7] Viz OBRST, Leo. Ontologies for semanticaly interoperable systems. In: CIKM '03: Proceedings of the twelfth international conference on information and knowledge management, New Orleans, LA, USA - November 03-08, 2003. New York: ACM, 2003, s. 366. https://doi.org/10.1145/956863.956932. ISBN 1-58113-723-0.
[8] HEFLIN, Jeff, ed. OWL Web Ontology Language use cases and requirements [online]. W3C Recommendation 10 February 2004. Cambridge (MA): World-Wide Web Consortium, © 2004 [cit. 2024-05-09]. Dostupné z: https://www.w3.org/TR/webont-req/#onto-def.
[9] GÓMEZ-PÉREZ, Asunción, FERNÁNDEZ-LÓPEZ, Mariano, CORCHO, Oscar. Theoretical foundations of ontologies. In: Ontological engineering: with examples from the areas of knowledge management, e-commerce and the semantic web. 1st ed. London: Springer, 2004, s. 1-45. https://doi.org/10.1007/1-85233-840-7_1. ISBN 978-1-85233-551-9 (print). ISBN 978-1-85233-840-4 (online).
[10] Tamtéž, s. 8-9.
[11] „An ontology is an explicit specification of a conceptualization.“ GRUBER, Thomas R. A translation approach to portable ontology specification. In: Knowledge acquisition. June 1993, 5(2), 199. https://doi.org/10.1006/knac.1993.1008. ISSN 1042-8143.
[12] „Ontologies are defined as formal specification of a shared conceptualization.“ BORST, Willem Nico. Construction of engineering ontologies for knowledge sharing and reuse. Enschede: Centre for Telematics and Information technology, 1997, s. 12. CTIT Ph. D-thesis series, no. 97-14, ISSN 1381-3617. Dissertation (Ph.D.). Proefschrift Universiteit Twente, Enschede. ISBN 978-90-365-0988-6.
[13] Poznámka: Takovými axiomy jsou v naší „ontologii informatické ontologie“ pojmy „data“, „pojem“, „objekt“, „množina“, „vlastnost“.
[14] Tj. jedna ontologie může být využita pro více účelů.
[15] Tj. ontologie je výsledkem nějakého společenského konsenzu.