Ontologie pro vymezenou doménu - individuální projekt
Navrhněte doménovou ontologii pro vám dobře známou oblast (věci každodenního života, oblíbená aktivita, místo, jídlo, sport...). Předpokládaný rozsah je cca 30-40 tříd. V ontologii budou uplatněny minimálně tři fasety (kritéria členění/základní kategorie) pro vámi navržené třídy.
Doporučený postup návrhu ontologie
Podrobněji k metodice návrhu ontologie viz kapitola 8 studijní opory Ontologie.
Specifikace požadavků
Specifikace požadavků na navrhovanou ontologii zahrne soubor požadavků na její použitelnost a funkčnost z pohledu uživatele. Použitelnost ontologie se soustředí na organizaci znalostí v doméně. Jejím účelem bude reprezentovat v úplnosti nejdůležitější kategorie znalostí (poznatků, údajů, informací) ve vymezené oblasti a jejich vzájemné vztahy. Požadavky na funkčnost budou mít formu případů užití a kompetenčních otázek.
Specifikace bude zpracována podle této osnovy[1]:
Úvod
Stručná charakteristika domény, kterou má ontologie pokrývat.
Popis faset, jež byly pro členění domény zvoleny.
1) Proč se bude organizovat?
= Požadavky na funkčnost systému, který má ontologie podporovat
- K jakému účelu budou sloužit organizované znalosti / informace?
- K poznání: Na jaké kompetenční otázky budou organizované zdroje poskytovat odpověď? Jaké výroky ("jednotky znalostí") by měla obsahovat budoucí znalostní báze / znalostní graf, k jejichž organizaci by bylo možné navrhovanou ontologii využít?
- K realizaci činností: Jaké problémy umožní získané informace/znalosti řešit? Jaké činnosti budou umožňovat / podporovat?
Zvolte si jednu z následujících obecných variant funkcionality ontologie a konkretizujte ji.
(a) Systém organizace znalostí
Jednotkou organizace jsou informační zdroje.
Ontologické třídy budou použitelné ve funkci metadat pro označování obsahu (tj. indexaci) informačních zdrojů v dané doméně a pro stanovený okruh uživatelů.
Příklady: Indexace článků publikovaných v odborném časopise (viz klíčová slova článků v časopisech Knihovna a Bulletin SKIP, nálepky článků v deníku Computerworld, keywords článků v časopise Cataloging and classification quarterly). Tagování příspěvků v diskusním fóru, wiki, otevřeném portálu apod. (viz kategorie a klíčová slova v portálu Wikisofia, témata článků na iDNES.cz, kategorie na portále Magazinzahrada.cz). Kategorizace článků v oborové encyklopedii (viz kategorie v Sociologické encyklopedii, hesla v Internetové encyklopedii humanitních oborů, kategorie v Encyklopedii knihy v českém středověku a raném novověku).
(b) Znalostní báze pro danou doménu
Jednotkou organizace jsou zaznamenané znalosti a výroky s nimi související.
Ontologie bude plnit funkci pojmového modelu pro znalostní bázi.
Příklady: Diagram znalostí Google, Wikidata (viz např. položka "jídlo" na https://www.wikidata.org/wiki/Q209).
(c) Výkladový slovník
Jednotkou organizace jsou slovníková hesla.
Ontologické třídy budou sloužit ke kategorizaci slovníkových hesel a k vícehlediskovému přístupu k jejich obsahu (tj. jako alternativa k abecednímu uspořádání slovníku).
Příklady: Česká terminologická databáze knihovnictví a informační vědy (TDKIV), Heslář Ustanovení mezinárodních zásad katalogizace, Wikislovník (viz např. slovníkové heslo Kniha).
(d) Oborová encyklopedie
Jednotkou organizace jsou články/encyklopedická hesla.
Ontologické třídy budou sloužit ke kategorizaci článků encyklopedie a k vícehlediskovému přístupu k jejich obsahu.
Příklady: Lexikon české literatury, Stanford encyclopedia of philosophy, Nový encyklopedický slovník češtiny.
2) Co se bude pomocí ontologie organizovat?
- Jaké zdroje (ve smyslu "provedení" nebo "jednotka" z modelu IFLA LRM) budou základní jednotkou organizace? Co bude jejich obsahem a jaký budou mít formát?
- Jaká bude úroveň granularity zdrojů? Budou zdroje agregovány? Budou zdroje vnitřně strukturovány?
- Jak budou organizované zdroje identifikovány (tj. odlišeny navzájem)?
- Jaký je předpokládaný rozsah organizovaných zdrojů?
3) Kdy se bude organizovat?
- V jaké fázi svého životního cyklu či komunikačního řetězce budou zdroje s využitím ontologie organizovány?
- Jaká bude frekvence vzniku / vytvoření / získání zdrojů?
4) Jak (nebo kým / čím) se bude organizovat?
- Budou organizovat lidé (autoři, editoři, správci, uživatelé...) nebo stroje?
- Bude se používat nějaký software?
5) Kdo budou uživatelé systému?
- Jaké typy uživatelů budou používat systém?
- Jaká bude jejich ICT kompetence a vybavení?
- Odkud budou přicházet, jak dlouho a jak často budou v systému "pobývat"?
- Jakému způsobu interakce se zdroji budou dávat přednost (vyhledávání, prohlížení, filtrování, sledování novinek, vytvoření, editace, analýza, hodnocení, uživatelské tagování, opětovné použití...)
Tip:
Zkuste při zpracování specifikace požadavků využít tento návod: LAMBE, Patrick. How to build a taxonomy [interaktivní poster]. 2012-05-02 [cit. 2024-04-04]. Dostupné z: http://prezi.com/td8pyeaczkj1/how-to-build-a-taxonomy/.
Analýza
Krok 1 Shromáždění entit
= rovina idejí (idea plane) - analýza domény (věcné oblasti)
Jaké věci ontologie zahrne?
Produkt: Pojmy reprezentující věci ve zvolené doméně.
Tip:
Doporučený postup při tvorbě seznamu pojmů je middle-out, tj.od nejdůležitějších pojmů (bázové kategorie) „vzhůru“ k nadřazeným kategoriím a „dolů“ k prvkům/instancím.
Krok 2 Popis entit
= rovina jazyka (verbal plane)
Jak vyjádříme pojmy? Jak vymezíme (definujeme) význam pojmů?
Produkt: Názvy tříd (termíny) a jejich definice.
Krok 3 Vytvoření faset
Jaké vlastnosti (aspekty, charakteristiky, hlediska) tříd jsou významné z hlediska jejich členění? Zvolte si minimálně 3 různá kritéria členění / základní kategorie pro vámi shromážděné pojmy.
Produkt: Vzájemně se vylučující a ve svém celku vyčerpávající kategorie, použitelné pro všechny věci určené v kroku 1.
Tipy:
Optimální jsou fasety, které jsou odvozené z obsahových charakteristik (vlastností).
Podívejte se pro inspiraci znovu na příklady využití fasetového přístupu k prezentaci a vyhledávání zdrojů.
Zkuste použít některé z obecných faset (základních kategorií), použitelných pro většinu oborů.
Návrh
Krok 4 Naplnění faset a jejich strukturování
Zařazení tříd do faset a určení jejich taxonomických vztahů (tj. monohierarchických generických vztahů).
Produkt: Páteřní taxonomie
Doplnění dalších typů vztahů - ekvivalence a asociace, ostatní typy hierarchických vztahů (partitivní, instanční).
Produkt: Kompletní množina ontologických tříd a jejich vzájemných vztahů.
Tip:
Zkuste použít metodu třídění kartiček. Online aplikace umožňující realizovat tuto metodu je k dispozici na https://www.optimalworkshop.com/optimalsort/.
Krok 5 Testování
= Ověření, zda ontologie umožňuje plnit funkce stanovené ve specifikaci požadavků.
Náměty na testování:
1) Zkontrolujte, zda navržený systém neporušuje některé z pravidel správné analýzy.
2) Vyberte několik zdrojů věcně souvisejících s doménou a zkuste jejich obsah popsat pomocí ontologických tříd a vlastností (uplatnění principu "literary warrant").
3) Ověřte, zda obsah ontologie umožňuje zodpovědět kompetenční otázky, stanovené ve specifikaci požadavků.
4) Zkuste ontologii použít pro popis reálné či hypotetické události související s doménou (např. recenze koncertu, zpráva o sportovním utkání, objednávka ICT vybavení pro firmu, program poznávacího zájezdu).
Krok 6 Zpracování dokumentace
Dokumentace projektu bude mít dvě části:
1. Dokument specifikace požadavků - textový soubor, optimálně v PDF
Titulní list
Úvod - stručná charakteristika zvoleného tématu / oblasti, které má ontologie pokrývat. Popis faset, jež byly zvoleny pro členění domény.
Specifikace požadavků zpracovaná podle zadané osnovy
2. Ontologie - soubor ve formátu OWL (download format - RDF/XML)
Doporučený nástroj pro tvorbu ontologie: Protégé (stručný návod k použití)
Projektová dokumentace se odevzdává 3 kalendářní dny před termínem zkoušky, na kterou je student/ka přihlášen/a.
Struktura hodnocení (prezenční studium):
Úplnost zachycení zvoleného tématu, specifikace požadavků – 10 %
Volba faset – 5 %
Definice pojmů – 5 %
Hierarchické vztahy – 10 %
Vztahy ekvivalence a asociace – 10 %
Příklad - ontologie vína (součást návodu k jazyku OWL, dostupné z https://www.w3.org/TR/owl-guide/wine) zobrazená v desktopové verzi editoru Protégé pomocí nástroje OntoGraf.
[1] Osnova zpracována podle: GLUSHKO, Robert J. Design decisions in organizing systems. In: Robert J. Glushko, ed. The discipline of organizing: professional edition [online]. 4th ed. O'Reilly Media, 2016, chapter 2, s. 63-90. Dostupné z: https://ischools.org/resources/Documents/Discipline%20of%20organizing/Professional/TDO4-Prof-CC-Chapter2.pdf [cit. 2022-05-25].