Lingvistické problémy obsahové analýzy: studijní opora
Stránky: | Moodle UK pro výuku 1 |
Kurz: | Obsahová analýza - OBA |
Kniha: | Lingvistické problémy obsahové analýzy: studijní opora |
Vytiskl(a): | Nepřihlášený host |
Datum: | pátek, 22. listopadu 2024, 05.09 |
1. Úvod
Základ lingvistických a sémantických problémů organizace znalostí - vztahy 1 : N
Ideál:
|
Ukazatele: |
Typologie problémů
Paradigmatické vztahy 1 : N |
Syntagmatické vztahy 1 : N |
Synonymie (1 význam – N lexémů) | Složený pojem / složené téma (N významů) |
Souznačnost. Konjunktivní (slučující) vztah jednotek vyjádření / lexémů (logické OR, a nebo). Příklad: Problém: Snížení úplnosti |
Pojem/téma, které jsou rozložitelné na více jednotek obsahu. Partitivní vztah jednotek obsahu (logické AND, a zároveň). Příklady: Problém: analýza, syntéza |
Homonymie (1 lexém – N významů) | Slovní spojení (1 význam – N lexémů) |
Disjunktivní (vylučující) vztah jednotek obsahu (XOR, buď / nebo). Přesněji: víceznačnost. V rámci víceznačnosti se rozlišuje homonymie (souzvučnost) a polysémie (vícevýznamovost). Významy polysémů spolu souvisejí (kuchařka – kuchařka, hodinky – hodinky), významy homonym spolu nesouvisejí (stát – stát, bez - bez). Záměrně vytvořenou či použitou víceznačnost lze považovat za typ metafory nebo metonymie.
Problém: Snížení přesnosti |
Označuje se též jako fráze, frazém, frazeologismus, idiom, kolokace, víceslovný lexém / lexikální jednotka, koherentní víceslovný výraz, n-gram, sousloví, sdružené pojmenování. Příklady: Problém: Snížení přesnosti |
2. Paradigmatické a syntagmatické vztahy v jazyce
Paradigma je...
Syntagma je...
1. Paradigmatické vztahy
TDKIV - seznam termínů v bázi s vyjádřením paradigmatických vztahů ekvivalence a asociace (pole "Ekvivalent" a "Příbuzný termín"). Příklad: Termín "asociativní vztah". Dostupné z: https://aleph.nkp.cz/F/?func=direct&doc_number=000001504&local_base=KTD.
KLÉGR, Aleš. Tezaurus jazyka českého: slovník českých slov a frází souznačných, blízkých a příbuzných. 1. vyd. Praha: NLN, Nakladatelství Lidové noviny, 2007. 1189 s. ISBN 978-80-7106-920-1. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT) z: https://ndk.cz/view/uuid:8455b570-efb7-11e3-a2c6-005056827e51.
ČERMÁK, František. Recenze: Aleš Klégr: Tezaurus jazyka českého: slovník českých slov a frází souznačných, blízkých a příbuzných. In: Slovo a slovesnost. 2009, 70(2), 153-157. ISSN 0037-7031 (print). ISSN 2571-0885 (online). Dostupné z: https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:a6eb653e-2195-4819-8f22-02bc6928266b nebo prostřednictvím vyhledávače UKAŽ.
MAREŠOVÁ, Milena M. Tezaurus jazyka českého (recenze) [online audio]. 2008-03-10 [cit. 2024-10-04]. Dostupné z: https://vltava.rozhlas.cz/tezaurus-jazyka-ceskeho-recenze-5075265.
PÁLKA, Peter. Tezaurus jazyka českého [recenze]. In: Ikaros. 2008, 12(7) [cit. 2024-10-04] Dostupné z: https://ikaros.cz/tezaurus-jazyka-ceskeho. URN-NBN:cz-ik4884. ISSN 1212-5075.
Tezaurus Eurovoc - vyjádření paradigmatických vztahů ekvivalence, hierarchie a asociace.
Příklad: termín "robotizace" a jeho paradigmatické vztahy k termínům "používání robotů", "průmyslové zpracování", "průmyslový robot", "robotika". Dostupné z: https://skosmos.bartoc.org/15/en/page/3744?clang=cs
Paradigmatické vztahy vědních disciplín - klasifikace věd/mapování vědy
Places & Spaces: Mapping science. Dostupné z: https://scimaps.org/.
2. Syntagmatické vztahy
TDKIV - seznam dotazů do báze (search log) s vyjádřením syntagmatických vztahů (časová posloupnost zadávání dotazů - uvedeno v polích TIME STAMP, DATUM, CAS).
Český národní korpus - vyjádření syntagmatických vztahů v aplikaci KonText. Dostupné z: https://kontext.korpus.cz/
Syntagmatické vztahy slova "čekovat" ve slovníku neologismů Neomat. Dostupné z: https://neologismy.cz/index.php?retezec=%C4%8Dekovat&button=Hledat&prijimam=1&heslar=1&heslar_detail=%C4%8Dekovat.
Syntagmatické vztahy vědních disciplín
Příklad: kyber-egyptologie
Vědci z Fakulty elektrotechnické ČVUT v Praze a z Českého egyptologického ústavu Filozofické fakulty UK zavedli novou vědní disciplínu kyber-egyptologii. 2018-07-09 [cit. 2024-10-04]. Dostupné z:
https://www.ff.cuni.cz/2018/07/vedci-fakulty-elektrotechnicke-cvut-praze-ceskeho-egyptologickeho-ustavu-filozoficke-fakulty-univerzity-karlovy-zavedli-novou-vedni-disciplinu-kyber-egyptologii/
3. Paradigmatické i syntagmatické vztahy
Slovo v kostce. In: Český národní korpus. Praha: Ústav českého národního korpusu, 1994- . Dostupné z: https://www.korpus.cz/
3. Synonymie - typy a příklady
Paradigmatická synonymie
3.1 Lexikální (věcná) synonymie
- ekvivalence
může mít podobu symetrické ekvivalence významově rovnocenných prvků (např. útok - zteč) nebo asymetrické ekvivalence s určením jednoho ze synonym jako preferovaného - hierarchie
hyponymie / hyperonymie
meronymie / holonymie - asociace
Specifický případ ekvivalence. Každý z jazykových výrazů označuje jiný atribut (charakteristiku) stejného denotátu (např. Jitřenka - Večernice).
Kvazisynonymie v TDKIV - antonyma (opozita) "bibliofilie - bibliofobie":
https://aleph.nkp.cz/F/?func=direct&doc_number=000017146&local_base=KTD
Nástroj řešení: řízený slovník
3.2 Mezijazyková lexikální ekvivalence
Příklady věcné a mezijazykové synonymie
Typy lexikální synonymie v bázi národních věcných autorit NK ČR:
Zvukové dokumenty
https://aleph.nkp.cz/F/?func=direct&doc_number=000127701&local_base=AUVT
preferovaný termín: Záhlaví
nepreferovaný termín: Odkaz. forma
další typy synonym: Ident. číslo, Nadřazený termín, Podřazený termín, Asoc. termín, MDT, Angl. ekvivalent, Skupina Konspektu, Systém. číslo
Nástroj řešení: řízený slovník
Typy lexikální synonymie v TDKIV:
Sekundární dokument
https://aleph.nkp.cz/F/?func=direct&doc_number=000000921&local_base=KTD
preferovaný termín: Termín
nepreferovaný termín: Ekvivalent
Nástroj řešení: řízený slovník
Typy lexikální synonymie v bázi národních jmenných autorit NK ČR:
Tisíc a jedna noc
https://aleph.nkp.cz/F/?func=direct&doc_number=000380996&local_base=AUT
preferovaný termín: Záhlaví
nepreferovaný termín: Odkaz. forma
Nástroj řešení: řízený slovník
Typy lexikální synonymie v Mezinárodní virtuální databázi autorit VIAF:
Tisíc a jedna noc
http://viaf.org/viaf/303806052
Nástroj řešení: řízený slovník
Typy lexikální synonymie v Tezauru AGROVOC:
Vánoční stromky
https://agrovoc.fao.org/browse/agrovoc/en/page/c_1591
Prozkoumejte lexikální synonyma v různých jazycích (termínová synonymie).
Prozkoumejte mapování pojmu do jiných SOZ (pojmová synonymie): closely matching concepts, exactly matching concepts.
Nástroj řešení: řízený slovník
Typy lexikální synonymie v Tezauru LISS (Library & Information Science Source - Subject Terms) [via EBSCOhost]:
Zadejte "Communication -- Content analysis"
Nástroj řešení: řízený slovník
3.3 Gramatická (morfologická) synonymie
Gramatická synonymie v Českém národním korpusu:
Do okénka Dotaz v aplikaci KonText zadejte sloveso "jít".
Porovnejte výsledek s dotazem, v němž jako výchozí atribut nastavíte "word".
Nástroj řešení: řízený slovník - lemmatizace
Tip: Podívejte se do Základních informací k souboru národních tematických autorit ČR a zjistěte, jaká pravidla jsou uplatňována pro řešení gramatické synonymie.
Syntagmatická synonymie
3.4 Syntaktická synonymie
Pavlovi pomáhá Petr.
Petr Pavlovi pomáhá.
Petr pomáhá Pavlovi!
Pomáhá Pavlovi Petr?
Syntaktická synonymie v předmětových heslech v katalogu NK ČR: https://aleph.nkp.cz/F/?func=direct&doc_number=002706395&local_base=NKC
3.5 "Formální" synonymie
Založeno na následujících hypotézách:
a) Slova, která se podobně píšou, mají podobný význam (ekvivalence označením)
b) Slova, která jsou blízko sebe, mají významový vztah (ekvivalence umístěním)
Příklady
Do okénka Hledat na Wikipedii zadejte "informační systém" a podívejte se na nabízená synonyma (dynamicky generovaná nabídka Hledat stránky obsahující...)
https://cs.wikipedia.org/
Nástroj řešení: indexový soubor
"Formální" synonymie v Českém národním korpusu:
V aplikaci KonText zvolte Pokročilý dotaz a zadejte následující dotaz v jazyce CQL:
[word=".*jít.*"]
Nástroj řešení: indexový soubor
"Formální" synonymie v indexovém souboru:
Podívejte se na obsah Frekvenčního slovníku.
Podívejte se na obsah rejstříku TDKIV (KTD - Prohlížení rejstříku):
Do okénka Zadejte heslo k otevření rejstříku zadejte "biblio"
http://aleph.nkp.cz/cze/ktd
Nástroj řešení: kontext
Slovníky českých synonym:
PALA, Karel, VŠIANSKÝ, Jan. Slovník českých synonym. 3., dopl. vyd. Praha: NLN, Nakladatelství Lidové noviny, 2000. 479 s. ISBN 80-7106-450-5. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT) z https://ndk.cz/view/uuid:8c36e580-9d84-11e5-ada6-005056827e51.
BEČKA, Josef Václav. Slovník synonym a frazeologismů. 3. vyd., upr. a dopl. Praha: Novinář, 1982. 463 s. Knihovnička novináře; sv. 16. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT) z https://ndk.cz/view/uuid:e7bc8df0-75c4-11e2-abbe-005056827e51.
HALLER, Jiří, Šmilauer, Vladimír, ed. a Hradský, Ladislav, ed. Český slovník věcný a synonymický. 1. vyd. Praha: SPN, 1969-1987. 4 sv. Odborné slovníky. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT):
1. https://ndk.cz/view/uuid:88df0520-f289-11ea-9c2e-005056827e51
2. https://ndk.cz/view/uuid:9a981180-f289-11ea-9c2e-005056827e51
3. https://ndk.cz/view/uuid:acab99f0-f289-11ea-9c2e-005056827e51
4. https://ndk.cz/view/uuid:4d05a470-4163-11e3-ad8c-005056827e52
4. Homonymie - typy a příklady
Poprvé to profesora Parkhilla napadlo, když paní Yanoffská napsala v textu diktované básně:
Jaro se vrací, poslyšte, co v zahradě zpívá koz!
Od toho dne si stále připomínal, že začátečnická třída bezpodmínečně potřebuje poučení o slovech stejného znění a různého významu čili o homonymech. Přísně vzato, u slov kos a koz by se spíše než o homonymii mělo mluvit o homofonii, protože tato dvojice splývá jen ve své podobě mluvené, a nikoli též psané, jak je tomu u dvojice kos – kos, kde první slovo označuje ptáka a druhé je povelem ke kosení. Ovšem kos a kos jsou spíše slova homomorfní, protože se shodují jen v některých svých tvarech, a nikoli ve všech, jak tomu bývá u pravých homonym typu travička – travička a u takzvaných homografů, kde se shoduje pouze podoba grafická, kdežto výslovnost se liší, viz panický – panický.
[...]
„Dvě slova a jedno písání?” zaúpěla Olga Tarnovská.
„Tarnovská, učit a né stěžovat!” okřikl ji pan Kaplan. „Vy v baletu netančila dvě tanci na jednu muziku?!”
ROSTEN, Leo. Pan Kaplan má stále třídu rád. Praha: Odeon, 1988, s. 47-48.
4.1 Lexikální homonymie
Příklady homonymních termínů v oboru ICT
Alt | karta | médium | profil | soubor | tučňák | |
aplikace | faseta | klávesnice | mechanika | program | spam | účet |
bit | hlava | klíč | myš | prompt | stáhnout | uzel |
brána | hlavička | klik | obvod | protokol | stránka | vir(us) |
„cédéčko“ | hrana | knihovna | odkaz | ROM | strom | vymazat |
cloud (oblak) | ikona | kód | okno | rozbalit | surfovat | vypálit |
červ | jack | koš | ontologie | schránka | tablety | základní deska |
disk | jádro | kšandy | paměť | síť | tapeta | zásuvka |
dlaždice | jazyk | lišta | panel | skříň | tiskárna | zavřít |
editor | kanál | maska | pole | složka | Trojský kůň | zdroj |
Lexikální homonymie v Českém národním korpusu:
V aplikaci KonText zadejte do vyhledávacího okénka slovo "ženou" a jako výchozí atribut nastavte "word".
Vyzkoušejte totéž se slovem "hnát".
Nástroj řešení: kontext
Lexikální homonymie v bázi národních věcných autorit NK ČR:
termín "Los"
https://aleph.nkp.cz/F/?func=direct&doc_number=000115175&local_base=Tem
Nástroj řešení: řízený slovník
Lexikální homonymie ve Wikipedii:
článek "Index"
https://cs.wikipedia.org/wiki/Index
Tip: Seznamte se s obsahem stránky Wikipedie:Rozcestníky.
Lexikální homonymie v TDKIV:
termín "Sekundární dokument"
https://aleph.nkp.cz/F/?func=direct&doc_number=000000921&local_base=KTD
Lexikální homonymie v Českém MDT online:
Do vyhledávacího okénka zadejte "zámky"
http://cz.udc-hub.com/
přihlášení pro členy akademické obce UK:
uživatelské jméno: ruk
heslo: uNIVERZITNImdt1
Nástroj řešení: kontext
Lexikální homonymie v klasifikaci KO Literature:
Třídy 351 a 361
http://www.isko.org/scheme.php
Nástroj řešení: kontext
4.2 Syntaktická homonymie
Slova s původně jednoznačným významem (tzv. monosémy) jsou seskupena tak, že výsledný výrok má více významů (např. moc slov - moc slov).
Syntaktická homonymie v titulcích zpráv:
Bikira své mládě nepřijala, je zpět v inkubátoru
Šokující srovnání! Boxerský svět zcela zastiňuje MMA
Někteří lidé stále čekají na voličské průkazy. Už dny přitom mohou ležet na poště.
Australské basketbalistky zdrtily Srbky
Dávejte k nám děti, jen když je to nutné, prosí rodiče otevřené školky
Rodiče musí živit děti tak dlouho, dokud se nepostaví na vlastní nohy
Zvířata na jatkách budou povinně hlídat kamery, rozhodla vláda
V Brně uspořádali procházku po estakádě za 2,5 miliardy
Francouzský vrtulník sestřelil v Rudém moři húthíjský dron
Chobotnice podtrhla Ježkovi židli, teď se s ní vypořádá knihou
Herečky ze Sexu ve městě podpořily ženy, které obvinily herce Chrise Notha
Suzanne Vega vzdala komorní poctu New Yorku
Makak shodil chlapce do rokle, aby mu ukradl jídlo
Policisté střeží v Bílých Karpatech i zelenou hranici
Brněnský festival zahájil seriál o nálezu kokainu za dvě miliardy mezi banány
Budoucí učitelé se špatně učí
Papoušci sprostě nadávali návštěvníkům zoo, museli je schovat
V Krkonoších někdo postřelil vlka, ochranáři nakonec museli ukončit jeho trápení
Policie hledá uneseného vodníka z Dalovic, má vykulené oči
Policie pátrala po dvanáctileté dívce z Dejvic, nakonec se sama vrátila domů
Řeky zachraňuje už jen voda z přehrad
V nové knize Rowlingové jsou také obrázky českých dětí
Soud žádá upřesnit nařízení o nošení roušek venku, jinak přestane platit
Generální ředitel BBC odstoupil kvůli nepravdivému obvinění bývalého politika
Americký profesor, který předpověděl Trumpovo vítězství, je přesvědčen, že bude odvolán z funkce
Jak se chová ušatý obr
Orchestriony nahradí modernější soupravy, v Trutnově vyjede městský vlak
4.3 Sémantická homonymie
Např. ironie ("to je nadělení"), sarkasmus ("to se ti povedlo"), jazyková hříčka, vtip, metafora, metonymie.
Metafora = analogie obsahu
řešený problém: určení významu (věci)
Metonymie = analogie formy (označení)
řešený problém: pojmenování věci
Felix Holzmann. Včera, dnes a zítra.
Tip:
O povaze humoru Felixe Holzmanna a o jeho souvislosti s teorií komunikace se můžete dočíst zde:
TESAŘ, Antonín. Sisyfos humoru: mistr nedorozumění Felix Holzmann. In: A2larm [online]. 2022-10-13 [cit. 2024-10-16]. Dostupné z: https://a2larm.cz/2022/10/sisyfos-humoru-mistr-nedorozumeni-felix-holzmann/.
Jazyková komika Felixe Holzmanna je využita i ve filozofických esejích Vojtěcha Kolmana:
KOLMAN, Vojtěch. Noc, v níž se pořádají medvědí hony na zajíce. 1. vyd. Praha: Argo, 2020. 206 s. ISBN 978-80-257-3377-6.
Metafora ("řinou se") a metonymie ("rýmy") v haiku na Twitteru
Na Podzim
— haiku z Modřan (@haiku40892093) October 6, 2022
Básníkům
Řinou se rýmy.
(7. 10.)#haiku
Paronyma - falešní přátelé, zrádná slova
Homonyma, která se "tváří" jako synonyma
směsný odpad - směšný odpad
konkrétní (česky) - concrete (anglicky beton)
krásný (česky) - красный (rusky červený)
5. Slovní spojení - příklady
Česká národní bibliografie (báze CNB):
Zadejte "informační služby" a porovnejte výsledky s různým nastavením volby Blízkost slov (Ano - Ne).
https://aleph.nkp.cz/F/?func=file&file_name=find-b&local_base=cnb
Nástroj řešení: indexový soubor
Báze LISS (Library & Information Science Source) [via EBSCOhost]:
Zadejte "information services" a porovnejte výsledky s různým nastavením režimů vyhledávání ve volbě Možnosti hledání.
Nástroj řešení: indexový soubor
6. Složená témata a složené pojmy
Příčinou existence složených pojmů v systému jazyka jsou
a) Složitost fenoménů, jež pojmy odrážejí/reprezentují
b) Výskyt nových skutečností a fenoménů, pro něž se hledá vyjádření
Nejčastějšími způsoby reprezentace nových skutečností jsou spolu s neologismy právě složené pojmy.
Srovnání neologismů a složených pojmů | |
Neologismus, novotvar | Složený pojem |
nové paradigma | nové syntagma |
zpravidla založeno na metafoře | založeno na kombinaci (koordinaci) již existujících pojmů |
Příklady: robot, dálnice, počítač, čtenářolog, chvilkař*) |
Příklady: hypertext, finance a účetnictví, psychoanalýza, čistonosoplena, overturismus, tělesná výchova a sport, veřejné knihovny, duše a tělo, digitální lékařský teploměr, aktivní meziknihovní výpůjční služba |
*) Další příklady viz např.: JIŘIČKOVÁ, Jitka. Rouškomil, koronaut, haranténa... S koronavirem vzniklo 400 nových slov. In: iForum. 2020-04-28. Dostupné z: https://iforum.cuni.cz/IFORUM-16752.html.
6.1. Složené pojmy
V praxi se lze setkat se dvěma způsoby skládání témat/pojmů:
1) Souřadné skládání
tzv. aditivní vztah, symetrický vztah témat, koordinace/souřadnost - relativní nezávislost témat
partitivní hierarchie (složené téma je celek složený z dílčích částí): význam (extenze) se pomocí dalších složek rozšiřuje
typické pro polytematické zdroje
Příklady:
GLAM - galerie, knihovny, archivy a muzea
Čechy a Morava (Protektorát)
(ministerstvo) práce a sociálních věcí
(fakulta) informatiky a statistiky
výchova a vzdělávání
roky 2020/2022
červenobílý
Vyjádření v MDT: spojovací symboly + /
2) Podřadné skládání
tzv. fázový vztah, asymetrický vztah témat, subordinace (podřadnost), závislost/zahrnutí - jedno téma ovlivňuje význam druhého
generická hierarchie (složené téma je specifikací obecnějšího tématu): význam (extenze) se pomocí dalších složek zužuje
Příklady:
absenční výpůjční služby
novodobý
ekofyziologie rostlin
nosníky na pružném podkladě
jazykové slovníky
Archivy, knihovny a muzea v digitálním světě
Vyjádření v MDT: spojovací symboly : [ ]
6.2. Analýza složených pojmů v praxi organizace znalostí
6.2.1 Hlavní zdroje výskytu složených pojmů během procesu indexace
a) Existence složených pojmů v systému jazyka
b) Informační zdroje, jež obsahují (zahrnují) více témat a polytematické zdroje
6.2.2 Analýza složených pojmů - pro a proti
Rozhodnutí, zda při indexaci ponechat složený pojem či ho rozložit, ovlivňují četné faktory (podrobný popis viz ISO 25964-1, s. 39-42):
- Sémantické preference
a) zobecňování vs. specifičnost
Poznámka: Analýza složených témat na jejich konstituenty možná překvapivě vede k zobecňování (abstrakci) a tím ke ztrátě specifického významu složeného pojmu (např. psychoanalýza = psychika + analýza).
b) důraz na téma (co je známo) vs. na réma (co je nové)c) prekoordinace vs. postkoordinace, resp. enumerace vs. kombinace
- Uživatelské preference
- Jazykové preference
terminologický úzus
literary warrant - Provozní požadavky
konzistence indexace
požadavek interoperability (např. prekoordinované systémy se hůře mapují)
6.2.3 Metody analýzy složených pojmů
Jednotlivé metody se navzájem nevylučují, je patrné překrývání některých principů. V praxi se často kombinují navzájem.
1) Fasetová analýza
Teoretickým základem této metody je systémová analýza, propracované techniky fasetové analýzy nabízí informační věda.
Příklad:
Fasetová struktura třídy 2 Náboženství v Mezinárodním desetinném třídění a její využití pro vyjádření složených témat:
Hlavní znaky | Zvláštní pomocné znaky pro náboženství | |||||
233 | Hinduismus v užším smyslu, podrobněji | 2‑18 | Člověk. Lidstvo. Lidství. Dogmatická antropologie | |||
24 | Buddhismus | 2‑36 | Svatí. Bóddhisattvové. Osoby, které dosáhly osvícení | |||
27 | Křesťanství |
Kombinace hlavních a zvláštních pomocných znaků umožňující vyjádření složených témat
233‑18 Člověk. Lidstvo v hinduismu
233‑36 Svaté osoby, světci v hinduismu. Osvícení, probuzení
24‑18 Člověk. Lidstvo. Lidství (v buddhismu)
24‑36 Světci. Bódhisattvové. Osvícené, poučené, probuzené osoby (v buddhismu)
27‑18 Člověk, lidstvo, lidství, dogmatická antropologie v křesťanství
27‑36 Křesťanští světci. Hagiologie. Hagiografie
2) Závislostní analýza
Teoretickým základem této metody je lingvistika. Je vhodná zejména pro analýzu pojmů/témat vytvořených podřadným skládáním.
Typická struktura složených pojmů vytvořených podřadným skládáním (Zdroj: ISO 25964-1, s. 38-39)
1. Významové jádro (sémantický důraz, term focus, head)
Obecný pojem, jehož je složený pojem (jako celek) součástí / v němž je složený pojem zahrnut. Obvykle lze vyjádřit substantivem.
2. Rozlišující prvek (term difference, modifier)
Komponenta složeného pojmu, která slouží k zúžení rozsahu významového jádra a tudíž specifikuje jednu z jeho součástí
Uplatňuje se vztah generické hierarchie. Obvykle lze vyjádřit adjektivem.
3. Hledisko (aspekt)
– je-li aplikovatelné
Obecně: komponenta zužující významové jádro podle odlišného kritéria než rozlišující prvek (např. žánr/forma nebo uživatelské určení ve věcné katalogizaci v knihovnách). Obvykle lze vyjádřit slovesem. Aplikace hlediska přibližuje tuto metodu fasetové analýze.
Příklad:
Poznámka: Ve skutečnosti je skladba složených pojmů často ještě komplikovanější. To ukazuje termín "meziknihovní", který označuje složený pojem, jenž je rozložitelný na významové jádro "knihovny" a rozlišující prvek "mezi", vyjadřující interakci. Při analýze složených pojmů lze tedy zaznamenat jak generickou, tak partitivní hierarchii.
Tip:
Podívejte se na závislostní struktury (tzv. závislostní stromy) definované v Českém národním korpusu (aplikace KonText) - zkuste třeba výraz "komunikační systém".
3) Analýza pro konstrukci předmětových hesel
Metoda je založena na dnes již neplatné ČSN 01 0188 Tvorba předmětových hesel z roku 1983. Alternativní přístup.
Popis metody lze najít např. v publikacích:
KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: ÚVTEI, 1974, s. 34-36. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT) z https://ndk.cz/view/uuid:f9e5aba0-1f75-11e3-a5bb-005056827e52?page=uuid:d8e5d470-69fd-11e3-af76-5ef3fc9ae867.
KOVÁŘ, Blahoslav. Předmětová hesla a předmětové katalogy. In: Věcné pořádání informací a selekční jazyky. Díl 2. Předmětové pořádání; Mezinárodní spolupráce; Automatické indexování. Kapitola 3.3, s. 18-52. Praha: Ústředí vědeckých, technických a ekonomických informací, 1982. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT) z https://ndk.cz/view/uuid:9a251df0-cb87-11ec-8ea3-5ef3fc9bb22f?page=uuid:d6a4df92-0b27-48b8-b2b6-cf38ebac6b6b.
Přehled aktuální praxe tvorby předmětových hesel v českých knihovnách: BALÍKOVÁ, Marie. Aplikace věcných autorit v bibliografických záznamech: Předmětové heslo NK ČR - PHNK. Prezentace, 32 snímků. Praha: Národní knihovna ČR, 2023. Dostupné z: https://www.nkp.cz/o-knihovne/odborne-cinnosti/zpracovani-fondu/vecne-zpracovani-vecne-autority/predmetova-hesla-nkcr-phnk.
Struktura předmětového hesla:
heslo (doplněk hesla) - podheslo (doplněk podhesla)
heslo: významové jádro
podheslo: věcné nebo formální rozlišující prvky
Doplněk hesla či podhesla se uvádí pouze při nutnosti odlišit homonyma - např. RDA (pravidla), RDA (organizace)
Heslo a podheslo / podhesla se oddělují pomlčkou, doplněk se uvádí v kulatých závorkách.
Typy podhesel a pořadí jejich zápisu | Příklad | ||
1. | věcné upřesnění / zúžení významu hesla |
Význam veřejných knihoven | Knihovny veřejné - význam |
2. | pojem ve vztahu k heslu (věcné rozšíření, např. další téma) |
Veřejné knihovny a krajanské spolky | Knihovny veřejné - spolky krajanské |
3. | vztah hesla a podhesla typu 2 | Spolupráce veřejných knihoven a krajanských spolků |
Knihovny veřejné - spolky krajanské - spolupráce |
4. | proces | Informační činnost veřejných knihoven |
Knihovny veřejné - činnost informační |
5. | zeměpisné určení | Spolupráce českých veřejných knihoven a krajanských spolků | Knihovny veřejné - spolky krajanské - spolupráce - Česko |
6. | časové určení | Spolupráce českých veřejných knihoven a krajanských spolků ve 21. století |
Knihovny veřejné - spolky krajanské - spolupráce - Česko - 21. století |
7. | forma/žánr | Výzkum spolupráce českých veřejných knihoven a krajanských spolků ve 21. století |
Knihovny veřejné - spolky krajanské - spolupráce - Česko - 21. století - studie |
Tip:
Podívejte se na předmětová hesla
a) v rejstříku předmětových hesel v katalogu NK ČR
např. báze NKC - rejstříky Předmětová hesla (od r. 1995), Předmětová hesla (do r. 1994, inverze)
b) v katalogu Kongresové knihovny
https://catalog.loc.gov, pole LC Subjects, nebo https://catalog.loc.gov/vwebv/searchBrowse, browse Subjects
7. Možnosti řešení lingvistických a sémantických problémů
KDO/CO/KDE
na straně systému
na straně uživatele
KDY
při tvorbě systému organizace znalostí
během indexace zdroje (analýza obsahu zdroje)
během požadavku na zdroj (analýza informační potřeby)
JAK (metoda - co chceme dělat)
Synonymie
rozšíření požadavku o synonyma => rozšíření výsledků dotazu o zdroje obsahující synonyma - zvýšení úplnosti
Homonymie
zúžení požadavku o nerelevantní homonyma => zúžení výsledků dotazu na zdroje, obsahující pouze relevantní homonyma - zvýšení přesnosti
Složená témata
analýza: např. fasetová nebo závislostní analýza
syntéza: koordinace (tj. kombinace) složek tématu
a) prekoordinace - enumerace složených témat během indexace zdroje - zvýšení přesnosti
b) postkoordinace - syntéza jednoduchých témat během požadavku na zdroj - zvýšení úplnosti
Slovní spojení
a) zúžení výsledků dotazu na zdroje, obsahující daná slova těsně vedle sebe - zvýšení přesnosti
b) rozlišení syntagmatických a paradigmatických slovních spojení (zúžení výsledků dotazu na paradigmatická spojení) - zvýšení přesnosti
JAK (technika - jak/čím to udělat)
a) manuálně/intelektuálně
b) strojově/automatizovaně
JAK (nástroj - jak/čím to udělat)
1. Řízený slovník (systém organizace znalostí)
cíl: sjednocení sémantiky
=> zjednoznačnění významu
ekvivalence - homonyma: vyloučení z používání (balón viz míč), upřesnění významu definicí nebo kvalifikátorem (Úterý (den), Úterý (obec))
ekvivalence - gramatická synonyma: lemmatizace (přiřazení slovního tvaru k základnímu tvaru - lemmatu) a doplnění všech gramatických tvarů se stejným lemmatem
=> sjednocení označení
ekvivalence - synonyma: volba preferovaného termínu (např. UF - USE v tezaurech), jednotná notace (např. třídník/znak MDT, VIAF ID)
=> explicitní vyjádření vztahů
ekvivalence - synonyma: enumerace synonymních výrazů (např. synset ve WordNetu)
asociace, hierarchie
2. Indexový soubor
cíl: poskytnout přístup podle jiného hlediska, než podle jakého je setříděn (řazen) základní soubor.
zdroj indexového souboru:
text dokumentů
text realizovaných dotazů (seznam uložených dotazů)
metadata (např. intelektuálně vytvořená obsahová metadata vztahující se k dokumentům, kvantitativní údaje o "popularitě" dotazu)
3. Kontext / kolokace
cíl: využití kolokability – v textu, v indexu
=> převod syntagmatických vztahů na paradigmatické
Principy ekvivalence a jejich aplikace v přístupu ke zdrojům
1) ekvivalence umístěním (kolokace, kontext)
typ přístupu: browsing (prohlížení) – nahlédnutí do textu / do indexu
hypotéza: slova, která jsou v textech či v indexu blízko sebe, mají podobný význam (převod syntagmatických vztahů na paradigmatické)
2) ekvivalence označením/pojmenováním
typ přístupu: searching (vyhledávání)
hypotéza: slova, která se podobně píšou, mají podobný význam (převod formální ekvivalence na obsahovou)
7.1. Indexace složených pojmů v praxi organizace znalostí
Koordinace
využití více lexikálních jednotek k vyjádření složených témat (typ kolokace)
Prekoordinace
Složená témata se vyjadřují synteticky, enumerativně, explicitním zápisem každého složeného tématu (na vstupu, apriori, „paradigmaticky“). Vztahy jsou definovány už při tvorbě řízeného slovníku/systému organizace znalostí nebo při indexaci.
Vztahy mezi dílčími tématy se vyjadřují
a) přirozeným jazykem
Třída 01280 Pěstování koření, aromatických, léčivých a farmaceutických rostlin Klasifikace ekonomických činností (CZ-NACE)
Předmětové heslo Koření zelené - charakteristika, pěstování a použití - recepty kuchařské - brožury
b) umělým jazykem
Příklad:
Spojovací symboly (aplikační syntax) Mezinárodního desetinného třídění
+ přiřazení
/ rozšíření
: vztah (symetrický)
:: nezaměnitelný vztah
[ ] podřazení
Prekoordinované třídníky MDT a prekoordinovaná předmětová hesla v katalogizačním záznamu: https://aleph.nkp.cz/F/?func=direct&doc_number=002032140&local_base=NKC.
Postkoordinace
Složená témata se vyjadřují analyticky. Vztahy mezi dílčími tématy jsou definovány až při formulaci požadavku/dotazu (na výstupu, a posteriori, syntagmaticky). Zpravidla jsou omezeny na základní booleovské operátory (AND, OR, NOT).
Příklad:
Postkoordinované třídníky MDT a postkoordinovaná předmětová hesla v katalogizačním záznamu: https://aleph.nkp.cz/F/?func=direct&doc_number=003132374&local_base=NKC.
|
Poznámka: prekoordinace zvyšuje přesnost, postkoordinace zvyšuje úplnost |
Příklad pre- a postkoordinovaného vyjádření složeného tématu:
Složené téma "Vliv a účinky volného času na jednotlivce v České republice a na Slovensku v 21. století"
prekoordinované vyjádření složeným znakem MDT | prekoordinované vyjádření předmětovým heslem |
postkoordinované vyjádření termíny tezauru EUROVOC |
|||
---|---|---|---|---|---|
379.8-042.3:001.124-059.1"20"(437.3+437.6) | volný čas - jednotlivci - Česko - Slovensko - 21. století | volný čas | |||
sociální analýza | |||||
Česko | |||||
Slovensko |
Vysvětlivky k použitým znakům MDT | |||
379.8 | Volný čas. Dovolená, prázdniny | hlavní znak | Zdroj: Hlavní tabulky |
: | vztah | všeobecný pomocný symbol | Zdroj: Pomocné tabulky - Všeobecné pomocné symboly a značky - Tabulka 1b |
001.124 | Vlastnosti a účinky jevů | hlavní znak | Zdroj: Hlavní tabulky |
-042.3 | Vliv | všeobecný pomocný znak vztahů, procesů a operací (postupů) | Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1k |
-059.1 | Osoby jednotlivě. Jednotlivé osoby | všeobecný pomocný znak osob a osobních charakteristik | Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1k |
"20" | 21. století | všeobecný pomocný znak času | Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1g |
(437.3) | Česká republika. Česko | všeobecný pomocný znak místa | Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1e |
+ | přiřazení | všeobecný pomocný symbol | Zdroj: Pomocné tabulky - Všeobecné pomocné symboly a značky - Tabulka 1a |
(437.6) | Slovensko. Slovenská republika | všeobecný pomocný znak místa | Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1e |
8. Literatura
Základní teoretická literatura
ČERMÁK, František. Jazyk a jazykověda: přehled a slovníky. 4. dopl. vyd. Praha: Karolinum, 2011. 380 s. ISBN 987-80-246-1946-0. Pro členy akademické obce UK je dostupné prostřednictvím služby UKAŽ.
ČERNÝ, Jiří. Dějiny lingvistiky. 1. souborné vyd. Olomouc: Votobia, 1996. 517 s. ISBN 80-85885-96-4.
ECO, Umberto. Teorie sémiotiky. Přeložil Marek Sedláček. Vyd. 2., v Argu 1. Praha: Argo, 2009. 440 s. ISBN 978-80-257-0157-7 (váz.)
HAJIČOVÁ, Eva, PANEVOVÁ, Jarmila, SGALL, Petr. Úvod do teoretické a počítačové lingvistiky. I. svazek, Teoretická lingvistika. Praha: Karolinum, 2002, dotisk 2003. 156 s. Učební texty Univerzity Karlovy v Praze. ISBN 978-80-246-0470-1 (brož.).
PALEK, Bohumil, ed. Sémiotika: Ch. S. Peirce, C. K. Ogden and I. A. Richards, Ch. W. Morris, H. B. Curry. 2. přeprac. vyd. Praha: Karolinum, 1997. 335 s. ISBN 978-80-7184-356-6 (brož.). Skripta pro posluchače Filozofické fakulty UK.
SAUSSURE, Ferdinand de. Kurs obecné lingvistiky.
1. vyd. Praha: Odeon, 1989. 467 s. ISBN 80-207-0070-6.
2., v Academii 1. vyd. Praha: Academia, 1996. 468 s. ISBN 80-200-0560-9.
3., uprav., v Academii 2. vyd. Praha: Academia, 2007. 487 s. ISBN 978-80-200-1568-6.
Další zdroje
JIRSA, Jakub. Pár problémů se svobodou. In: Moderní divadlo. Září-říjen 2022, 1, s. 12-13. Dostupné také z: https://www.mestskadivadlaprazska.cz/mediateka/casopis/?pid=1721.
KOVÁŘ, Blahoslav. Věcné pořádání informací a selekční jazyky. Díl 1. Úvod do problematiky, systematické pořádání. Praha: ÚVTEI. 1981.
Kapitola 1.2 Základy teorie věcného pořádání informací v logice a sémiotice, s. 16-31.
Vydání z roku 1984 je k dispozici prostřednictvím portálu Kramerius (Díla nedostupná na trhu): https://ndk.cz/view/uuid:afa74890-33d6-11e2-824c-005056827e51
KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. 1. vyd. Praha: Karolinum, 2017. 269 s. ISBN 978-80-246-3587-3 (brož.). ISBN 978-80-246-3597-2 (pdf).
Kapitola 5.1 Teoretická východiska sémantické problematiky organizace znalostí, s. 202-210.
Složené pojmy v ISO 25964. Zdroj: ISO 25964-1:2011. Information and documentation – Thesauri and interoperability with other vocabularies – Part 1: Thesauri for information retrieval. 1st ed. Geneva: International Organization for Standardization, 2011-08-08. 152 s. - Kapitola 7 Complex concepts, s. 37-44.