Lingvistické problémy obsahové analýzy: studijní opora

Stránky: Moodle UK pro výuku 1
Kurz: Obsahová analýza - OBA
Kniha: Lingvistické problémy obsahové analýzy: studijní opora
Vytiskl(a): Guest user
Datum: pondělí, 27. května 2024, 11.23

1. Úvod

Základ lingvistických a sémantických problémů organizace znalostí - vztahy 1 : N

Ideál:

  • najít vše, co je relevantní
  • vyloučit vše, co není relevantní
relevance
    

Ukazatele:

  • úplnost (ang. recall)
    podíl vyhledaných zdrojů z relevantních
  • přesnost (ang. precision)
    podíl relevantních zdrojů z vyhledaných

Typologie problémů

Paradigmatické vztahy 1 : N
Syntagmatické vztahy 1 : N
Synonymie (1 význam – N lexémů) Složený pojem / složené téma (N významů)

Souznačnost. Konjunktivní (slučující) vztah jednotek vyjádření / lexémů (logické OR, a nebo).

Příklad:
„Ty raubíři, rošťáku, ničemo, šibeničníku, prašivko, hrubiáne, lotře, kreminálníku, poberto, vandráku, lenochu, darebo, kujóne, lupiči, taškáři, šupáku, pobudo, lumpe, otrapo, lucipere, nemravo, holomku, špatenko a zloději zlodějská...
(Karel Čapek. Pohádka o zdvořilém loupežníkovi)

Problém: Snížení úplnosti

Pojem/téma, které jsou rozložitelné na více jednotek obsahu. Partitivní vztah jednotek obsahu (logické AND, a zároveň).

Příklady:
elektrokolo = kolo + elektřina + pohon

matematicko-statistická teorie informace = matematika + statistika + informace + teorie
vojevůdce = muž + boj/bitva + vedení

Problém: analýza, syntéza

Homonymie (1 lexém – N významů) Slovní spojení (1 význam – N lexémů)

Disjunktivní (vylučující) vztah jednotek obsahu (XOR, buď / nebo).

Přesněji: víceznačnost. V rámci víceznačnosti se rozlišuje homonymie (souzvučnost) a polysémie (vícevýznamovost). Významy polysémů spolu souvisejí (kuchařka – kuchařka, hodinky  hodinky), významy homonym spolu nesouvisejí (stát – stát). Polysémii lze považovat za typ metafory nebo metonymie.

viceznacnost

Problém: Snížení přesnosti

Označuje se též jako fráze, frazém, frazeologismus, idiom, kolokace, víceslovný lexém / lexikální jednotka, koherentní víceslovný výraz, n-gram, sousloví, sdružené pojmenování.
Pojem, který je vyjádřen více slovy, ale z hlediska obsahu tvoří jeden dále nerozložitelný celek. Slovní spojení jsou tedy analyzovatelná syntakticky (např. na jednotlivá slova), ale nejsou analyzovatelná sémanticky.

Příklady:
černí baroni, červený kohout, stavební úřad, Jan Neruda, Nová Ves pod Pleší, postavení mimo hru, teorie sítí aktérů, plácnout se přes kapsu

Problém: Snížení přesnosti

2. Paradigmatické a syntagmatické vztahy v jazyce

Paradigma je...

Syntagma  je...

1. Paradigmatické vztahy

TDKIV - seznam termínů v bázi s vyjádřením paradigmatických vztahů ekvivalence a asociace (pole "Ekvivalent" a "Příbuzný termín"). Příklad: Termín "asociativní vztah". Dostupné z: https://aleph.nkp.cz/F/?func=direct&doc_number=000001504&local_base=KTD.

KLÉGR, Aleš. Tezaurus jazyka českého: slovník českých slov a frází souznačných, blízkých a příbuzných. 1. vyd. Praha: NLN, Nakladatelství Lidové noviny, 2007. 1189 s. ISBN 978-80-7106-920-1. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT) z: https://ndk.cz/view/uuid:8455b570-efb7-11e3-a2c6-005056827e51.

ČERMÁK, František. Recenze: Aleš Klégr: Tezaurus jazyka českého: slovník českých slov a frází souznačných, blízkých a příbuzných. In: Slovo a slovesnost. 2009, 70(2), 153-157. ISSN 0037-7031 (print). ISSN 2571-0885 (online). Dostupné z: https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:a6eb653e-2195-4819-8f22-02bc6928266b nebo prostřednictvím vyhledávače UKAŽ.

MAREŠOVÁ, Milena M. Tezaurus jazyka českého (recenze) [online audio]. 2008-03-10 [cit. 2023-11-23]. Dostupné z: https://vltava.rozhlas.cz/tezaurus-jazyka-ceskeho-recenze-5075265.

PÁLKA, Peter. Tezaurus jazyka českého [recenze]. In: Ikaros. 2008, 12(7) [cit. 2024-03-16] Dostupné z: https://ikaros.cz/tezaurus-jazyka-ceskeho. URN-NBN:cz-ik4884. ISSN 1212-5075.

Tezaurus Eurovoc - vyjádření paradigmatických vztahů ekvivalence, hierarchie a asociace.
Příklad: termín "robotizace". Dostupné z: https://skosmos.bartoc.org/15/en/page/3744?clang=cs

Paradigmatické vztahy vědních disciplín - klasifikace věd/mapování vědy
Places & Spaces: Mapping science. Dostupné z: https://scimaps.org/.

2. Syntagmatické vztahy

TDKIV - seznam dotazů do báze (search log) s vyjádřením syntagmatických vztahů (časová posloupnost zadávání dotazů - uvedeno v polích TIME STAMP, DATUM, CAS).

Search log

Český národní korpus - vyjádření syntagmatických vztahů v aplikaci KonText. Dostupné z: https://kontext.korpus.cz/

Syntagmatické vztahy vědních disciplín

Příklad: kyber-egyptologie

Vědci z Fakulty elektrotechnické ČVUT v Praze a z Českého egyptologického ústavu Filozofické fakulty UK zavedli novou vědní disciplínu kyber-egyptologii. 2018-07-09 [cit. 2023-11-23]. Dostupné z:
https://www.ff.cuni.cz/2018/07/vedci-fakulty-elektrotechnicke-cvut-praze-ceskeho-egyptologickeho-ustavu-filozoficke-fakulty-univerzity-karlovy-zavedli-novou-vedni-disciplinu-kyber-egyptologii/

3. Paradigmatické i syntagmatické vztahy

Slovo v kostce. In: Český národní korpus. Praha: Ústav českého národního korpusu, 1994- . Dostupné z: https://www.korpus.cz/

3. Synonymie - typy a příklady

Paradigmatická synonymie

3.1 Lexikální (věcná) synonymie
Zahrnuje tyto typy vztahů mezi významy slov:
  • ekvivalence
    může mít podobu symetrické ekvivalence významově rovnocenných prvků (např. útok - zteč) nebo asymetrické ekvivalence s určením jednoho ze synonym jako preferovaného
  • hierarchie
    hyponymie / hyperonymie
    meronymie / holonymie
  • asociace

Kvazisynonymie

Specifický případ ekvivalence. Každý z jazykových výrazů označuje jiný atribut (charakteristiku) stejného denotátu (např. Jitřenka - Večernice).

Kvazisynonymie v TDKIV - antonyma (opozita) "bibliofilie - bibliofobie":

https://aleph.nkp.cz/F/?func=direct&doc_number=000017146&local_base=KTD

Nástroj řešení: řízený slovník

3.2 Mezijazyková lexikální ekvivalence
Příklady věcné a mezijazykové synonymie

Typy lexikální synonymie v bázi národních věcných autorit NK ČR:
Zvukové dokumenty
https://aleph.nkp.cz/F/?func=direct&doc_number=000127701&local_base=AUVT
preferovaný termín: Záhlaví
nepreferovaný termín: Odkaz. forma

další typy synonym: Ident. číslo, Nadřazený termín, Podřazený termín, Asoc. termín, MDT, Angl. ekvivalent, Skupina Konspektu, Systém. číslo

Nástroj řešení: řízený slovník

Typy lexikální synonymie v TDKIV:
Sekundární dokument
https://aleph.nkp.cz/F/?func=direct&doc_number=000000921&local_base=KTD
preferovaný termín: Termín
nepreferovaný termín: Ekvivalent

Nástroj řešení: řízený slovník

Typy lexikální synonymie v bázi národních jmenných autorit NK ČR:
Tisíc a jedna noc

https://aleph.nkp.cz/F/?func=direct&doc_number=000380996&local_base=AUT
preferovaný termín: Záhlaví
nepreferovaný termín: Odkaz. forma

Nástroj řešení: řízený slovník

Typy lexikální synonymie v Mezinárodní virtuální databázi autorit VIAF:
Tisíc a jedna noc
http://viaf.org/viaf/303806052

Nástroj řešení: řízený slovník

Typy lexikální synonymie v Tezauru AGROVOC:
Vánoční stromky
https://agrovoc.fao.org/browse/agrovoc/en/page/c_1591
Prozkoumejte lexikální synonyma v různých jazycích (termínová synonymie).
Prozkoumejte mapování pojmu do jiných SOZ (pojmová synonymie): closely matching concepts, exactly matching concepts.

Nástroj řešení: řízený slovník

Typy lexikální synonymie v Tezauru LISS (Library & Information Science Source - Subject Terms) [via EBSCOhost]:
Zadejte "Communication -- Content analysis"

Nástroj řešení: řízený slovník


3.3 Gramatická (morfologická) synonymie

Gramatická synonymie v Českém národním korpusu:
Do okénka Dotaz v aplikaci KonText zadejte sloveso "jít".
Porovnejte výsledek s dotazem, v němž jako výchozí atribut nastavíte "word".

Nástroj řešení: řízený slovník - lemmatizace

Tip: Podívejte se do Základních informací k souboru národních tematických autorit ČR a zjistěte, jaká pravidla jsou uplatňována pro řešení gramatické synonymie.



Syntagmatická synonymie

3.4 Syntaktická synonymie

Pavlovi pomáhá Petr.
Petr Pavlovi pomáhá.
Petr pomáhá Pavlovi!
Pomáhá Pavlovi Petr?

Syntaktická synonymie v předmětových heslech v katalogu NK ČR: https://aleph.nkp.cz/F/?func=direct&doc_number=002706395&local_base=NKC

3.5 "Formální" synonymie

Založeno na následujících hypotézách:

a) Slova, která se podobně píšou, mají podobný význam (ekvivalence označením)

b) Slova, která jsou blízko sebe, mají významový vztah (ekvivalence umístěním)

Příklady
"Formální" synonymie ve Wikipedii:

Do okénka Hledat na Wikipedii zadejte "informační systém" a podívejte se na nabízená synonyma (dynamicky generovaná nabídka Hledat stránky obsahující...)
https://cs.wikipedia.org/

Nástroj řešení: indexový soubor

"Formální" synonymie v Českém národním korpusu:
V aplikaci KonText zvolte Pokročilý dotaz a zadejte následující dotaz v jazyce CQL:
[word=".*jít.*"]

Nástroj řešení: indexový soubor

"Formální" synonymie v indexovém souboru:

Podívejte se na obsah Frekvenčního slovníku.

Podívejte se na obsah rejstříku TDKIV (KTD - Prohlížení rejstříku):
Do okénka Zadejte heslo k otevření rejstříku zadejte "biblio"

http://aleph.nkp.cz/cze/ktd

Nástroj řešení: kontext

4. Homonymie - typy a příklady

Poprvé to profesora Parkhilla napadlo, když paní Yanoffská napsala v textu diktované básně:
Jaro se vrací, poslyšte, co v zahradě zpívá koz!
Od toho dne si stále připomínal, že začátečnická třída bezpodmínečně potřebuje poučení o slovech stejného znění a různého významu čili o homonymech. Přísně vzato, u slov kos a koz by se spíše než o homonymii mělo mluvit o homofonii, protože tato dvojice splývá jen ve své podobě mluvené, a nikoli též psané, jak je tomu u dvojice kos – kos, kde první slovo označuje ptáka a druhé je povelem ke kosení. Ovšem kos a kos jsou spíše slova homomorfní, protože se shodují jen v některých svých tvarech, a nikoli ve všech, jak tomu bývá u pravých homonym typu travička – travička a u takzvaných homografů, kde se shoduje pouze podoba grafická, kdežto výslovnost se liší, viz panický – panický.
[...]
„Dvě slova a jedno písání?” zaúpěla Olga Tarnovská.
„Tarnovská, učit a né stěžovat!” okřikl ji pan Kaplan. „Vy v baletu netančila dvě tanci na jednu muziku?!”

ROSTEN, Leo. Pan Kaplan má stále třídu rád. Praha: Odeon, 1988, s. 47-48.

4.1 Lexikální homonymie

Příklady homonymních termínů v oboru ICT

Alt email karta médium profil soubor tučňák
aplikace faseta klávesnice mechanika program spam účet
bit hlava klíč myš prompt stáhnout uzel
brána hlavička klik obvod protokol stránka vir(us)
„cédéčko“ hrana knihovna odkaz ROM strom vymazat
cloud (oblak) ikona kód okno rozbalit surfovat vypálit
červ jack koš ontologie schránka tablety základní deska
disk jádro kšandy paměť síť tapeta zásuvka
dlaždice jazyk lišta panel skříň tiskárna zavřít
editor kanál maska pole složka Trojský kůň zdroj

Lexikální homonymie v Českém národním korpusu:
V aplikaci KonText zadejte do vyhledávacího okénka slovo "ženou" a jako výchozí atribut nastavte "word".
Vyzkoušejte totéž se slovem "hnát".

Nástroj řešení: kontext

Lexikální homonymie v bázi národních věcných autorit NK ČR:
termín "Los"

https://aleph.nkp.cz/F/?func=direct&doc_number=000115175&local_base=Tem

Nástroj řešení: řízený slovník

Lexikální homonymie ve Wikipedii:
článek "Index"
https://cs.wikipedia.org/wiki/Index
Tip: Seznamte se s obsahem stránky Wikipedie:Rozcestníky.

Lexikální homonymie v TDKIV:
termín "Sekundární dokument"
https://aleph.nkp.cz/F/?func=direct&doc_number=000000921&local_base=KTD

Lexikální homonymie v Českém MDT online:
Do vyhledávacího okénka zadejte "zámky"
http://cz.udc-hub.com/

přihlášení pro členy akademické obce UK:
uživatelské jméno: ruk
heslo: uNIVERZITNImdt1

Nástroj řešení: kontext

Lexikální homonymie v klasifikaci KO Literature:
Třídy 351 a 361

http://www.isko.org/scheme.php

Nástroj řešení: kontext

4.2 Syntaktická homonymie

Slova s původně jednoznačným významem (tzv. monosémy) jsou seskupena tak, že výsledný výrok má více významů (např. moc slov - moc slov).

Syntaktická homonymie v titulcích zpráv:

Bikira své mládě nepřijala, je zpět v inkubátoru
Šokující srovnání! Boxerský svět zcela zastiňuje MMA
Někteří lidé stále čekají na voličské průkazy. Už dny přitom mohou ležet na poště.
Dávejte k nám děti, jen když je to nutné, prosí rodiče otevřené školky
Rodiče musí živit děti tak dlouho, dokud se nepostaví na vlastní nohy
Zvířata na jatkách budou povinně hlídat kamery, rozhodla vláda
V Brně uspořádali procházku po estakádě za 2,5 miliardy
Francouzský vrtulník sestřelil v Rudém moři húthíjský dron
Chobotnice podtrhla Ježkovi židli, teď se s ní vypořádá knihou
Herečky ze Sexu ve městě podpořily ženy, které obvinily herce Chrise Notha
Suzanne Vega vzdala komorní poctu New Yorku
Policisté střeží v Bílých Karpatech i zelenou hranici
Brněnský festival zahájil seriál o nálezu kokainu za dvě miliardy mezi banány
Budoucí učitelé se špatně učí
Papoušci sprostě nadávali návštěvníkům zoo, museli je schovat
V Krkonoších někdo postřelil vlka, ochranáři nakonec museli ukončit jeho trápení
Policie hledá uneseného vodníka z Dalovic, má vykulené oči
Policie pátrala po dvanáctileté dívce z Dejvic, nakonec se sama vrátila domů
Řeky zachraňuje už jen voda z přehrad
V nové knize Rowlingové jsou také obrázky českých dětí
Soud žádá upřesnit nařízení o nošení roušek venku, jinak přestane platit
Generální ředitel BBC odstoupil kvůli nepravdivému obvinění bývalého politika
Americký profesor, který předpověděl Trumpovo vítězství, je přesvědčen, že bude odvolán z funkce
Jak se chová ušatý obr
Orchestriony nahradí modernější soupravy, v Trutnově vyjede městský vlak

4.3 Sémantická homonymie

Např. ironie, sarkasmus, jazyková hříčka, vtip, metafora, metonymie.

Metafora = analogie obsahu
řešený problém: určení významu (věci)

Metonymie = analogie formy (označení)
řešený problém: pojmenování věci

Felix Holzmann. Včera, dnes a zítra.

Tip:

O povaze humoru Felixe Holzmanna a o jeho souvislosti s teorií komunikace se můžete dočíst zde:

TESAŘ, Antonín. Sisyfos humoru: mistr nedorozumění Felix Holzmann. In: A2larm [online]. 2022-10-13 [cit. 2023-10-13]. Dostupné z: https://a2larm.cz/2022/10/sisyfos-humoru-mistr-nedorozumeni-felix-holzmann/.

Jazyková komika Felixe Holzmanna je využita i ve filozofických esejích Vojtěcha Kolmana:

KOLMAN, Vojtěch. Noc, v níž se pořádají medvědí hony na zajíce. 1. vyd. Praha: Argo, 2020. 206 s. ISBN 978-80-257-3377-6.

Metafora a metonymie v haiku na Twitteru


Paronyma - falešní přátelé, zrádná slova

Homonyma, která se "tváří" jako synonyma

směsný odpad - směšný odpad

konkrétní (česky) - concrete (anglicky beton)

krásný (česky) - красный (rusky červený)

5. Slovní spojení - příklady

Česká národní bibliografie (báze CNB):
Zadejte "informační služby" a porovnejte výsledky s různým nastavením volby Blízkost slov (Ano - Ne).
https://aleph.nkp.cz/F/?func=file&file_name=find-b&local_base=cnb

Nástroj řešení: indexový soubor

Báze LISS (Library & Information Science Source) [via EBSCOhost]:
Zadejte "information services" a porovnejte výsledky s různým nastavením režimů vyhledávání ve volbě Možnosti hledání.

Nástroj řešení: indexový soubor

6. Složená témata a složené pojmy

Příčinou existence složených pojmů v systému jazyka jsou

a) Složitost fenoménů, jež pojmy odrážejí/reprezentují

b) Výskyt nových skutečností a fenoménů, pro něž se hledá vyjádření

Nejčastějšími způsoby reprezentace nových skutečností jsou spolu s neologismy právě složené pojmy.

Srovnání neologismů a složených pojmů
Neologismus, novotvar Složený pojem
nové paradigma nové syntagma
zpravidla založeno na metafoře založeno na kombinaci (koordinaci) již existujících pojmů
Příklady:
robot, dálnice, počítač, chvilkař*)
Příklady:
hypertext, finance a účetnictví, psychoanalýza, čistonosoplena, overturismus, tělesná výchova a sport, veřejné knihovny,
duše a tělo, digitální lékařský teploměr, aktivní meziknihovní výpůjční služba

*) Další příklady viz např.: JIŘIČKOVÁ, Jitka. Rouškomil, koronaut, haranténa... S koronavirem vzniklo 400 nových slov. In: iForum. 2020-04-28. Dostupné z: https://iforum.cuni.cz/IFORUM-16752.html.

6.1. Složené pojmy

V praxi se lze setkat se dvěma způsoby skládání témat/pojmů:

1) Souřadné skládání

tzv. aditivní vztah, symetrický vztah témat, koordinace/souřadnost - relativní nezávislost témat
partitivní hierarchie (složené téma je celek složený z dílčích částí): význam (extenze) se pomocí dalších složek rozšiřuje
typické pro polytematické zdroje

Příklady:
GLAM - galerie, knihovny, archivy a muzea
Čechy a Morava (Protektorát)
(ministerstvo) práce a sociálních věcí
(fakulta) informatiky a statistiky
výchova a vzdělávání
roky 2020/2022
červenobílý

Vyjádření v MDT: spojovací symboly + /

2) Podřadné skládání

tzv. fázový vztah, asymetrický vztah témat, subordinace (podřadnost), závislost/zahrnutí - jedno téma ovlivňuje význam druhého
generická hierarchie (složené téma je specifikací obecnějšího tématu): význam (extenze) se pomocí dalších složek zužuje

Příklady:
absenční výpůjční služby
novodobý
ekofyziologie rostlin
nosníky na pružném podkladě
jazykové slovníky
Archivy, knihovny a muzea v digitálním světě

Vyjádření v MDT: spojovací symboly  : [ ]

6.2. Analýza složených pojmů v praxi organizace znalostí

6.2.1 Hlavní zdroje výskytu složených pojmů během procesu indexace

a) Existence složených pojmů v systému jazyka

b) Informační zdroje, jež obsahují (zahrnují) více témat a polytematické zdroje


6.2.2 Analýza složených pojmů - pro a proti

Rozhodnutí, zda při indexaci ponechat složený pojem či ho rozložit, ovlivňují četné faktory (podrobný popis viz ISO 25964-1, s. 39-42):

  • Sémantické preference

    a) zobecňování vs. specifičnost
    Poznámka: Analýza složených témat na jejich konstituenty možná překvapivě vede k zobecňování (abstrakci) a tím ke ztrátě specifického významu složeného pojmu (např. psychoanalýza = psychika + analýza).

    b) důraz na téma (co je známo) vs. na réma (co je nové)

    c) prekoordinace vs. postkoordinace, resp. enumerace vs. kombinace

  • Uživatelské preference

  • Jazykové preference

    terminologický úzus
    literary warrant

  • Provozní požadavky

    konzistence indexace
    požadavek interoperability (např. prekoordinované systémy se hůře mapují)


6.2.3 Metody analýzy složených pojmů

Jednotlivé metody se navzájem nevylučují, je patrné překrývání některých principů. V praxi se často kombinují navzájem.


1) Fasetová analýza

Teoretickým základem této metody je systémová analýza, propracované techniky fasetové analýzy nabízí informační věda.

Příklad:

Fasetová struktura třídy 2 Náboženství v Mezinárodním desetinném třídění a její využití pro vyjádření složených témat:

  Hlavní znaky        Zvláštní pomocné znaky pro náboženství
233
Hinduismus v užším smyslu, podrobněji     
  2‑18 Člověk. Lidstvo. Lidství. Dogmatická antropologie
24
Buddhismus   2‑36 Svatí. Bóddhisattvové. Osoby, které dosáhly osvícení
27 Křesťanství
 

Kombinace hlavních a zvláštních pomocných znaků umožňující vyjádření složených témat
233‑18   Člověk. Lidstvo v hinduismu
233‑36   Svaté osoby, světci v hinduismu. Osvícení, probuzení
24‑18    Člověk. Lidstvo. Lidství (v buddhismu)
24‑36    Světci. Bódhisattvové. Osvícené, poučené, probuzené osoby (v buddhismu)
27‑18    Člověk, lidstvo, lidství, dogmatická antropologie v křesťanství
27‑36    Křesťanští světci. Hagiologie. Hagiografie


2) Závislostní analýza

Teoretickým základem této metody je lingvistika. Je vhodná zejména pro analýzu pojmů/témat vytvořených podřadným skládáním.

Typická struktura složených pojmů vytvořených podřadným skládáním (Zdroj: ISO 25964-1, s. 38-39)

1. Významové jádro (sémantický důraz, term focus, head)

Obecný pojem, jehož je složený pojem (jako celek) součástí / v němž je složený pojem zahrnut. Obvykle lze vyjádřit substantivem.

2. Rozlišující prvek (term difference, modifier)

Komponenta složeného pojmu, která slouží k zúžení rozsahu významového jádra a tudíž specifikuje jednu z jeho součástí
Uplatňuje se vztah generické hierarchie. Obvykle lze vyjádřit adjektivem.

3. Hledisko (aspekt)

– je-li aplikovatelné
Obecně: komponenta zužující významové jádro podle odlišného kritéria než rozlišující prvek (např. žánr/forma nebo uživatelské určení ve věcné katalogizaci v knihovnách). Obvykle lze vyjádřit slovesem. Aplikace hlediska přibližuje tuto metodu fasetové analýze.

Příklad:

text složenýPojem

Poznámka: Ve skutečnosti je skladba složených pojmů často ještě komplikovanější. To ukazuje termín "meziknihovní", který označuje složený pojem, jenž je rozložitelný na významové jádro "knihovny" a rozlišující prvek "mezi", vyjadřující interakci. Při analýze složených pojmů lze tedy zaznamenat jak generickou, tak partitivní hierarchii.

složený pojem


3) Analýza pro konstrukci předmětových hesel

Metoda je založena na dnes již neplatné ČSN 01 0188 Tvorba předmětových hesel z roku 1983.

Popis metody lze najít např. v publikaci KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: ÚVTEI, 1974, s. 34-36. Dostupné prostřednictvím Národní digitální knihovny (Díla nedostupná na trhu - DNNT) z https://ndk.cz/view/uuid:f9e5aba0-1f75-11e3-a5bb-005056827e52?page=uuid:d8e5d470-69fd-11e3-af76-5ef3fc9ae867.

Přehled aktuální praxe tvorby předmětových hesel v českých knihovnách: BALÍKOVÁ, Marie. Aplikace věcných autorit v bibliografických záznamech: Předmětové heslo NK ČR - PHNK. Prezentace, 32 snímků. Dostupné z: https://www.nkp.cz/o-knihovne/odborne-cinnosti/zpracovani-fondu/vecne-zpracovani-vecne-autority/predmetova-hesla-nkcr-phnk.

Struktura předmětového hesla:

heslo (doplněk hesla) - podheslo (doplněk podhesla)

heslo: významové jádro

podheslo: věcné nebo formální rozlišující prvky

Doplněk hesla či podhesla se uvádí pouze při nutnosti odlišit homonyma - např. RDA (pravidla), RDA (organizace)

Heslo a podheslo / podhesla se oddělují pomlčkou, doplněk se uvádí v kulatých závorkách.


Typy podhesel a pořadí jejich zápisu Příklad
1. věcné upřesnění / zúžení
významu hesla
Akvizice ve veřejných knihovnách
Knihovny veřejné - akvizice
2. pojem ve vztahu k heslu
(např. další téma)
Veřejné knihovny a krajanské spolky
Knihovny veřejné - spolky krajanské
3. vztah hesla a podhesla typu 2
Spolupráce veřejných knihoven
a krajanských spolků

Knihovny veřejné - spolky krajanské - spolupráce
4. zeměpisné určení Spolupráce českých veřejných knihoven
a krajanských spolků

Knihovny veřejné - spolky krajanské - spolupráce - Česko
5. časové určení Spolupráce českých veřejných knihoven
a krajanských spolků ve 21. století
Knihovny veřejné - spolky krajanské - spolupráce - Česko - 21. století
6. forma/žánr Výzkum spolupráce českých veřejných
knihoven a krajanských spolků ve 21. století

Knihovny veřejné - spolky krajanské - spolupráce - Česko - 21. století - studie

Tip:

Podívejte se na předmětová hesla
a) v rejstříku předmětových hesel v katalogu NK ČR (např. báze NKC - rejstříky Předmětová hesla (od r. 1995), Předmětová hesla (do r. 1994, inverze))
b) v katalogu Kongresové knihovny (https://catalog.loc.gov, pole LC Subjects, nebo https://catalog.loc.gov/vwebv/searchBrowse, browse Subjects)

7. Možnosti řešení lingvistických a sémantických problémů

KDO/CO/KDE

na straně systému
na straně uživatele


KDY

při tvorbě systému organizace znalostí
během indexace zdroje (analýza obsahu zdroje)
během požadavku na zdroj (analýza informační potřeby)


JAK (metoda - co chceme dělat)
Synonymie

rozšíření požadavku o synonyma => rozšíření výsledků dotazu o zdroje obsahující synonyma - zvýšení úplnosti

Homonymie

zúžení požadavku o nerelevantní homonyma => zúžení výsledků dotazu na zdroje, obsahující pouze relevantní homonyma - zvýšení přesnosti

Složená témata

analýza: např. fasetová nebo závislostní analýza

syntéza: koordinace (tj. kombinace) složek tématu
a) prekoordinace - enumerace složených témat během indexace zdroje - zvýšení přesnosti
b) postkoordinace - syntéza jednoduchých témat během požadavku na zdroj - zvýšení úplnosti

Slovní spojení

a) zúžení výsledků dotazu na zdroje, obsahující daná slova těsně vedle sebe - zvýšení přesnosti
b) rozlišení syntagmatických a paradigmatických slovních spojení (zúžení výsledků dotazu na paradigmatická spojení) - zvýšení přesnosti


JAK (technika - jak/čím to udělat)

a) manuálně/intelektuálně

b) strojově/automatizovaně


JAK (nástroj - jak/čím to udělat)

1. Řízený slovník (systém organizace znalostí)

cíl: sjednocení sémantiky

=> zjednoznačnění významu

ekvivalence - homonyma: vyloučení z používání (balón viz míč), upřesnění významu definicí nebo kvalifikátorem (Úterý (den), Úterý (obec))

ekvivalence - gramatická synonyma: lemmatizace (přiřazení slovního tvaru k základnímu tvaru - lemmatu) a doplnění všech gramatických tvarů se stejným lemmatem

=> sjednocení označení

ekvivalence - synonyma: volba preferovaného termínu (např. UF - USE v tezaurech), jednotná notace (např. třídník/znak MDT, VIAF ID)

=> explicitní vyjádření vztahů

ekvivalence - synonyma: enumerace synonymních výrazů (např. synset ve WordNetu)

asociace, hierarchie

2. Indexový soubor

cíl: poskytnout přístup podle jiného hlediska, než podle jakého je setříděn (řazen) základní soubor.

zdroj indexového souboru:
text dokumentů
text realizovaných dotazů (seznam uložených dotazů)
metadata (např. intelektuálně vytvořená obsahová metadata vztahující se k dokumentům, kvantitativní údaje o "popularitě" dotazu)

3. Kontext / kolokace

cíl: využití kolokability – v textu, v indexu

=> převod syntagmatických vztahů na paradigmatické


Principy ekvivalence a jejich aplikace v přístupu ke zdrojům

1) ekvivalence umístěním (kolokace, kontext)

typ přístupu: browsing (prohlížení) – nahlédnutí do textu / do indexu
hypotéza: slova, která jsou v textech či v indexu blízko sebe, mají podobný význam (převod syntagmatických vztahů na paradigmatické)

2) ekvivalence označením/pojmenováním

typ přístupu: searching (vyhledávání)
hypotéza: slova, která se podobně píšou, mají podobný význam (převod formální ekvivalence na obsahovou)

7.1. Indexace složených pojmů v praxi organizace znalostí

Koordinace

využití více lexikálních jednotek k vyjádření složených témat (typ kolokace)

Prekoordinace

Složená témata se vyjadřují synteticky, enumerativně, explicitním zápisem každého složeného tématu (na vstupu, apriori, „paradigmaticky“). Vztahy jsou definovány už při tvorbě řízeného slovníku/systému organizace znalostí nebo při indexaci.

Vztahy mezi dílčími tématy se vyjadřují

a) přirozeným jazykem

Příklad: Třída 01280 Pěstování koření, aromatických, léčivých a farmaceutických rostlin Klasifikace ekonomických činností (CZ-NACE)

b) umělým jazykem

Příklad: spojovací symboly (aplikační syntax) Mezinárodního desetinného třídění
+    přiřazení
/    rozšíření
:    vztah (symetrický)
::    nezaměnitelný vztah
[ ]    podřazení

Postkoordinace

Složená témata se vyjadřují analyticky. Vztahy mezi dílčími tématy jsou definovány až při formulaci požadavku/dotazu (na výstupu, a posteriori, syntagmaticky). Zpravidla jsou omezeny na základní booleovské operátory (AND, OR, NOT).

koordinace

      

Poznámka:

prekoordinace zvyšuje přesnost, postkoordinace zvyšuje úplnost


Příklad: Složené téma "Vliv a účinky volného času na jednotlivce v České republice a na Slovensku v 21. století"

prekoordinované vyjádření složeným znakem MDT    prekoordinované vyjádření
předmětovým heslem
   postkoordinované vyjádření
termíny tezauru EUROVOC
379.8-042.3:001.124-059.1"20"(437.3+437.6)    volný čas - jednotlivci - Česko - Slovensko - 21. století
   volný čas
sociální analýza
Česká republika
    Slovensko  

Vysvětlivky k použitým znakům MDT
379.8 Volný čas. Dovolená, prázdniny hlavní znak Zdroj: Hlavní tabulky
: vztah všeobecný pomocný symbol Zdroj: Pomocné tabulky - Všeobecné pomocné symboly a značky - Tabulka 1b
001.124 Vlastnosti a účinky jevů hlavní znak Zdroj: Hlavní tabulky
-042.3 Vliv všeobecný pomocný znak vztahů, procesů a operací (postupů) Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1k
-059.1 Osoby jednotlivě. Jednotlivé osoby všeobecný pomocný znak osob a osobních charakteristik Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1k
"20" 21. století všeobecný pomocný znak času Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1g
(437.3) Česká republika. Česko všeobecný pomocný znak místa Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1e
+ přiřazení všeobecný pomocný symbol Zdroj: Pomocné tabulky - Všeobecné pomocné symboly a značky - Tabulka 1a
(437.6) Slovensko. Slovenská republika všeobecný pomocný znak místa Zdroj: Pomocné tabulky - Všeobecné pomocné znaky - Tabulka 1e


8. Literatura

Základní teoretická literatura

ČERMÁK, František. Jazyk a jazykověda: přehled a slovníky. 4. dopl. vyd. Praha: Karolinum, 2011. 380 s.  ISBN 987-80-246-1946-0. Pro členy akademické obce UK je dostupné prostřednictvím služby UKAŽ.

ČERNÝ, Jiří. Dějiny lingvistiky. 1. souborné vyd. Olomouc: Votobia, 1996. 517 s. ISBN 80-85885-96-4.

ECO, Umberto. Teorie sémiotiky. Přeložil Marek Sedláček. Vyd. 2., v Argu 1. Praha: Argo, 2009. 440 s. ISBN 978-80-257-0157-7 (váz.)

HAJIČOVÁ, Eva, PANEVOVÁ, Jarmila, SGALL, Petr. Úvod do teoretické a počítačové lingvistiky. I. svazek, Teoretická lingvistika. Praha: Karolinum, 2002, dotisk 2003. 156 s. Učební texty Univerzity Karlovy v Praze. ISBN 978-80-246-0470-1 (brož.).

PALEK, Bohumil, ed. Sémiotika: Ch. S. Peirce, C. K. Ogden and I. A. Richards, Ch. W. Morris, H. B. Curry. 2. přeprac. vyd. Praha: Karolinum, 1997. 335 s. ISBN 978-80-7184-356-6 (brož.). Skripta pro posluchače Filozofické fakulty UK.

SAUSSURE, Ferdinand de. Kurs obecné lingvistiky.
1. vyd. Praha: Odeon, 1989. 467 s. ISBN 80-207-0070-6.
2., v Academii 1. vyd. Praha: Academia, 1996. 468 s. ISBN 80-200-0560-9.
3., uprav., v Academii 2. vyd. Praha: Academia, 2007. 487 s. ISBN 978-80-200-1568-6.


Další zdroje

JIRSA, Jakub. Pár problémů se svobodou. In: Moderní divadlo. Září-říjen 2022, 1, s. 12-13. Dostupné také z: https://www.mestskadivadlaprazska.cz/mediateka/casopis/?pid=1721.

KOVÁŘ, Blahoslav. Věcné pořádání informací a selekční jazyky. Díl 1. Úvod do problematiky, systematické pořádání. Praha: ÚVTEI. 1981.
Kapitola 1.2 Základy teorie věcného pořádání informací v logice a sémiotice, s. 16-31.
Vydání z roku 1984 je k dispozici prostřednictvím portálu Kramerius (Díla nedostupná na trhu): https://ndk.cz/view/uuid:afa74890-33d6-11e2-824c-005056827e51

KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. 1. vyd. Praha: Karolinum, 2017. 269 s. ISBN 978-80-246-3587-3 (brož.). ISBN 978-80-246-3597-2 (pdf).
Kapitola 5.1 Teoretická východiska sémantické problematiky organizace znalostí, s. 202-210.

Složené pojmy v ISO 25964. Zdroj: ISO 25964-1:2011. Information and documentation – Thesauri and interoperability with other vocabularies – Part 1: Thesauri for information retrieval. 1st ed. Geneva: International Organization for Standardization, 2011-08-08. 152 s. - Kapitola 7 Complex concepts, s. 37-44.