Anotace a sylabus kurzu
Anotace:
Práce s jazykovými korpusy je předmětem, v němž se studenti bakalářského studia seznámí s existencí jazykových korpusů a s možnostmi jejich využití v lingvistické praxi. Kurz je zaměřen na praktickou práci a je předstupněm k Semináři z korpusové lingvistiky, který následuje v NMgr. programu. Kromě seznámení se se základními druhy a vlastnostmi korpusů je důraz kladen na praktickou využitelnost korpusů v každodenním životě lingvisty. Důraz se klade na korpusy češtiny (ČNK) a němčiny (DeReKo a DWDS) vč. přidružených aplikací Kookkurrenzanalyse, CCDB, SOM, resp. Treq, SyD, Morfio ad. V oblasti využitelnosti jsou reflektovány potřeby studentů s ohledem na jejich bádání a psaní seminárních a závěrečných prací z ostatních disciplín.
Zakončení: zápočet - podmínky
1) Absence max. 3
2) Průběžná příprava do hodin
3) aktivní účast na řešení zadaných úkolů
4) závěrečná práce v rozsahu cca 3-5 stran týkající se rozboru zadané korpusové analýzy (nebo ověření praktické znalosti práce s korpusy ve formě otestování v posledním týdnu) NEBO praktické přezkoušení
Sylabus:
1. 21.2. Co je to korpus? K čemu slouží? Jak ho lze využít? Základní typy korpusů. Korpusy češtiny a němčiny - srovnání (DeReKo, ČNK, InterCorp) formou prezentace. Podmínky a vytvoření zázemí pro práci s korpusy (laptopy, přístup na internet, registrace do COSMAS II a ČNK). Spolurpráce na InterCorpu.
2. 28.2. Základní pochopení prostředí korpusového vyhledavače (COSMAS II.) – výběr archivu, korpusu, formulace nejjednodušších dotazů, možnosti nastavení (Optionen)
3. 7.3. DeReKo (IDS Mannheim) - COSMAS II. - základní funkce korpusového vyhledavače; Procvičování základního vyhledávání v COSMAS II., regulární znaky apod.
4. 149.3. Pokročilé vyhledávání a jeho procvičování v COSMAS II.; víceslovná spojení
5. 21.3. Rozšiřující funkce z nabídky COSMAS II.; práce s taggovanými korpusy
6. 28.3. Kookkurenční analýza - způsob zadání a vyhodnocování vygenerovaných dat; procvičování CQL (Corpus Query Language) ; frazémy a kolokace- zvláštní úkol pro korpusovou lingvistiku
7. 4.4. Přidružené aplikace – CCDB, SOM apod.; DWDS
8. 11.4. Český národní korpus - základní informace, základní vyhledávání
9. 18.4. odpadá - Velikonoční pondělí
10. 25.4. Český národní korpus - procvičování vyhledávání, vysvětlení rozšiřujících funkcí, InterCorp
11. 2.5. odpadá - SC
12. 9.5. SyD, Morfio, Treq, KWords, WaG
13. 16.5. Závěrečná diskuze nad problematikou korpusové lingvistiky, zadávání závěrečných prací, příp. zápočtový test