Anotace:

Práce s jazykovými korpusy je předmětem, v němž se studenti bakalářského studia seznámí s existencí jazykových korpusů a s možnostmi jejich využití v lingvistické praxi. Kurz je zaměřen na praktickou práci a je předstupněm k Semináři z korpusové lingvistiky, který následuje v NMgr. programu. Kromě seznámení se se základními druhy a vlastnostmi korpusů je důraz kladen na praktickou využitelnost korpusů v každodenním životě lingvisty. Důraz se klade na korpusy češtiny (ČNK) a němčiny (DeReKo a DWDS) vč. přidružených aplikací Kookkurrenzanalyse, CCDB, SOM, resp. Treq, SyD, Morfio ad. V oblasti využitelnosti jsou reflektovány potřeby studentů s ohledem na jejich bádání a psaní seminárních a závěrečných prací z ostatních disciplín.

Zakončení: zápočet - podmínky

1)     Absence max. 3

2)     Průběžná příprava do hodin

3)     aktivní účast na řešení zadaných úkolů

4)     závěrečná práce v rozsahu cca 3-5 stran týkající se rozboru zadané korpusové analýzy (nebo ověření praktické znalosti práce s korpusy ve formě otestování v posledním týdnu) NEBO praktické přezkoušení

Sylabus:

1. 21.2. Co je to korpus? K čemu slouží? Jak ho lze využít? Základní typy korpusů. Korpusy češtiny a němčiny - srovnání (DeReKo, ČNK, InterCorp) formou prezentace. Podmínky a vytvoření zázemí pro práci s korpusy (laptopy, přístup na internet, registrace do COSMAS II a ČNK). Spolurpráce na InterCorpu.

2.  28.2. Základní pochopení prostředí korpusového vyhledavače (COSMAS II.) – výběr archivu, korpusu, formulace nejjednodušších dotazů, možnosti nastavení (Optionen)

3.  7.3. DeReKo (IDS Mannheim) - COSMAS II. - základní funkce korpusového vyhledavače;  Procvičování základního vyhledávání v COSMAS II., regulární znaky apod.

4.  149.3. Pokročilé vyhledávání a jeho procvičování v COSMAS II.; víceslovná spojení

5.  21.3. Rozšiřující funkce z nabídky COSMAS II.; práce s taggovanými korpusy

6.  28.3. Kookkurenční analýza - způsob zadání a vyhodnocování vygenerovaných dat;  procvičování CQL (Corpus Query Language) ; frazémy a kolokace- zvláštní úkol pro korpusovou lingvistiku

7.  4.4. Přidružené aplikace – CCDB, SOM apod.; DWDS

8.  11.4. Český národní korpus - základní informace, základní vyhledávání

9.  18.4. odpadá - Velikonoční pondělí 

10. 25.4. Český národní korpus - procvičování vyhledávání, vysvětlení rozšiřujících funkcí, InterCorp

11. 2.5.  odpadá - SC

12. 9.5. SyD, Morfio, Treq, KWords, WaG

13. 16.5. Závěrečná diskuze nad problematikou korpusové lingvistiky, zadávání závěrečných prací, příp. zápočtový test

Naposledy změněno: sobota, 19. února 2022, 17.38