Section outline
-
Anotace
Studenti se v semináři naučí pracovat s jazykovými texty a korpusovými nástroji tak, aby byli schopni budovat vlastní korpusy pro své badatelské nebo pedagogické potřeby.Cíl předmětu
Naučit studenty pracovat s jazykovými texty a korpusovými nástroji tak, aby byli schopni budovat vlastní korpusy
Sylabus
- jazykové korpusy a jejich využití
- seznámení s možnostmi systému TEITOK, porovnání s vyhledávačem KonText
- příprava textu, přepis, anotace, opravy
- metadata, obraz a zvuk
- hledání v korpusu
- přizpůsobení a správa systému
Čas a místo
Výuka bude probíhat formou občasných prezenčních setkání a distančně: zpracováváním jazykových textů podle zadání a konzultacemi s využitím internetového fóra
Jak se přihlásit do systému TEITOK
K vytvoření, anotování a prohledávání korpusu budeme používat systém TEITOK, viz http://www.teitok.org. Dozvíte se, jak si snadno vyrobit korpus z vlastních textů, ale hlavně se seznámíte s možnostmi manuální i automatické anotace textů sepsaných studenty češtiny jako cizího jazyka.
Do systému TEITOK se přihlásíte takto:
1. do prohlížeče zadejte adresu http://utkl.ff.cuni.cz/teitok/czesl/
2. vlevo v Main Menu klikněte na Login
3. jako Email zadejte adresu, kterou používáte v SISu
4. jako Password zadejte “teitok” (bez uvozovek)
5. klikněte na tlačítko Login
6. heslo si podle pokynů změňte
7. vraťte se k úvodní stránce a klikněte v hlavní nabídce dole na XML Files
8. ze seznamu “List of XML files” klikněte na složku nazvanou Vašimi iniciálami (s omluvou Janu Hromkovi, na kterého zůstalo JR)
9. klikněte na složku ROZCVICKA, obsahující texty, které si zkusíme anotovat; každý má stejné textyInternetové fórum
Při práci s texty a korpusovým systémem je velmi důležité mít možnost se při pochybnostech o čemkoli zeptat nebo vznést podnět všeho druhu. K tomu slouží internetové forum Práce se systémem TEITOK (původně na adrese http://utkl.ff.cuni.cz/phpbb). Budeme se snažit odpovídat co nejdříve.Zkušební texty k anotaci
V úvodním semináři jsme si zkusili společně opravit některé chyby v posledním z textů ve složce ROZCVICKA (ttt_H2_441.xml). Ostatní texty byste si zkuste anotovat samostatně s pomocí návodu http://utkl.ff.cuni.cz/dokuwiki/doku.php?id=skript_man:navod_k_anotaci a slíbeného tutoriálu. Dotazy a přípomínky směrujte prosím do fóra.Výuková videa
Nejdůležitější vlastnosti systému TEITOK budou postupně představeny pomocí krátkých tutoriálů, viz téma Příprava textu, přepis, anotace, opravy.
-
TEITOK - a Tokenized TEI environment
- TEITOK: Merging Digital Humanities and Corpus Linguistics – přednáška 27/05/2019 na MFF UK Praha
KonText
-