Topic outline

 • General

 • Praktické informace

  Anotace

  Studenti se v semináři naučí pracovat s jazykovými texty a korpusovými nástroji tak, aby byli schopni budovat vlastní korpusy pro své badatelské nebo pedagogické potřeby.

  Cíl předmětu

  Naučit studenty pracovat s jazykovými texty a korpusovými nástroji tak, aby byli schopni budovat vlastní korpusy

  Sylabus

  • jazykové korpusy a jejich využití
  • seznámení s možnostmi systému TEITOK, porovnání s vyhledávačem KonText 
  • příprava textu, přepis, anotace, opravy
  • metadata, obraz a zvuk
  • hledání v korpusu
  • přizpůsobení a správa systému

  Čas a místo

  Výuka bude probíhat formou občasných prezenčních setkání a distančně: zpracováváním jazykových textů podle zadání a konzultacemi s využitím internetového fóra

  Jak se přihlásit do systému TEITOK

  K vytvoření, anotování a prohledávání korpusu budeme používat systém TEITOK, viz http://www.teitok.org. Dozvíte se, jak si snadno vyrobit korpus z vlastních textů, ale hlavně se seznámíte s možnostmi manuální i automatické anotace textů sepsaných studenty češtiny jako cizího jazyka.  

  Do systému TEITOK se přihlásíte takto:

  1. do prohlížeče zadejte adresu http://utkl.ff.cuni.cz/teitok/czesl/
  2. vlevo v Main Menu klikněte na Login
  3. jako Email zadejte adresu, kterou používáte v SISu
  4. jako Password zadejte “teitok” (bez uvozovek)
  5. klikněte na tlačítko Login
  6. heslo si podle pokynů změňte
  7. vraťte se k úvodní stránce a klikněte v hlavní nabídce dole na XML Files
  8. ze seznamu “List of XML files” klikněte na složku nazvanou Vašimi iniciálami (s omluvou Janu Hromkovi, na kterého zůstalo JR) 
  9. klikněte na složku ROZCVICKA, obsahující texty, které si zkusíme anotovat; každý má stejné texty

  Internetové fórum

  Při práci s texty a korpusovým systémem je velmi důležité mít možnost se při pochybnostech o čemkoli zeptat nebo vznést podnět všeho druhu. K tomu slouží internetové forum Práce se systémem TEITOK (původně na adrese http://utkl.ff.cuni.cz/phpbb). Budeme se snažit odpovídat co nejdříve.

  Zkušební texty k anotaci

  V úvodním semináři jsme si zkusili společně opravit některé chyby v posledním z textů ve složce ROZCVICKA (ttt_H2_441.xml). Ostatní texty byste si zkuste anotovat samostatně s pomocí návodu http://utkl.ff.cuni.cz/dokuwiki/doku.php?id=skript_man:navod_k_anotaci a slíbeného tutoriálu. Dotazy a přípomínky směrujte prosím do fóra.

  Výuková videa

  Nejdůležitější vlastnosti systému TEITOK budou postupně představeny pomocí krátkých tutoriálů, viz téma Příprava textu, přepis, anotace, opravy.

 • Jazykové korpusy a jejich využití

 • Seznámení s možnostmi systému TEITOK, porovnání s vyhledávačem KonText

  TEITOK - a Tokenized TEI environment

  KonText

   

 • Vytvoření vlastního korpusu

 • Příprava textu, přepis, anotace, opravy

 • Hledání v korpusu

 • Metadata, obraz a zvuk

 • Správa a přizpůsobení systému TEITOK