Topic outline

  • General

  • Praktické informace

    Anotace

    Studenti se v semináři naučí pracovat s jazykovými texty a korpusovými nástroji tak, aby byli schopni budovat vlastní korpusy pro své badatelské nebo pedagogické potřeby.

    Cíl předmětu

    Naučit studenty pracovat s jazykovými texty a korpusovými nástroji tak, aby byli schopni budovat vlastní korpusy

    Sylabus

    • jazykové korpusy a jejich využití
    • seznámení s možnostmi systému TEITOK, porovnání s vyhledávačem KonText 
    • příprava textu, přepis, anotace, opravy
    • metadata, obraz a zvuk
    • hledání v korpusu
    • přizpůsobení a správa systému

    Čas a místo

    Výuka bude probíhat formou občasných prezenčních setkání a distančně: zpracováváním jazykových textů podle zadání a konzultacemi s využitím internetového fóra

    Jak se přihlásit do systému TEITOK

    K vytvoření, anotování a prohledávání korpusu budeme používat systém TEITOK, viz http://www.teitok.org. Dozvíte se, jak si snadno vyrobit korpus z vlastních textů, ale hlavně se seznámíte s možnostmi manuální i automatické anotace textů sepsaných studenty češtiny jako cizího jazyka.  

    Do systému TEITOK se přihlásíte takto:

    1. do prohlížeče zadejte adresu http://utkl.ff.cuni.cz/teitok/czesl/
    2. vlevo v Main Menu klikněte na Login
    3. jako Email zadejte adresu, kterou používáte v SISu
    4. jako Password zadejte “teitok” (bez uvozovek)
    5. klikněte na tlačítko Login
    6. heslo si podle pokynů změňte
    7. vraťte se k úvodní stránce a klikněte v hlavní nabídce dole na XML Files
    8. ze seznamu “List of XML files” klikněte na složku nazvanou Vašimi iniciálami (s omluvou Janu Hromkovi, na kterého zůstalo JR) 
    9. klikněte na složku ROZCVICKA, obsahující texty, které si zkusíme anotovat; každý má stejné texty

    Internetové fórum

    Při práci s texty a korpusovým systémem je velmi důležité mít možnost se při pochybnostech o čemkoli zeptat nebo vznést podnět všeho druhu. K tomu slouží internetové forum Práce se systémem TEITOK (původně na adrese http://utkl.ff.cuni.cz/phpbb). Budeme se snažit odpovídat co nejdříve.

    Zkušební texty k anotaci

    V úvodním semináři jsme si zkusili společně opravit některé chyby v posledním z textů ve složce ROZCVICKA (ttt_H2_441.xml). Ostatní texty byste si zkuste anotovat samostatně s pomocí návodu http://utkl.ff.cuni.cz/dokuwiki/doku.php?id=skript_man:navod_k_anotaci a slíbeného tutoriálu. Dotazy a přípomínky směrujte prosím do fóra.

    Výuková videa

    Nejdůležitější vlastnosti systému TEITOK budou postupně představeny pomocí krátkých tutoriálů, viz téma Příprava textu, přepis, anotace, opravy.

  • Jazykové korpusy a jejich využití

  • Seznámení s možnostmi systému TEITOK, porovnání s vyhledávačem KonText

    TEITOK - a Tokenized TEI environment

    KonText

     

  • Vytvoření vlastního korpusu

  • Příprava textu, přepis, anotace, opravy

  • Hledání v korpusu

  • Metadata, obraz a zvuk

  • Správa a přizpůsobení systému TEITOK