Osnova sekce

    • Základy praktické bioinformatiky

      volitelný předmět

    • doc. Ing. Petra Matoušková, Ph.D.

    • cíle kurzu

      Cílem kurzu je naučit se základní operace s bioinformatickými daty, především genovými nebo proteinovými sekvencemi, jejich získání z databází ve správném formátu, porovnání, hledání podobností apod.

    • Organizace

      Absolvování kurzu:

      zápočet

      (při prezenční výuce - účast: 8/10)

      "domácí úkoly": plnění úkolů (DU) zadaných v každé lekci z probrané tématiky(vyhledávání sekvencí, narhování primerů apod..)

      zkouška

      "písemná" u počítače-vypracovat soubor úkolů (2 sady 5 otázek)

    • Toto jsou ukázkové domácí úkoly vypracované T. Gazárkovou.

    • Literatura

      Applied bioinformatics - An introduction, P. Selzer, 2018

      Úvod do praktické bioinformatiky, F. Cvrčková, 2005 - trochu zastaralé

      Bioinformatics for dummies, J.M. Claverie, C. Notredame, 2007

      Knowledge Discovery in Bioinformatics, X. Hu, Y. Pan, 2007

    • Seznam témat

      1. Vyhledávání informací / literární rešerše

      2. Proteinová bioinformatika I - sekvence, vlastnosti, štěpení

      3. Proteinová bioinformatika II - domény, TM úseky, BLAST

      4. Proteinová bioinformatika III+shrnutí I - porovnání sekvencí, 3D

      5. Nukleotidová bioinformatika I - sekvence, vlastnosti

      6. Nukleotidová bioinformatika II - translace, identifikace, sekvenování

      7. Nukleotidová bioinformatika III - klonování, RE štěpení, primery

      8. Nukleotidová bioinformatika IV - primery s vloženými RE místy, primery pro qPCR, sekundární struktura RNA

      9. Nukleotidová bioinformatika V - primery pro mutagenezi, mikroRNA

      10. Shrnutí, opakování, příklady

      11. Zkouška 2023


    • HUGO

      databáze oficiálních zkratek genů 

    • UK A-ŽV%C3%BDst%C5%99i%C5%BEek.PNG

      Univerzitní vyhledavač literatury (včetně repozitáře závěrečných prací) zde.

    • PubmedV%C3%BDst%C5%99i%C5%BEek.PNGV%C3%BDst%C5%99i%C5%BEek.PNG

      Prohledávání databáze Medline. 

    • Web of ScienceV%C3%BDst%C5%99i%C5%BEek.PNG

      Databáze Web of Science od firmy Clavirate analytics zahrnuje pravidelně aktualizované bibliografické údaje o článcích z předních světových vědeckých a odborných časopisů ze všech oblastí vědy. Dále zahrnuje sledování citovanosti vědeckých článků a umožňuje sdružování vybraných referencí v rámci "Endnote online" aplikace.

    • ScopusSn%C3%ADmek%20obrazovky%202022-02-23%20185426.png

      Databáze Scopus umožňuje vzhledání H-indexu (hodnocení vědců).

    • Vyhledávání aminokyselinových sekvencí

      Expasy / UniProtV%C3%BDst%C5%99i%C5%BEek%20%282%29.PNG

      Expasy je portál umožňující vstup do různých vědeckých databází a nástrojů z oblasti genomiky, proteomiky, systémové biologie atd.


      Uniprot V%C3%BDst%C5%99i%C5%BEek2.PNGje proteinová databáze obsahující ručně anotované záznamy v rámci Swiss-Prot databáze a automaticky anotované záznamy v rámci TrEMBL databáze.
      Anglický detailní průvodce:

      NCBI protein

      V%C3%BDst%C5%99i%C5%BEek%20%283%29.PNG"National Center for Biotechnology Information protein" je databáze obsahující aminokyselinové sekvence z mnoha zdrojů, umožňující vyhledávání na základě textových zadání (zkratek, přístupových kódů, celých názvů proteinů).

    • Analýza vlastností proteinových sekvencí

      Predikce fyzikálně-chemických vlastností

      SMS suite: jednotlivé nástroje pro výpočet různých vlastností proteinové sekvence (Molekulová hmotnost, Izoelektrický bod, Statistika AMK složení, Výběr části proteinu)

      Expasy/ProtParam: umožňuje výpočet vícero různých vlastností proteinové sekvence.

      Predikce štěpení proteasami

      PeptideCutter je nástroj, který umožňuje simulovat štěpení proteinu vybranými proteasami.


    • Hledání známých motivů a domén

      Prohledávání databází obsahující typické sekvence/motivy, které vytváří určité strukturní motivy nebo domény. Program porovná všechny známé motivy zda se neobjevují s významnou shodou i v zadané sekvenci (příp. ID). 

      Na základě "architektury" proteinu lze předpovědět jeho funkci nebo identifikovat významné pozice (aminokyseliny), které jsou důležité pro katalytickou aktivitu apod.

      Zde jsou odkazy na různé nástroje a databáze:

      NCBI/CD

      SMART (umožňuje zvlášť identifikaci signálních peptidů)

      EMBL/InterPro

      (nepodporovaná Pfam)

    • Hledání signálních peptidů

      Na základě sekvence proteinu lze předpovědět jeho lokalizaci, díky rozpoznání signálního peptidu na N-konci proteinu.

      SignalP 

      SMART (umožňuje zvlášť identifikaci signálních peptidů)

       

    • Predikce transmembránových úseků

      Pro předpověď zda daný protein obsahuje transmembránové úseky existuje mnoho různých programů. Všechny vypočítávájí nejdříve profil hydrofobicity aminokyselin v dané sekvenci a poté s určitou pravděpodobností předpoví možné transmembránové úseky.

      profil hydrofobicity: Expasy/ProtScale

      predikce transmembránových úseků: TMHMM, Phobius,

       CCTOP, TopCons (oba kombinují výstup z více programů, odliší signální peptid)

      tvorba obrázků: PROTTER

    • Hledání podobných proteinů

      BLAST  (Basic Local Alignment Search Tool)

      Hledá podobné sekvence z vybraných databáze pomocí krátkých "slov“ (sekvencí vytvořených ze zadané sekvence), s využitím „substituční matice“, která udává míru rozdílnosti aminokyselin v porovnávaných pozicích v zadané sekvenci a vyhledané sekvenci

      NCBI/BLAST  návod použití (anglicky)

      UniProtKB/BLAST


    • Párové a mnohonásobné porovnání proteinových sekvencí - (multiple)alignment

      Porovnávání sekvencí probíhá podobně na bázi substitučních matic, které přiřazují odlišným aminokyselinám určité skóre, na němž je v součtu posouzena kvalita porovnání a podobnost sekvencí. Při zavádění mezer je připočítáváno skóre za vytvořenou mezeru, případně její prodloužení.

      Párové globální porovnání: Needle (porovnává dvě sekvence v celé délce)

      Párové lokální porovnání: LALING (nalezne a porovná více oblastí dvou sekvencí)

      Další nabídka programů pro párové porovnávání zde.

      Multalin (přehledný barevný vystup)

      Clustal Omega (možnost exportu pro tvorbu evolučních stromů)

      Vykreslení fylogenetického stromu z "Newick" formátu zde.

      Další možnosti: NCBI/COBALT

      Pokročilejší fylogenetické porovnávání zde.

    • 3-D Strukturní databáze

      PDB (Protein Data Bank)

    • Další zajímavé databáze:

      multifunkční proteiny (moondb), fosforylace (PhosphoSite), enzymová databáze (Brenda), interakce proteinů (STRING)

    • Opakování - příklady:

      sekvence peptidu:

      VTNLFILNLAISDLLVGIFCMPITLLDNIIAGWPFGNTMCKISGLVQGISVAASVFTLVA
      IAVDRFQCVVYPFKPKLTIKTAFVIIMIIWVLAITIMSPSAVMLHVQEEKYYRVRLNSQN
      KTSPVYWCREDWPNQEMRKIYTTVLFANIYLAPLSLIVIMYGRIGISLFRAAVPHTGRKN
      QEQWHVVSRKKQKIIKMLLIVALLFILSWLPLWTLMMLSDYADLSPNELQIINIYIYPFA
      HWLAFGNSSVNPIIYGFFNENFRRGFQEAFQLQLCQKRAKPMEAYALKAKSHVLINTSNQ

    • Př1: Vyhledejte v databázi NCBI sekvence těchto dvou lidských enzymů DHRS7B (AAH09679.1) a DHRS7C (AAI47025.1) a proveďte párové porovnání. Jaká je identita těchto dvou proteinů? Nápověda. Řešení.

    • Př2: Stáhněte si z Uniprot databáze tři sekvence isoforem lidské NQO1 a porovnejte je. Odpovídá vaše porovnání popisu jednotlivých isoforem? Nápověda. Řešení.

    • Př3: Pomocí proteomických nástrojů předpovězte fyzikálně-chemické vlastnosti sulfotransferasy (sulfotransferase) z krevničky střevní (Schistosoma mansoni). Nápověda. Řešení.

    • Př4: Stáhněte si sekvenci "neznámého proteinu"(zde). Pomocí predikce domén určete o jakou sekvenci by se mohlo jednat. Ověřte tuto skutečnost pomocí programu BLAST. Z jakého organismu tato sekvence pochází? Obsahuje nějaké transmembránové úseky? Nápověda. Řešení.



    • Porovnání nukleotidových sekvencí

      Porovnávání sekvencí nukleotidových probíhá podobně jako u proteinů, jen s použitím odlišných substitučních matic. Především při porovnávání "nespojitých" sekvencí (mRNA vs gDNA) je nutné vzít v úvahu zavádění mezer, případně jejich prodloužení.

      Postačí nám k porovnání Multalin (přehledný barevný vystup), se změnou matice na DNA-5-0.

    • TranslaceObr%C3%A1zek1.jpg

      =překlad nukleotidové sekvence v aminokyselinovou podle genetického kódu.

      SMS suite/ Translate → vhodné známe-li kde je čtecí rámec

      NCBI/ORFfinder → vhodné pro vyhledávání nejdelších „ORFů“

    • Identifikace neznámé sekvence

      BLASTn (prohledávání nukleotidových databází nukleotidovou sekvencí)

    • DNA sekvenování

      "Klasické" Sangerovo sekvenování (.scf, .abi, .ab1)

    • Identifikace "Kontaminace vektorem" neznámé sekvence

      VecScreen

      Odstranění "Kontaminace vektorem" neznámé sekvence

      SMS/Range Extractor



    • Klonování

      Labguide-obsahuje užitečné texty o laboratorních metodikách, včetně klonování

      Restrikční analýza

      SMS Suite: Restriction Summary

      NEB Cutter-obsahuje dostupné "komerční" informace o RE

      Analýza fragmentů

      SMS Suite: Restriction Digest

    • Návrh primerů-detekce genu

      Pick primers-NCBI návrh pro každý gen (př.NQO1)


    • Návrh primerů-kvantifikace genu(transkriptu)

      Primer3-program pro návržení dvojice primerů dle zadané sekvence

      mFOLD-program pro predikci sekundární struktury DNA/RNA

      Primer BLAST-kontrola specifity vybraných primerů (nebo přes "Pick primers")

    • Návrh mutačních primerů

      GC.PNG

      Range Extractor DNA / Protein - "vytažení" požadovaného úseku DNA / proteinu

      NCBI (Graphic) - na kontrolu vybraného úseku

      Oligocalc - kotrola primerů, možnost vložit mutaci a vytvořit druhý řetězec

  • Shrnutí, opakování a příklady

  • Zde budou zkouškové verze a prostor pro odevzdávání písemek.