Taller 2: Bioinformática para análisis de datos de secuenciación masiva (NGS)

Nivel: medio-avanzado

Objetivo: Presentar un panorama amplio y en detalle de las tecnologías de NGS para análisis genómicos con énfasis en el manejo práctico de las metodologías computacionales (software) diseñadas para tal fin. La primera semana estará enfocada al ensamble de genomas de novo y su anotación. La segunda semana estará enfocada al análisis funcional de genomas mediante diferentes técnicas de transcriptómica (RNA-seq, Chip-Seq).

Requisitos: Los participantes necesitan dominar la línea de comandos de UNIX/Linux. Todas las demostraciones de software ser harán en este sistema operativo. Se requiren además conocimientos básicos de estadística. Algunas de las pláticas y talleres serán en inglés, por lo tanto se requiere dominio del idioma.

Lugar: Aula 4 LCG

Programa

Semana 1 (del 13 al 17 de Enero de 2014)

Ensamble de genomas de novo y su anotación

Día 1.
Lunes 13 de Enero
 
10:00-11:30 Tecnologías de Secuenciación de DNA. Ricardo Grande (IBt-UNAM)
  • Primera generación (Sanger)
  • Segunda generación (454, Illumina, Ion Torrent)
  • Tercera generación (PacBio)
11:30-12:00 Coffee break
12:00-13:30 Construcción y características de librerías. Ricardo Grande (IBt-UNAM)
  • shot-gun
  • paired-end
  • mate-pair
13:30-15:30 Comida
15:30-18:30 Manejo de datos de NGS. Formatos de archivo, identificadores, modelos de error y calidad. Herramientas de transformación y preprocesado. Control de calidad y filtrado de lecturas. Verónica Jiménez (IBt-UNAM).
  • Plataformas 454, Illumina, Ion Torrent y PacBio
  • Lecturas tipo paired-end y mate-pair
Día 2.
Martes 14 de Enero
 
10:00-13:30 y 15:30-18:30 Algoritmos para ensamble de genomas de novo. Karel Estrada (IBt-UNAM), Luis Lozano (CCG-UNAM). Martes 14.
  • Técnicas y algoritmos para lecturas de un solo tipo
  • Técnicas y algoritmos para ensambles híbridos
  • Ensambladores: Velvet (Illumina), Newbler (454), MIRA (454). Ejemplos de uso y características del output
   
Día 3.
Miércoles 15 de Enero
 
10:00-13:30 y 15:30-18:30 Remapeo de lecturas y técnicas de validación de ensambles. Karel Estrada (IBt-UNAM).
  • Comparación con genomas de referencia – MUMMER
  • Alineadores: BOWTIE, MAQ, SMALT
  • Visualización: BAMview, IGV, artemis
   
Día 4.
Jueves 16 de Enero
 
10:30-13:30 Anotación de Genomas. Modelos de genes en procariontes y eucariontes. Alejandro Sánchez (IBt-UNAM), Luis Lozano (CCG-UNAM).
  • rRNA y tRNA
  • CDSs, intrones/exones
  • Predictores de genes: AUGUSTUS, Glimmer3
  • Anotaciones automáticas y manuales
  • Bases de datos para anotación
13:30-15:30 Comida
15:30-18:30 Visualización de genomas. Alejandro Sánchez (IBt-UNAM).
  • Artemis, ACT
Día 5.
Viernes 17 de Enero
 
10:00-13:30 Práctica Final. Conclusiones y Perspectivas. Alejandro Sánchez (IBt-UNAM).
13:30-15:30 Comida
15:30-18:30 Pangenómica y filogenómica microbiana. Pablo Vinuesa (CCG-UNAM).
  • GET_HOMOLOGUES
 

Semana 2 (del 20 al 24 de Enero de 2014): Genómica funcional: transcriptómica

  • Transcriptómica 1. Cei Abreu (LANGEBIO). Lunes 20.
    • Control de calidad de datos
      • Introducción al ambiente de cómputo estadístico R
      • Uso de paquete Bioconductor para análisis de la calidad de datos de Illumina
  • Transcriptómica 2. Carlos Pérez (EEAD-CSIC). Martes 21 - Jueves 23.
    • Técnicas básicas de ensambles de transcriptomas
    • Validación de transcriptomas
      • ensamble de novo de datos RNA-Seq con Trinity
      • Visualización del ensamble con GBrowse
  • Transcriptómica 3. Carlos Pérez (EEAD-CSIC). Viernes 24.
    • Diseño de experimentos de RNA-seq y análisis de expresión diferencial del transcriptoma