NGS: Ensamble y anotación de genomas

Datos Generales

Código : T1-NGS-E
Duración : 40 horas
Nivel : Intermedio
Idioma: Español

Profesores

Dr. Luis Lozano Aguirre (Unidad de Análisis Bioinformáticos, CCG UNAM, México)
Dr. Gamaliel López (IBt UNAM, México)

Descripción

El taller presenta las tecnologías de NGS y las metodologías para el ensamblado de genomas de novo y también basados en referencias, así como su anotación. Este curso está enfocado primordialmente en el manejo práctico de las herramientas computacionales.

Objetivo del curso

Al final del curso los participantes:

  1. Tendrán conocimientos teóricos sobre las principales tecnologías de secuenciación de DNA
  2. Adquirirán conocimientos prácticos y teóricos sobre las metodologías para ensamblar y anotar genomas

Audiencia

Estudiantes e investigadores en genómica, genética, bioinformática o ciencias computacionales, con especial interés en el manejo de datos genómicos y ensamblado de genomas, y/o que sus proyectos de investigación se vean beneficiados con este conocimiento.

Pre-Requisitos

Unix a nivel intermedio. Todas las demostraciones de software se harán en este sistema operativo.

  • Los participantes necesitan tener conocimientos de nivel intermedio en la línea de comandos de UNIX/Linux, lo que implica manejo de archivos y directorios (rm, mkdir, cd, less, cut, sort, uniq, etc), formateo de datos (awk o perl command line, sed).

Estadistica básica. Se requieren conocimientos básicos de estadística (conceptos básicos: media, mediana, desviación estándar, distribuciones estadísticas, pruebas de hipótesis, logaritmos).
Servidor/Terminales. Para este curso se usará:

  • Un servidor con cuentas para cada usuario.
  • Terminales para que los usuarios se conecten al servidor, o bien el alumno podrá traer su computadora con MobaXterm, Zoc7 o alguna herramienta que nos permita realizar conexión SSH al servidor.

Contenido

El contenido del curso consiste en los siguientes temas:

  1. Tecnologías de secuenciación de DNA
  • Primera generación (Sanger)
  • Segunda generación (454, Illumina, Ion Torrent)
  • Tercera generación (PacBio)
  1. Construcción y características de librerías
  • shot-gun
  • paired-end
  • mate-pair
  1. Manejo de datos de NGS. Formatos de archivo, identificadores, modelos de error y calidad. Herramientas de transformación y preprocesado. Control de calidad y filtrado de lecturas.
  • Plataformas: Illumina, Ion Torrent y PacBio
  • Lecturas tipo paired-end y mate-pair
  1. Bases de datos genómicos
  • NCBI
  • EMBL
  • DDBJ
  1. Algoritmos para ensamble de genomas de novo
  • Técnicas y algoritmos para lecturas de un solo tipo
  • Técnicas y algoritmos para ensambles híbridos
  • Ensambladores: Velvet (Illumina), Newbler, Spades (Illumina, PacBio). Ejemplos de uso y características del output
  1. Remapeo de lecturas y técnicas de validación de ensambles
  • Comparación con genomas de referencia – MUMMER
  • Alineadores: BOWTIE, MAQ, SMALT
  • Visualización:BAMview, IGV, Artemis
  1. Anotación de Genomas. Modelos de genes en procariontes y eucariontes
  • rRNA y tRNA
  • CDSs, intrones/exones
  • Predictores de genes: AUGUSTUS, Glimmer3
  • Anotaciones automáticas y manuales
  • Bases dedatos para anotación
  1. Visualización de genomas
  • Artemis, ACT
  1. Práctica Final. Conclusiones y Perspectivas