Ensamble y Anotación de Genomas y Metagenomas

R

Datos generales

Código: ENSAMBLE
Duración: 40 horas
Nivel: básico
Idioma: español
Fecha: del 17 al 21 de mayo de 2021
Horario: lunes a jueves 9:00 -17:00, viernes 9:00-14:00
Modalidad: en línea

A

¿Qué aprenderás?

Al final del curso los participantes:

  • Tendrán conocimientos teóricos sobre las principales tecnologías de secuenciación de DNA.
  • Adquirirán conocimientos teóricos y prácticos sobre:
    1. las metodologías para realizar análisis de calidad y de limpieza de lecturas de secuenciación (archivos fastq),
    2. el ensamble y anotación de genomas y metagenomas,
    3. análisis de clasificación taxonómica de lecturas y contigs (regiones genómicas ensambladas) de origen metagenómico (no se considera análisis de datos de 16S).
@

Pre-requisitos

Requisitos de conocimientos previos

  • Unix a nivel intermedio. Todas las demostraciones de software se harán en este sistema operativo.
    Los participantes necesitan tener conocimientos de nivel intermedio en la línea de comandos de UNIX/Linux, entre los cuales se encuentran los comandos de manejo de archivos y directorios (rm, mkdir, cd, less, cut, sort,uniq, etc), formateo de datos (awk o perl command line, sed).
  • Estadística básica.
    Se requieren conocimientos básicos de estadística (conceptos básicos: media, mediana, desviación estándar, distribuciones estadísticas, pruebas de hipótesis, logaritmos).

Requisitos técnicos

  • El alumno deberá usar su computadora personal. Ésta deberá tener instalado MobaXterm (Windows), o alguna otra herramienta que nos permita realizar conexión SSH al servidor.
  • Aplicación Zoom instalada en la computadora que será utilizada durante el curso. Se puede descargar de la página de descargas del cliente de reuniones Zoom (requisitos del sistema).
  • Conexión a Internet
h

Descripción

El taller presenta las tecnologías de NGS y las metodologías para el ensamblado de genomas y metagenomas, de novo, así como su anotación. Así mismo, se abordará la clasificación taxonómica de lecturas y contigs de origen metagenómico (no se considera análisis de datos de 16S). Este curso está enfocado primordialmente en el manejo práctico de las herramientas computacionales y la correcta interpretación de los resultados.

i

Contenido

El contenido del curso consiste en los siguientes temas:

  • Unidad 1
    • Bienvenida
    • Conexión al servidor, creación de directorios, y archivos de trabajo.
  • Unidad 2
    • Análisis de Calidad: FastQC
    • Limpieza de secuencias: Trimmomatic
    • Limpieza de secuencias: Trim Galore
  • Unidad 3
    • Ensamble de genomas: Lecturas cortas (Velvet)
    • Ensamble de genomas: Lecturas cortas (SPAdes)
    • Ensamble de genomas: Lecturas largas (Canu)
    • Ensamble de genomas: Lecturas largas y cortas (SPAdes)
  • Unidad 4
    • Comparación y validación de ensambles: QUAST
    • Mapeo y visualización: Bowtie 2
    • Mapeo y visualización: SAMtools y Artemis
  • Unidad 5
    • Anotación funcional: Glimmer3
    • Anotación funcional: BLAST
    • Anotación funcional: Prokka
  • Unidad 6
    • Ensamble de metagenomas: metaSPAdes
    • Ensamble de metagenomas: MEGAHIT
    • Ensamble de metagenomas: IDBA_UD
    • Anotación de ensambles metagenómicos: Prokka
    • Comparación de ensambles metagenómicos: QUAST
  • Unidad 7
    • Clasificación taxonómica: MetaPhlAn2
    • Clasificación taxonómica: KRAKEN
    • Clasificación taxonómica: Kaiju
    • Comparación de clasificaciones taxonómicas
  • Unidad 8
    • Conclusiones y despedida
I

Software usado

  • Velvet
  • IDBA_UD
  • Spades
  • Megahit
  • MUMMER
  • BOWTIE
  • Quast
  • SMALT
  • Artemis
  • FastQC
  • IGV
  • AUGUSTUS
  • Glimmer3
  • Artemis
  • Kraken2
  • Metaphlan2
  • Kaiju
  • MaxBin
l

¿Quién es nuestra audiencia?

El curso va dirigido a estudiantes e investigadores en genómica, genética, bioinformática o ciencias computacionales, con especial interés en el manejo de datos genómicos y ensamblado de genomas, y/o que sus proyectos de investigación se vean beneficiados con este conocimiento.

Formato del curso: en línea

Este es un curso digital. Las sesiones y material del curso serán presentados en línea. Esta modalidad incluirá grabaciones de video o audio del material, intercambio de archivos y sesiones de discusión temáticos, ejercicios de auto-evaluación y acceso a los instructores para comentarios durante el curso.

Profesor

Dr. Luis Lozano

Unidad de Análisis Bioinformáticos, Centro de Ciencias Genómicas, UNAM