T4: Taller de asesoría para el ensamble y anotación de tu genoma de estudio

R

Datos generales

Código: T4-ASESORIA
Duración: 40 horas
Nivel: intermedio
Idioma: español
Fecha: del 5 al 9 de agosto de 2019
Lugar: Aula 1 Docencia CCG
Cupo: 10 lugares
Cuota de recuperación única: $5,000 MXN

A

¿Qué lograrás?

Este taller es en realidad una asesoría personalizada, que consiste en brindarle a los alumnos que lo tomen, el apoyo necesario para el ensamble y anotación de su genoma de estudio.

Al final de la semana:

  • Habrás logrado ensamblar el genoma de tu interés.
  • Habrás logrado realizar la anotación del genoma de tu interés.
  • En algunos casos, dependiendo del tiempo, podrás iniciar con un pre-análisis comparativo.
@

Pre-requisitos

Requisitos de proyecto

  • Proyecto de investigación que requiera ensamblar y anotar un genoma en algunas fases de la investigación.
  • USB o disco duro con los datos de tu genoma de estudio. En esta primera edición del taller, seleccionaremos aquellos proyectos cuyo genoma de estudio sean genomas bacterianos de preferencia, o aquellos organismos cuyos genomas no sean mayores a 50 Megabases.
  • Llenar el documento que contiene la información necesaria para poder evaluar si tu proyecto es candidato.
  • Mandar los resultados de un pre-análisis de la calidad de las secuencias de tu genoma de estudio (para generar los resultados sigue las instrucciones que te indicamos).

Conocimientos previos

  • Unix a nivel básico. Los participantes necesitan tener conocimientos de nivel básico en la línea de comandos de UNIX/Linux lo que implica manejo de archivos y directorios (rm, mkdir, cd, less, cut, sort, uniq, etc).
  • Estadística básica. Se requieren conocimientos básicos de estadística (conceptos básicos: media, mediana, desviación estándar, distribuciones estadísticas, pruebas de hipótesis, logaritmos).
  • Haber tomado el curso de ensamble y anotación de genomas. O en su caso, conocer los conceptos y las herramientas de ensamble y anotación de genomas.

Requisitos técnicos

  • Computadora personal con una herramienta para conexión remota (MobaXTerm, putty).
  • Disco duro con suficiente espacio para poder resguardar los análisis que se van a realizar durante la asesoría (al terminar el curso, todo análisis realizado en los servidores será borrado).

Importante
El Nodo Nacional de Bioinformática y los involucrados en este taller se comprometen a firmar un convenio de confidencialidad, de tal forma que toda información provista por parte del alumno o investigador NO será revelada o compartida a terceros.

h

Descripción

La asesoría, durante esta semana completa, contará con un experto en el área y ayudantes que darán atención personalizada a los participantes con el fin de lograr que ensamblen y anoten su genoma de estudio.
El procedimiento que se seguirá para la selección de proyectos y preparativos previos al taller, es el siguiente:

  1. Fase de selección.
    1. Se solicitará una descripción técnica del proyecto, que nos permita determinar si es viable poder ensamblar y anotar el genoma de interés.
    2. El comité de evaluación seleccionará 10 posibles proyectos antes del 3 de junio.
    3. Se les notificará a los registrados que su proyecto ha sido seleccionado, antes del 7 de junio.
  2. Fase de evaluación.
    1. El NNB enviará y firmará el convenio de confidencialidad donde se compromete a no divulgar la información recibida.
    2. El NNB junto son los responsables de los proyectos aceptados realizarán la prueba de calidad de los datos. Para ello el responsable o asesor del NNB contactará a los investigadores o responsables para realizar pruebas sobre los datos y ver la calidad, de manera que nos aseguremos que el experimento fue correcto y hay datos fiables con los que se pueden trabajar. Esta fase debe concluir antes del 28 de junio.
  3. Fase de preparación.
    1. El NNB solicitará que los responsables de los proyectos aceptados, hagan llegar de manera personal o electrónica los archivos resultados de la secuenciación (FastQ, PacBio, etc), con el fin depositarlos en los servidores exclusivos para el curso. Se recibirá la información antes del 19 de Julio, posterior a esa fecha, el NNB apoyará en el copiado de los datos, pero el responsable queda avisado que pueden surgir problemas y retrasos por la cantidad de información que se maneja.
    2. Se proporcionarán las cuentas y permisos asociados para que cada responsable del proyecto tenga acceso sólo a su información.
i

Contenido

La asesoría se enfocará exclusivamente a los siguientes temas:

  1. Control de calidad y filtrado de lecturas.
    • FastQC
    • Trim_galore, Trimmomatic
  2. Ensamble de genomas de novo
    • Ensamble para lecturas de un solo tipo
    • Ensamble híbridos
    • Herramientas: Velvet (Illumina), Spades (Illumina, PacBio), Canu (PacBio). Ejemplos de uso y características del output
  3. Remapeo de lecturas y técnicas de validación de ensambles
    • Comparación con genomas de referencia – MUMMER
    • Alineadores: BOWTIE, MAQ, SMALT
    • Visualización: BAMview, IGV, Artemis
  4. Anotación de Genomas. Modelos de genes en procariontes y eucariontes
    • rRNA y tRNA
    • CDSs, intrones/exones
    • Predictores de genes: AUGUSTUS, Glimmer3
    • Anotaciones automáticas y manuales
    • Bases de datos para anotación
  5. Visualización de genomas
    • Artemis, ACT
  6. Pre-análisis comparativo.
  7. Presentación de resultados del ensamble.
I

Software usado

  • FastQC
  • Trim_galore
  • Trimmomatic
  • Velvet
  • Can
  • Spades
  • MUMMER
  • BOWTIE
  • MAQ
  • SMALT
  • Artemis
  • BAMview
  • IGV
  • AUGUSTUS
  • Glimmer3
  • ACT
  • Prokka
l

¿Quién es nuestra audiencia?

El taller va dirigido a estudiantes e investigadores en genómica, genética, bioinformática o ciencias computacionales, que tengan secuenciado un genoma y conozcan los conceptos básicos del ensamble y anotación de genomas, pero tienen poca o nula experiencia en la interpretación de resultados.

Profesores

Dr. Luis Lozano

Unidad de Análisis Bioinformáticos, Centro de Ciencias Genómicas UNAM