Filoinformática: Homología, Alineamientos e Inferencia Filogenética

Datos Generales

Encuesta de Evaluación de los TIBs2017

 

Código: T4-FI
Duración: 40 horas
Fecha: del 23 al 27 de Enero de 2017
Nivel: básico e intermedio
Lugar: Aula 4 LCG

Versión final del programa y otros detalles del taller de Filoinformática

 

Lista de confirmados

Profesor

Dr. Pablo Vinuesa (CCG-UNAM, México)

Dr. Enrique Merino (IBT-UNAM, México)

Descripción

En el taller tendremos sesiones teóricas, que incluirán lecciones y ponencias, alternadas con sesiones prácticas. El curso cubrirá un amplio espectro de aspectos básicos del tópico; abarcando desde el escrutinio de bases de datos mediante BLAST; determinación e interpretación de homología; el alineamiento de múltiples secuencias; la conversión de formatos y el ajuste de modelos de sustitución a los datos; hasta la edición e interpretación de las topologías obtenidas. Habrá también demostraciones sobre el uso de filogenias moleculares en distintos tipos de estudios de evolución y sistemática molecular, incluyendo a la filogenómica. El taller cubrirá de manera equilibrada los principios teóricos subyacentes a diversos métodos de inferencia filogenética (distancia, máxima parsimonia, máxima verosimilitud, Bayesiana …); así como el aprendizaje de programas clave (todos de “open source”) para hacer estas inferencias, usando datos tomados de las bases de datos. También se presentará el uso de algunos scripts de Bash y Perl muy sencillos, con el objetivo de aprender los aspectos más básicos del manejo de estos programas en un contexto de programación de tuberías de análisis, que permiten abordar el análisis de múltiples sets de datos de manera eficiente y automatizada. Al final del curso tendrán una amplia visión sobre el espectro de posibilidades que brindan la filogenética y la evolución molecular en distintos tipos de estudios biológicos y genómicos, que servirán como herramientas conceptuales y metodológicas de gran utilidad en su carrera como estudiantes o profesionales.

Objetivo del curso

Presentar una introducción al biocómputo en el ambiente Linux, proporcionando una sólida base de conocimientos teóricos y prácticos sobre aspectos fundamentales de bioinformática e inferencia filogenética molecular.

Audiencia

El curso está dirigido a estudiantes o profesionales con conocimientos de biología, medicina o disciplinas afines y que tengan necesidad de aprender el biocómputo en el ambiente Linux para resolver aspectos básicos de bioinformática y filogenética molecular. Se requieren conocimientos previos de Linux o programación, los cuales se pueden adquirir en el taller de habilidades bioinformáticas. Algunas de las pláticas y talleres podrían ser en inglés, impartidas por un profesor invitado, por lo tanto se requiere dominio en la comprensión del idioma.

Requisitos

  • UNIX. Todas las demostraciones de software se harán en este sistema operativo.
    • Los participantes necesitan tener conocimientos de nivel intermedio en la línea de comandos de UNIX/Linux, lo que implica manejo de archivos y directorios (rm, mkdir, cd, less, cut, sort, uniq, etc.), formateo de datos (awk o perl en línea de comandos, sed).
    • O haber tomado el curso de Habilidades Bioinformáticas que se da la primer semana del TIB2017
  • Comprensión del idioma inglés
  • Para este curso, se tendrá disponible un servidor con cuentas para cada usuario. Se tendrán terminales para que los usuarios se conecten al servidor. Si quieres traer tu computadora no hay inconveniente, sólo que deberá traer instalado zoc7 u alguna herramienta que nos permite realizar conexión al servidor.

Contenido

Concepto de homología.

  • Búsqueda de homólogos en bases de datos mediante BLAST
  • Formateo de bases de datos locales
  • Parseo de resultados de BLAST
  • Búsqueda textual de secuencias en GenBank mediante Entrez

Alineamientos múltiples.

  • Algoritmos básicos
  • Uso de ClustalW, Muscle y Mafft desde la línea de comandos
  • Alineamientos de codones y secuencias ribosomales
  • Edición de alineamientos y su concatenación

Inferencia filogenética 1: Conceptos básicos, métodos de distancias y modelos de sustitución.

  • Modelos de sustitución y métodos de distancia
  • Prueba de bootstrap
  • Uso del paquete Phylip y programas para automatizar análisis con Phylip

Inferencia filogenética 2: Máxima verosimilitud.

  • Modelos de sustitución empíricos y paramétricos
  • Selección de modelos de sustitución jModelTest y ProtTest
  • Algoritmos de búsqueda de árboles y su implementación en PhyML3

Inferencia filogenética 3: Inferencia bayesiana de filogenias.

  • MrBayes
  • Análisis de convergencia de corridas MCMCMC independientes