T3: Análisis exploratorio de genes y expresión diferencial

R

Datos generales

Código: T3-R-RNA-seq
Duración: 40 horas
Nivel: intermedio
Idioma: inglés
Fecha: del 30 de julio al 3 de agosto de 2018
Lugar: Aula 3 LCG

@

Pre-requisitos

Requisitos de conocimientos previos

  • Conocimientos básicos de R (manejo de estructura de datos: vectores, matrices, data frames), saber instalar paquetes.

Requisitos técnicos

  • Computadora Personal
    Un mínimo de 8 GB de RAM, un ratón y espacio de disco suficiente para archivos de texto y archivos de imagen. Privilegios de administrador para instalar y ejecutar utilidades de R-Studio.
  • Programas previamente instalados
    • R
    • RStudio
h

Descripción

En el curso examinaremos la expresión diferencial de RNA-seq a nivel de gen de extremo a extremo utilizando paquetes de Bioconductor. Comenzaremos por los archivos FASTQ, mostraremos cómo estos se alinean con el genoma de referencia y prepararemos una matriz de conteo que cuente el número de lecturas / fragmentos de RNA-seq dentro de cada gen para cada muestra. Realizaremos un análisis exploratorio de datos (EDA) para la evaluación de la calidad y para explorar la relación entre las muestras, realizar análisis de expresión genética diferencial y explorar visualmente los resultados.

i

Contenido

  • 1. Software installation
  • 2. Introduction
    • 2.1. Experimental data
  • 3. Preparing count matrices
    • 3.1. Recommended: transcript abundances and the tximport pipeline
    • 3.2. Aligning reads to a reference genome
    • 3.3. Locating alignment files
    • 3.4. DESeq2 import functions
    • 3.5. Defining gene models
    • 3.6. Read counting step
    • 3.7. SummarizedExperiment
    • 3.8. Branching point
  • 4. The DESeqDataSet object, sample information and the design formula
    • 4.1. Starting from SummarizedExperiment
    • 4.2. Starting from count matrices
  • 5. Exploratory analysis and visualization
    • 5.1. Pre-filtering the dataset
    • 5.2. The rlog and variance stabilizing transformations
    • 5.3. Sample distances
    • 5.4. PCA plot
    • 5.5. MDS plot
  • 6. Differential expression analysis
    • 6.1. Running the differential expression pipeline
    • 6.2. Building the results table
    • 6.3. Other comparisons
    • 6.4. Multiple testing
  • 7. Plotting results
    • 7.1. Counts plot
    • 7.2. MA-plot
    • 7.3. Gene clustering
    • 7.4. Independent filtering
  • 8. Annotating and exporting results
    • 8.1. Exporting results
    • 8.2. Plotting fold changes in genomic space
  • 9. Removing hidden batch effects
  • 10. Time course experiments
  • 11. Single cell RNASeq
  • 12. Alternative splicing analysis
I

Software usado

  • R
  • RStudio
  • Bioconductor
l

¿Quién es nuestra audiencia?

Estudiantes e investigadores en genómica, genética, bioinformática o ciencias computacionales, con especial interés en el manejo de datos genómicos y/o que sus proyectos de investigación se vean beneficiados con este conocimiento.

Profesor

Dr. Lukas Mikolaj Simon

Helmholtz Zentrum München
German Research Center for Environmental Health
Institute of Computational Biology