El análisis continuo del SARS-CoV-2 permite monitorear la propagación del virus, entender cómo está evolucionando a lo largo del tiempo y facilitar la implementación de medidas efectivas en salud pública. Este curso tiene como objetivo dar una introducción a la bioinformática mediante el análisis de datos genoḿicos del virus SARS-CoV-2. En este curso se analizarán genomas virales obtenidos mediante diferentes tipos de secuenciación y se determinarán los diferentes linajes de las variantes del virus.
- Aprender a manejar la línea de comandos y el lenguaje de scripting BASH, desarrollando habilidades esenciales para la gestión de archivos y la ejecución de herramientas bioinformáticas en entornos Linux.
- Aplicar herramientas de línea de comandos para el control de calidad de datos de secuencias.
- Identificar los formatos de los archivos comúnmente utilizados en la secuenciación del SARS-CoV-2.
- Utilizar herramientas bioinformáticas en pipelines de análisis de SARS-CoV-2, aplicando técnicas de secuenciación Illumina y Nanopore para el procesamiento, análisis y visualización de datos genómicos.
- Utilizar Pangolin para la identificación de linajes virales a partir de conjuntos de datos existentes.
El curso está dirigido a estudiantes, investigadores o profesionales clínicos/sanitarios. No requiere habilidades previas en bioinformática.
El curso utilizará Google Colaboratory, el cual es gratuito, pero requiere una cuenta de Google para su uso. Las cuentas de Google son gratuitas.
Agradecemos al equipo a cargo del desarrollo del curso SARS-CoV-2 Bioinformatics for Beginners, disponible en el repositorio: https://github.com/WCSCourses/SARS-COV-2_B4B, cuyo contenido y recursos han sido esenciales para la creación de este tutorial. Asimismo, reconocemos el apoyo de Wellcome Connecting Science y COG-Train en el desarrollo de dicho curso.
Módulo 1: Introducción a Google Colaboratory
Los módulos 1, 2 y 3 se encuentran en el repositorio de Introducción
Para comenzar, vaya a https://colab.research.google.com/.
En la página de inicio de Colab, seleccione "Archivo" y luego "Abrir bloc de notas".
Hay una pestaña para "GitHub"; seleccione esa pestaña y pegue la siguiente URL en la barra de búsqueda debajo de "Ingresa una URL de GitHub o realiza una búsqueda por organización o usuario":
https://github.com/cabana-online/Tutorial_Introduccion
Después de una breve búsqueda verá el notebook:
01.Intro_a_colab.ipynb
Seleccione y verá el notebook abierto.
Para ejecutar las celdas, deberá iniciar sesión con su cuenta de Google (es libre de hacer una cuenta). El uso de Colab es gratis.
Nota: existen limitaciones en la versión gratuita, pero no serán alcanzadas en este curso.
Módulo 2: Introducción a Notebooks y Unix/Linux.
Vaya a https://colab.research.google.com/.
Seleccione el repositorio
https://github.com/cabana-online/Tutorial_Introduccion
Después de una breve búsqueda verá el notebook:
02.Modulo_2_linux.ipynb
Seleccione y verá el notebook abierto.
Vaya a https://colab.research.google.com/.
Seleccione el repositorio
https://github.com/cabana-online/Tutorial_Introduccion
Después de una breve búsqueda verá el notebook:
03.Modulo_3_NGS.ipynb
Seleccione y verá el notebook abierto.
Módulo 4: Control de calidad de datos.
Vaya a https://colab.research.google.com/.
Seleccione el repositorio
https://github.com/cabana-online/Curso_SARS-CoV-2
Después de una breve búsqueda verá el notebook:
04.Modulo_4_QC.ipynb
Seleccione y verá el notebook abierto.
Módulo 5: Flujos de trabajo para el análisis de datos de SARS-CoV-2 secuenciados con Illumina y Nanopore tech.
Este módulo está dividido en dos partes.
-
Parte 1: Análisis de datos Nanopore
-
Parte 2: Análisis de datos Illumina
Vaya a https://colab.research.google.com/.
Seleccione el repositorio
https://github.com/cabana-online/Curso_SARS-CoV-2
Después de una breve búsqueda verá los notebooks:
05.Modulo_5_P1_nanopore.ipynb
05.Modulo_5_P2_illumina.ipynb
Seleccione y verá el notebook abierto.
Vaya a https://colab.research.google.com/.
Seleccione el repositorio
https://github.com/cabana-online/Curso_SARS-CoV-2
Después de una breve búsqueda verá el notebook:
06.Modulo_6_linajes.ipynb
Seleccione y verá el notebook abierto.
Módulo 7:Análisis filogenético .
Vaya a https://colab.research.google.com/.
Seleccione el repositorio
https://github.com/cabana-online/Curso_SARS-CoV-2
Después de una breve búsqueda verá el notebook:
07.Modulo_7_filogenetica.ipynb
Seleccione y verá el notebook abierto.