GitHunt
IN

INMEGEN/Pipelines_Inmegen

Flujos de trabajos desarrollados y automatizados en el Intituto Nacional de Medicina Genómica para el procesamiento de datos genómicos y transcriptómicos.

INMEGEN

Pipelines Inmegen

Nextflow
run with docker

Flujos de trabajo

Este repositorio contiene información detallada sobre los flujos de trabajo (pipelines) desarrollados en el Instituto Nacional de Medicina Genómica.

El principal objetivo de estos pipelines es el procesamiento de datos provenientes de secuenciación masiva (Whole Genome Sequencing [WGS]/Whole Exome Sequencing [WES], RNA sequencing [RNA-seq]) de manera reproducible y repetible, con base en el uso de herramientas confiables y avaladas por la comunidad científica.

En cada uno de los siguientes directorios de este repositorio [marcado entre corchetes] se encuentran las instrucciones necesarias para ejecutar cada flujo de trabajo:

  • Cuantificación y Análisis de expresión diferencial a partir de datos de RNA-seq [QDEA-RNAseq]
  • Identificación conjunta de variantes germinales a partir de datos WGS/WES [VC-Germline]
  • Identificación de variantes somáticas a partir de datos WGS/WES [VC-Somatic]
  • Identificación de variantes a partir de datos de RNA-seq [VC-RNAseq]
  • Análisis de calidad de archivos de secuenciación masiva en formato FASTQ [Fastq-QC]
  • Identificación conjunta de variantes germinales a partir de datos WGS/WES con bootstrapping [BT-VC-Germinal]

Los directorios que contienen pipelines de procesamiento que son requeridos por más de un flujo de trabajo

  • Preprocesamiento de archivos FASTQ [Data-preprocessing]
  • Anotación de variantes con Annovar [Annotation]

Otros directorios contienen información general:

  • Los procesos en los que están divididos los flujos de trabajo se encuentran en el directorio [modules]
  • El diagrama de flujo correspondiente a cada pipeline se encuentra en la carpeta [flowcharts]
  • El directorio [docker] contiene el Dockerfile para crear el repositorio pipelines_inmegen

Para ejecutar los pipelines

Como pre-requisito para ejecutar los pipelines es necesario contar con:

  1. NextFlow (versión mayor o gual a 22.10.7)

  2. Docker (versión mayor o gual a 23.0.5)

Además, es necesario clonar la imagen de docker de este repositorio con el comando

docker pull pipelinesinmegen/pipelines_inmegen:public

En caso de querer construir la imagen de docker con el Dockerfile que se encuentra en el directorio [docker] utiliza:

docker build -t pipelinesinmegen/pipelines_inmegen:public -f Dockerfile .

Finalmente, clonar este repositorio utilizando:

git clone https://github.com/INMEGEN/Pipelines_INMEGEN.git

NOTA: Debes asegurarte de que el directorio de docker cuente con suficiente espacio para generar la imagen (~ 8 GB).

Normas de operación

Los flujos de este repositorio pueden ser descargados y utilizados sin restricciones para uso académico. En caso de utilizar cualquiera de estos flujos solicitamos incluir la siguiente frase en los productos académicos generados: “Agradecemos a la Subdirección de Genómica Poblacional y a la Subdirección de Bioinformática del Instituto Nacional de Medicina Genómica por proveer flujos de trabajo que han sido utilizados de forma parcial o total como parte del análisis de este trabajo (We acknowledge the Population Genomics and the Bioinformatics Departments from the National Institute of Genomic Medicine for providing workflows that were, either partially or completely, used as part of the analysis in this work)”

En ningún caso nuestros análisis incluyen la interpretación de resultados o generación de resultados más allá de los descritos como parte del flujo de trabajo.

En caso de querer iniciar una colaboración académica con alguno de los miembros de este proyecto favor de contactarnos directamente.

No está permitida la utilización de estos flujos de trabajo con fines comerciales por terceros.

NOTA: por tiempo limitado, estos servicios estarán disponibles gratuitamente para personal interno del Inmegen.

NOTA: Si eres investigador del Inmegen y requieres el apoyo de nuestro personal para implementar alguno de estos flujos de trabajo en tus datos comunicate con nosotros.

Equipo de desarrollo

Daniel Pérez-Calixto dperez@inmegen.gob.mx

Laura Gómez-Romero lgomez@inmegen.gob.mx

Alejandra Cervera Taboada acerverat@inmegen.gob.mx

Licencia

Pipelines INMEGEN © 2025 by INMEGEN is licensed under CC BY-NC-SA 4.0

Contacto

Cualquier duda o comentario escribir a nuestro correo de contacto

Languages

Nextflow67.7%R14.4%Shell10.4%Dockerfile7.5%

Contributors

Latest Release

v0.1February 4, 2025
Other
Created June 20, 2023
Updated October 20, 2025