Pular para o conteúdo principal

bactopia_qc

Tags: quality-control adapters error-correction subsampling fastq illumina nanopore fastp bbduk nanoq sample-scope

Realize controle de qualidade abrangente em reads de sequenciamento.

Este subworkflow processa reads de sequenciamento brutas por meio de um pipeline completo de controle de qualidade. Ele se adapta a diferentes tipos de reads:

  • Illumina: Remoção de adaptadores/PhiX (Fastp ou BBDuk), Correção de erros (Lighter) e Subsampling (Rasusa)
  • Nanopore: Remoção de adaptadores (Porechop), Filtragem por qualidade (Nanoq) e Subsampling (Rasusa)
  • Híbrido: Processa reads curtas e longas por meio de seus respectivos pipelines
  • Montagem: Passa reads simuladas a partir de montagens

Gera métricas de qualidade usando fastq-scan e relatórios de qualidade opcionais usando FastQC (Illumina) e NanoPlot (ONT).

Entrada

samples: Channel<Record>
CampoDescrição
metaGroovy Record contendo informações da amostra (deve incluir runtype, genome_size, species)
r1Reads R1 Illumina (pareadas - sentido direto)
r2Reads R2 Illumina (pareadas - sentido reverso)
seReads Illumina de extremidade única
lrReads longas (ONT)
assemblyArquivo de montagem (FASTA) para simulações baseadas em montagem
adapters: Path?
phix: Path?
NomeTipoDescrição
adaptersPath?Sequências de adaptadores opcionais no formato FASTA para remoção das reads Illumina
phixPath?Sequências PhiX opcionais no formato FASTA para remoção das reads Illumina

Saída

Publicados

As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.

sample_outputs

SaídaDescrição
reads_groupedTodos os FASTQs de saída para publicação
supplementalRelatórios de QC (FastQC/NanoPlot), métricas JSON e FASTQs de erro caso o QC falhe
errorMensagens de erro capturadas caso o QC falhe (ex.: reads vazias após trimagem)

run_outputs

Sem saídas de escopo de execução.

Entradas para Etapas Posteriores

As emissões a seguir são destinadas ao uso como entradas para subworkflows posteriores.

reads

SaídaDescrição
r1Reads R1 Illumina filtradas por QC
r2Reads R2 Illumina filtradas por QC
seReads de extremidade única filtradas por QC
lrReads longas filtradas por QC
fnaArquivo de montagem (repassado para amostras baseadas em montagem)

Composição de Módulos

Este subworkflow chama os seguintes módulos:

  • bactopia_qc - Controle de qualidade automatizado, correção de erros e subsampling de reads.

Utilizado Por

Este subworkflow é utilizado pelos seguintes fluxos de trabalho:

  • bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
  • cleanyerreads - Controle de qualidade e remoção opcional de reads do hospedeiro a partir de reads brutas de sequenciamento.
  • staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.

Citações

Se você usar este subworkflow em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub