Pular para o conteúdo principal

bactopia_qc

Tags: fastq qc adapter-removal error-correction subsampling fastp bbduk lighter porechop nanoq fastqc nanoplot sample-scope

Controle de qualidade automatizado, correção de erros e subamostragem de reads.

Um pipeline de controle de qualidade abrangente que se adapta ao tipo de read de entrada:

  • Illumina: Remoção de adaptadores/PhiX (Fastp ou BBDuk), Correção de Erros (Lighter) e Subamostragem (Rasusa)
  • Nanopore: Remoção de adaptadores (Porechop), Filtragem por qualidade (Nanoq) e Subamostragem (Rasusa)
  • Híbrido: Processa tanto reads curtos quanto longos através de seus respectivos pipelines
  • Montagem: Passa adiante reads simulados a partir de montagens

Gera métricas de qualidade usando fastq-scan e relatórios de qualidade opcionais usando FastQC (Illumina) e NanoPlot (ONT).

Entradas

record (
meta: Record,
r1: Path?,
r2: Path?,
se: Path?,
lr: Path?,
fna: Path?
)
CampoTipoDescrição
metaRecordGroovy Record contendo informações da amostra (deve incluir runtype, genome_size, species)
r1Path?Reads R1 Illumina (paired-end forward)
r2Path?Reads R2 Illumina (paired-end reverse)
sePath?Reads Illumina single-end
lrPath?Reads longos (ONT)
fnaPath?Arquivo de montagem (FASTA) para simulações baseadas em montagem
adapters: Path?
phix: Path?
NomeTipoDescrição
adaptersPath?Caminho para sequências de adaptadores personalizadas (FASTA)
phixPath?Caminho para sequências PhiX personalizadas (FASTA)

Saídas

record (
meta: Record,
r1: Path?,
r2: Path?,
se: Path?,
lr: Path?,
fna: Path?,
reads_grouped: Set<Path?>,
error: Set<Path?>,
skipped: Path?,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro de informações da amostra
r1Path?Reads R1 Illumina após controle de qualidade (paired-end forward)
r2Path?Reads R2 Illumina após controle de qualidade (paired-end reverse)
sePath?Reads Illumina single-end após controle de qualidade
lrPath?Reads longos após controle de qualidade (ONT)
fnaPath?Arquivo de montagem (FASTA)
reads_groupedSet<Path?>Todos os FASTQs de saída para publicação
errorSet<Path?>Mensagens de erro capturadas caso o controle de qualidade falhe (ex.: reads vazios após trimagem)
skippedPath?Arquivo marcador indicando que o controle de qualidade foi ignorado para esta amostra
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log específicos de cada programa (opcionais)
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros de Controle de Qualidade

ParâmetroTipoPadrãoDescrição
--use_bbmapbooleanReads Illumina serão submetidos ao controle de qualidade usando BBMap
--use_porechopbooleanfalseUsar Porechop para remover adaptadores de reads ONT
--skip_qcbooleanA etapa de controle de qualidade será ignorada e assumirá que as sequências de entrada já passaram pelo controle de qualidade.
--skip_qc_plotsbooleanA criação de gráficos de controle de qualidade pelo FastQC ou Nanoplot será ignorada
--skip_error_correctionbooleanA correção de erros de reads pelo FLASH será ignorada.
--adaptersstringUm arquivo FASTA contendo adaptadores a serem removidos
--adapter_kinteger23Comprimento do kmer usado para identificar adaptadores.
--phixstringGenoma de referência do phiX174 a ser removido
--phix_kinteger31Comprimento do kmer usado para identificar phiX174.
--ktrimstringrTrim de reads para remover bases que correspondam a kmers de referência (opções: f, r, l)
--minkinteger11Busca por kmers mais curtos nas extremidades dos reads até este comprimento, durante k-trimming ou mascaramento.
--hdistinteger1Distância máxima de Hamming para kmers de referência (apenas substituições)
--tpestringtAo realizar k-trimming pela direita, realiza trim em ambos os reads até o comprimento mínimo de qualquer um deles (opções: f, t)
--tbostringtRealiza trim de adaptadores com base na região de sobreposição dos reads pareados (opções: f, t)
--qtrimstringrlRealiza trim nas extremidades dos reads para remover bases com qualidade abaixo de trimq. (opções: rl, f, r, l, w)
--trimqinteger6Regiões com qualidade média ABAIXO deste valor serão removidas se qtrim estiver configurado com algo diferente de f
--maqinteger10Reads com qualidade média (após trimagem) abaixo deste valor serão descartados
--minlengthinteger35Reads mais curtos que este valor após a trimagem serão descartados
--ftminteger5Se positivo, realiza trim à direita para que o comprimento seja igual a zero módulo este número
--tossjunkstringtDescarta reads com caracteres inválidos como bases (opções: f, t)
--ainstringfAo detectar nomes de pares, permite nomes idênticos (opções: f, t)
--qoutstring33Offset PHRED a ser usado nos FASTQs de saída (opções: 33, 64)
--maxcorinteger1Número máximo de correções em uma janela de 20bp
--sampleseedinteger42Defina como um número positivo para usar como semente do gerador de números aleatórios na amostragem
--ont_minlengthinteger1000Reads ONT mais curtos que este valor serão descartados
--ont_minqualinteger0Filtro de qualidade média mínima dos reads ONT
--porechop_optsstringOpções extras do Porechop entre aspas
--nanoplot_optsstringOpções extras do NanoPlot entre aspas
--bbduk_optsstringOpções extras do BBDuk entre aspas
--fastp_optsstringOpções extras do fastp entre aspas

Usado Por

Subworkflows

  • bactopia_qc - Realiza controle de qualidade abrangente em reads de sequenciamento.

Workflows

  • bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
  • cleanyerreads - Controle de qualidade e remoção opcional de reads do hospedeiro a partir de reads brutos de sequenciamento.
  • staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.

Citações

Se você usar este pipeline em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

BACTOPIA_QC:
- bactopia-qc: 1.0.4