Pular para o conteúdo principal

checkm_lineagewf

Tags: quality-control completeness contamination marker-genes lineage bacteria archaea sample-scope

Avalie a qualidade do genoma usando conjuntos de marcadores específicos de linhagem.

Usa o CheckM para estimar a completude e a contaminação de montagens de genomas. O programa posiciona o genoma em uma árvore de referência para selecionar um conjunto apropriado de genes marcadores de cópia única e, em seguida, calcula métricas de qualidade com base na recuperação desses marcadores.

Banco de Dados Necessário

Requer o banco de dados de referência do CheckM (~275 GB descomprimido) configurado por meio da variável de ambiente CHECKM_DATA_PATH ou pré-instalado no contêiner.

Entradas

record (
meta: Record,
fna: Path
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
fnaPathContigs montados no formato FASTA

Saídas

record (
meta: Record,
tsv: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro com informações da amostra
tsvPathRelatório de qualidade do genoma delimitado por tabulação com estimativas de completude e contaminação
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros do CheckM

ParâmetroTipoPadrãoDescrição
--checkm_uniqueinteiro10Número mínimo de marcadores filogenéticos únicos necessários para usar o conjunto de marcadores específico de linhagem.
--checkm_multiinteiro10Número máximo de marcadores filogenéticos de múltiplas cópias antes de recorrer ao conjunto de marcadores em nível de domínio.
--checkm_aai_strainnúmero0.9Limiar de AAI usado para identificar heterogeneidade de linhagem
--checkm_lengthnúmero0.7Percentual de sobreposição entre alvo e consulta
--checkm_full_treebooleanoUsar a árvore completa (requer ~40 GB de memória) para determinar a linhagem de cada bin.
--checkm_ignore_thresholdsbooleanoIgnorar limiares de pontuação específicos do modelo
--checkm_alibooleanoGerar arquivo de alinhamento HMMER para cada bin
--checkm_ntbooleanoGerar sequências de genes nucleotídicos para cada bin
--checkm_force_domainbooleanoUsar conjuntos em nível de domínio para todos os bins
--checkm_no_refinementbooleanoNão realizar refinamento do conjunto de marcadores específico de linhagem
--checkm_individual_markersbooleanoTratar marcadores de forma independente
--checkm_skip_adj_correctionbooleanoNão excluir genes marcadores adjacentes ao estimar a contaminação
--checkm_skip_pseudogene_correctionbooleanoIgnorar a identificação e filtragem de pseudogenes

Usado Por

Subworkflows

  • checkm - Avalie a completude de bins de metagenoma usando CheckM.

Workflows

  • checkm - Avaliação da qualidade da montagem de genomas microbianos.

Citações

Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

CHECKM_LINEAGEWF:
- checkm-genome: 1.2.5