Pular para o conteúdo principal

gtdbtk_classifywf

Tags: taxonomy classification phylogeny gtdb bacteria archaea marker-genes sample-scope

Classificação taxonômica de genomas bacterianos e arqueais usando GTDB-Tk.

Utiliza o GTDB-Tk para atribuir classificações taxonômicas objetivas a montagens de genomas com base no Genome Taxonomy Database. A ferramenta identifica genes marcadores, os alinha e posiciona o genoma na árvore de referência para determinar a taxonomia.

Banco de Dados Necessário

Requer que o banco de dados GTDB-Tk (~60GB+) esteja disponível.

Entradas

record (
meta: Record,
fna: Path
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
fnaPathContigs montados em formato FASTA
db: Path
NomeTipoDescrição
dbPathCaminho (ou conjunto de caminhos) para o banco de dados de referência do GTDB-Tk

Saídas

record (
meta: Record,
bac_tsv: Path?,
ar_tsv: Path?,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro com informações da amostra
bac_tsvPath?Arquivo de resumo da classificação bacteriana contendo a atribuição taxonômica
ar_tsvPath?Arquivo de resumo da classificação arqueal contendo a atribuição taxonômica
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log específicos do programa (opcionais)
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros de Classificação do GTDB

ParâmetroTipoPadrãoDescrição
--gtdb_min_afnúmero0.65Fração mínima de alinhamento para considerar o genoma mais próximo
--gtdb_min_perc_aainteiro10Filtra genomas com porcentagem insuficiente de AA no MSA
--gtdb_tmpstring/tmpEspecifica um diretório alternativo para arquivos temporários
--gtdb_use_scratchbooleanofalseReduz o uso de memória do pplacer escrevendo no local definido por --gtdb_tmp (mais lento)
--gtdb_debugbooleanofalseCria arquivos intermediários para fins de depuração
--gtdb_keep_msabooleanofalseMantém o arquivo MSA para todos os genomas enviados e de referência
--force_gtdbbooleanofalseContinua o processamento mesmo se ocorrer um erro em um único genoma

Usado Por

Subworkflows

  • gtdb - Classificação taxonômica com o Genome Taxonomy Database.

Workflows

  • gtdb - Identifica genes marcadores e atribui classificações taxonômicas usando GTDB.

Citações

Se você usar esta ferramenta em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

GTDBTK_CLASSIFYWF:
- gtdbtk: 2.7.1