gtdbtk_classifywf
Tags: taxonomy classification phylogeny gtdb bacteria archaea marker-genes sample-scope
Classificação taxonômica de genomas bacterianos e arqueais usando GTDB-Tk.
Utiliza o GTDB-Tk para atribuir classificações taxonômicas objetivas a montagens de genomas com base no Genome Taxonomy Database. A ferramenta identifica genes marcadores, os alinha e posiciona o genoma na árvore de referência para determinar a taxonomia.
Requer que o banco de dados GTDB-Tk (~60GB+) esteja disponível.
Entradas
record (
meta: Record,
fna: Path
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro Groovy contendo informações da amostra |
fna | Path | Contigs montados em formato FASTA |
db: Path
| Nome | Tipo | Descrição |
|---|---|---|
db | Path | Caminho (ou conjunto de caminhos) para o banco de dados de referência do GTDB-Tk |
Saídas
record (
meta: Record,
bac_tsv: Path?,
ar_tsv: Path?,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro com informações da amostra |
bac_tsv | Path? | Arquivo de resumo da classificação bacteriana contendo a atribuição taxonômica |
ar_tsv | Path? | Arquivo de resumo da classificação arqueal contendo a atribuição taxonômica |
results | Set<Path> | Todos os arquivos de saída a serem publicados |
logs | Set<Path?> | Arquivos de log específicos do programa (opcionais) |
nf_logs | Set<Path> | Arquivos de log específicos do Nextflow (ex.: .command.{begin |
versions | Set<Path> | Arquivo no formato YAML com as versões dos programas |
Parâmetros
Parâmetros de Classificação do GTDB
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--gtdb_min_af | número | 0.65 | Fração mínima de alinhamento para considerar o genoma mais próximo |
--gtdb_min_perc_aa | inteiro | 10 | Filtra genomas com porcentagem insuficiente de AA no MSA |
--gtdb_tmp | string | /tmp | Especifica um diretório alternativo para arquivos temporários |
--gtdb_use_scratch | booleano | false | Reduz o uso de memória do pplacer escrevendo no local definido por --gtdb_tmp (mais lento) |
--gtdb_debug | booleano | false | Cria arquivos intermediários para fins de depuração |
--gtdb_keep_msa | booleano | false | Mantém o arquivo MSA para todos os genomas enviados e de referência |
--force_gtdb | booleano | false | Continua o processamento mesmo se ocorrer um erro em um único genoma |
Usado Por
Subworkflows
- gtdb - Classificação taxonômica com o Genome Taxonomy Database.
Workflows
- gtdb - Identifica genes marcadores e atribui classificações taxonômicas usando GTDB.
Citações
Se você usar esta ferramenta em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
GTDB-Tk
Chaumeil PA, Mussig AJ, Hugenholtz P, Parks DH GTDB-Tk: a toolkit to classify genomes with the Genome Taxonomy Database. Bioinformatics (2019) -
pplacer
Matsen FA, Kodner RB, Armbrust EV pplacer: linear time maximum-likelihood and Bayesian phylogenetic placement of sequences onto a fixed reference tree. BMC Bioinformatics 11, 538 (2010)
Fonte
Versão
GTDBTK_CLASSIFYWF:
- gtdbtk: 2.7.1