mashtree
Tags: phylogeny tree mash minhash alignment-free distance clustering neighbor-joining run-scope
Construção rápida de árvores filogenômicas sem alinhamento.
Utiliza o Mashtree para criar uma árvore filogenética a partir de sequências genômicas (FASTA, FASTQ ou GenBank) usando distâncias MinHash. O módulo calcula distâncias pareadas entre todas as entradas e usa o algoritmo Neighbor-Joining para agrupar os genomas, criando efetivamente uma árvore "baseada em distâncias" sem alinhamento completo.
Entradas
record (
meta: Record,
fna: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro Groovy contendo informações da amostra |
fna | Set<Path> | Contigs montados no formato FASTA |
Saídas
record (
meta: Record,
nwk: Path,
tsv: Path,
sketches: Set<Path?>,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro com informações da amostra |
nwk | Path | A árvore filogenética final no formato Newick (*.dnd) |
tsv | Path | A matriz de distâncias pareadas usada para construir a árvore (*.tsv) |
sketches | Set<Path?> | Diretório contendo os sketches Mash individuais |
results | Set<Path> | Todos os arquivos de saída a serem publicados |
logs | Set<Path?> | Arquivos de log opcionais específicos do programa |
nf_logs | Set<Path> | Arquivos de log específicos do Nextflow (ex.: .command.{begin |
versions | Set<Path> | Arquivo no formato YAML com as versões dos programas |
Parâmetros
Parâmetros do Mashtree
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--mashtree_trunclength | inteiro | 250 | Quantidade de caracteres a manter em um nome de arquivo |
--mashtree_sortorder | string | ABC | Para o Neighbor-Joining, a ordem de classificação pode fazer diferença. (opções: ABC, random, input-order) |
--mashtree_genomesize | inteiro | 5000000 | Tamanho do genoma das amostras de entrada |
--mashtree_mindepth | inteiro | 5 | Se mindepth for zero, o valor será escolhido de forma inteligente, porém mais lenta, para descartar kmers de baixa abundância. |
--mashtree_kmerlength | inteiro | 21 | Os hashes serão baseados em strings com esse número de nucleotídeos |
--mashtree_sketchsize | inteiro | 10000 | Cada sketch terá no máximo esse número de min-hashes não redundantes |
--mashtree_save_sketches | booleano | false | Salvar os sketches criados durante o processo |
Utilizado Por
Subworkflows
- mashtree - Cria árvores filogenéticas usando distâncias Mash.
Workflows
- mashtree - Construção rápida de árvores filogenéticas usando distâncias Mash.
Citações
Se você usar este módulo em sua análise, por favor cite o seguinte.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
Mashtree
Katz LS, Griswold T, Morrison S, Caravas J, Zhang S, den Bakker HC, Deng X, Carleton HA Mashtree: a rapid comparison of whole genome sequence files. Journal of Open Source Software, 4(44), 1762 (2019)
Fonte
Versão
MASHTREE:
- mashtree: 1.4.6