Pular para o conteúdo principal

mashtree

Tags: phylogeny tree mash minhash alignment-free distance clustering neighbor-joining run-scope

Construção rápida de árvores filogenômicas sem alinhamento.

Utiliza o Mashtree para criar uma árvore filogenética a partir de sequências genômicas (FASTA, FASTQ ou GenBank) usando distâncias MinHash. O módulo calcula distâncias pareadas entre todas as entradas e usa o algoritmo Neighbor-Joining para agrupar os genomas, criando efetivamente uma árvore "baseada em distâncias" sem alinhamento completo.

Entradas

record (
meta: Record,
fna: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
fnaSet<Path>Contigs montados no formato FASTA

Saídas

record (
meta: Record,
nwk: Path,
tsv: Path,
sketches: Set<Path?>,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro com informações da amostra
nwkPathA árvore filogenética final no formato Newick (*.dnd)
tsvPathA matriz de distâncias pareadas usada para construir a árvore (*.tsv)
sketchesSet<Path?>Diretório contendo os sketches Mash individuais
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros do Mashtree

ParâmetroTipoPadrãoDescrição
--mashtree_trunclengthinteiro250Quantidade de caracteres a manter em um nome de arquivo
--mashtree_sortorderstringABCPara o Neighbor-Joining, a ordem de classificação pode fazer diferença. (opções: ABC, random, input-order)
--mashtree_genomesizeinteiro5000000Tamanho do genoma das amostras de entrada
--mashtree_mindepthinteiro5Se mindepth for zero, o valor será escolhido de forma inteligente, porém mais lenta, para descartar kmers de baixa abundância.
--mashtree_kmerlengthinteiro21Os hashes serão baseados em strings com esse número de nucleotídeos
--mashtree_sketchsizeinteiro10000Cada sketch terá no máximo esse número de min-hashes não redundantes
--mashtree_save_sketchesbooleanofalseSalvar os sketches criados durante o processo

Utilizado Por

Subworkflows

  • mashtree - Cria árvores filogenéticas usando distâncias Mash.

Workflows

  • mashtree - Construção rápida de árvores filogenéticas usando distâncias Mash.

Citações

Se você usar este módulo em sua análise, por favor cite o seguinte.

Fonte

Ver código-fonte no GitHub

Versão

MASHTREE:
- mashtree: 1.4.6