mashdist
Tags: mash distance minhash comparison reference sample-scope
Calcule distâncias Mash entre sequências e uma referência.
Este subworkflow usa Mash para calcular distâncias baseadas em MinHash entre sequências de consulta e uma sequência de referência. Ele cria esboços Mash das sequências de entrada e computa valores de distância, depois agrega todos os cálculos de distância em um relatório consolidado único.
Take
assembly: Channel<Record>
| Campo | Descrição |
|---|---|
meta | Groovy Record contendo informações da amostra |
fna | Sequências em formato FASTA para comparar com a referência |
reference: Path
| Nome | Tipo | Descrição |
|---|---|---|
reference | Path | Sequência de referência em formato FASTA para cálculos de distância |
Emit
Publicados
As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.
sample_outputs
| Saída | Descrição |
|---|---|
dist | Um resumo delimitado por tabulação das distâncias Mash e valores-p |
run_outputs
| Saída | Descrição |
|---|---|
csv | Resultados de distância Mash mesclados de todas as amostras |
Composição de Módulos
Este subworkflow chama os seguintes módulos:
- csvtk_concat - Concatena múltiplos arquivos CSV ou TSV em uma única tabela.
- mash_dist - Calcula distâncias genômicas usando esboços MinHash.
Usado Por
Este subworkflow é usado pelos seguintes fluxos de trabalho:
- mashdist - Calcula distâncias Mash entre sequências e genomas de referência.
Citations
If you use this in your analysis, please cite the following.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
Mash
Ondov BD, Treangen TJ, Melsted P, Mallonee AB, Bergman NH, Koren S, Phillippy AM Mash: fast genome and metagenome distance estimation using MinHash. Genome Biol 17, 132 (2016)