Pular para o conteúdo principal

mash_dist

Tags: mash distance minhash ani comparison taxonomy sample-scope

Calcule distâncias genômicas usando sketches MinHash.

Usa o Mash para calcular a distância entre sequências de consulta e um banco de dados de referência. Utiliza sketches MinHash para estimar rapidamente o índice de Jaccard, fornecendo uma aproximação rápida da Identidade Nucleotídica Média (ANI).

Entradas

record (
meta: Record,
fna: Path
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
fnaPathArquivo FASTA, FASTQ ou sketch Mash a ser consultado
reference: Path
NomeTipoDescrição
referencePathO arquivo de referência (FASTA, FASTQ ou sketch Mash) para comparação

Saídas

record (
meta: Record,
dist: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro com informações da amostra
distPathResumo delimitado por tabulação das distâncias Mash e valores-p
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo formatado em YAML com versões dos programas

Parâmetros

Parâmetros mashdist

ParâmetroTipoPadrãoDescrição
--mash_sketchstringA sequência de referência como um Mash Sketch (arquivo .msh)
--mash_seedinteger42Semente fornecida à função de hash
--mash_tablebooleanfalseSaída em formato de tabela (campos ficarão em branco se não atenderem ao limiar do valor-p)
--mash_minteger1Número mínimo de cópias de cada k-mer necessário para passar no filtro de ruído para reads
--mash_wnumber0.01Limiar de probabilidade para aviso sobre tamanho baixo de k-mer
--mash_max_pnumber1.0Valor-p máximo a ser reportado
--mash_max_distnumber1.0Distância máxima a ser reportada
--merlin_distnumber0.1Distância máxima a ser reportada ao usar Merlin
--full_merlinbooleanfalseAtiva o Merlin completo e executa todas as ferramentas específicas de espécie, independentemente da distância Mash
--mash_use_fastqsbooleanfalseConsultar com FASTQs em vez das montagens

Usado Por

Subworkflows

  • mashdist - Calcula distâncias Mash entre sequências e uma referência.

Workflows

  • mashdist - Calcula distâncias Mash entre sequências e genomas de referência.

Citações

Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

MASH_DIST:
- mash: 2.3