Pular para o conteúdo principal

merlin_dist

Tags: merlin mash routing logic genus-specific automation sample-scope

Identificar espécies para acionar análises downstream específicas por gênero (Merlin).

Este é um processo especializado para o fluxo de trabalho Merlin. Ele executa mash dist contra um banco de dados de referência e analisa os resultados para detectar gêneros específicos (ex.: Salmonella, Staphylococcus). Com base no gênero detectado, ele direciona os dados para canais específicos a fim de acionar ferramentas direcionadas (ex.: a detecção de Salmonella aciona o Sistr).

Entradas

record (
meta: Record,
fna: Path,
r1: Path?,
r2: Path?,
se: Path?,
lr: Path?
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
fnaPathContigs montados no formato FASTA
r1Path?Reads Illumina R1 (paired-end)
r2Path?Reads Illumina R2 (paired-end)
sePath?Reads Illumina single-end
lrPath?Long reads (ONT/PacBio)
reference: Path
NomeTipoDescrição
referencePathO banco de dados Mash de referência para triagem

Saídas

record (
meta: Record,
fna: Path,
r1: Path,
r2: Path,
se: Path,
lr: Path,
escherichia: Path?,
haemophilus: Path?,
klebsiella: Path?,
legionella: Path?,
listeria: Path?,
mycobacterium: Path?,
neisseria: Path?,
pseudomonas: Path?,
salmonella: Path?,
staphylococcus: Path?,
streptococcus: Path?,
genus: Set<Path?>,
dist: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro de informações da amostra
fnaPathPassagem dos contigs montados
r1PathPassagem dos reads Illumina R1
r2PathPassagem dos reads Illumina R2
sePathPassagem dos reads single-end
lrPathPassagem dos long reads
escherichiaPath?Arquivo marcador condicional que aciona ferramentas de análise de Escherichia
haemophilusPath?Arquivo marcador condicional que aciona ferramentas de análise de Haemophilus
klebsiellaPath?Arquivo marcador condicional que aciona ferramentas de análise de Klebsiella
legionellaPath?Arquivo marcador condicional que aciona ferramentas de análise de Legionella
listeriaPath?Arquivo marcador condicional que aciona ferramentas de análise de Listeria
mycobacteriumPath?Arquivo marcador condicional que aciona ferramentas de análise de Mycobacterium
neisseriaPath?Arquivo marcador condicional que aciona ferramentas de análise de Neisseria
pseudomonasPath?Arquivo marcador condicional que aciona ferramentas de análise de Pseudomonas
salmonellaPath?Arquivo marcador condicional que aciona ferramentas de análise de Salmonella
staphylococcusPath?Arquivo marcador condicional que aciona ferramentas de análise de Staphylococcus
streptococcusPath?Arquivo marcador condicional que aciona ferramentas de análise de Streptococcus
genusSet<Path?>Arquivo marcador indicando o gênero detectado
distPathResultados brutos de distância Mash
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com versões dos programas

Parâmetros

Parâmetros mashdist

ParâmetroTipoPadrãoDescrição
--mash_sketchstringA sequência de referência como um Mash Sketch (arquivo .msh)
--mash_seedinteger42Semente fornecida à função de hash
--mash_tablebooleanfalseSaída em tabela (campos ficarão em branco se não atingirem o limiar de p-valor)
--mash_minteger1Número mínimo de cópias de cada k-mer necessário para passar no filtro de ruído para reads
--mash_wnumber0.01Limiar de probabilidade para aviso sobre tamanho de k-mer baixo.
--mash_max_pnumber1.0Valor de p máximo a reportar.
--mash_max_distnumber1.0Distância máxima a reportar.
--merlin_distnumber0.1Distância máxima a reportar ao usar o Merlin.
--full_merlinbooleanfalseExecutar o Merlin completo e rodar todas as ferramentas específicas por espécie, independentemente da distância Mash
--mash_use_fastqsbooleanfalseConsultar com FASTQs em vez das montagens

Utilizado Por

Subworkflows

  • merlindist - Identificar espécies a partir de dados de montagem e reads usando distâncias Mash.

Citações

Se você usar isso em sua análise, cite o seguinte.

Fonte

Ver fonte no GitHub

Versão

MERLIN_DIST:
- mash: 2.3