Pular para o conteúdo principal

sylph_profile

Tags: metagenomics profiling taxonomy abundance ani sylph sample-scope

Perfil de amostras metagenômicas contra um banco de dados usando Sylph.

Utiliza o Sylph para perfilar amostras metagenômicas quanto à abundância taxonômica e ANI de contenção contra um banco de dados fornecido. Foi projetado para ser extremamente rápido e eficiente em termos de memória.

Utiliza campos de registro posicionais explícitos para reads:

  • Entrada: record(meta, r1, r2, se, lr) onde cada slot de read é Path?

Entradas

record (
meta: Record,
r1: Path?,
r2: Path?,
se: Path?,
lr: Path?
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
r1Path?Reads Illumina R1 (paired-end)
r2Path?Reads Illumina R2 (paired-end)
sePath?Reads Illumina single-end
lrPath?Long reads (ONT/PacBio)
db: Path
NomeTipoDescrição
dbPathCaminho para o arquivo de banco de dados Sylph (*.syldb)

Saídas

record (
meta: Record,
tsv: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro de informações da amostra
tsvPathArquivo TSV com os resultados do perfil
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros do Sylph Profile

ParâmetroTipoPadrãoDescrição
--sylph_dbstringCaminho para um banco de dados formatado pelo Sylph
--sylph_kinteger31Tamanho do k-mer para sketching
--sylph_min_spacinginteger30Espaçamento mínimo entre k-mers selecionados nos genomas do banco de dados
--sylph_subsample_rateinteger200Taxa de subamostragem para sketching
--sylph_min_aniinteger95ANI ajustado mínimo a considerar. Valores menores que 95 para o perfil produzirão resultados imprecisos.
--sylph_min_kmersinteger50Excluir genomas com menos do que este número de k-mers amostrados
--sylph_min_correctinteger3Multiplicidade mínima de k-mer necessária para correção de cobertura. Valores maiores oferecem mais precisão, mas menor sensibilidade
--sylph_estimate_unknownbooleanfalseEstimar a cobertura real e escalar a abundância de sequências no profile pela porcentagem estimada de sequências desconhecidas
--sylph_optsstringOpções extras entre aspas para o Sylph

Utilizado Por

Subworkflows

  • sylph - Perfilar a composição microbiana usando Sylph.

Workflows

  • sylph - Perfil taxonômico por MinHash corrigido por abundância.

Citações

Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

SYLPH_PROFILE:
- sylph: 0.9.0