Pular para o conteúdo principal

bactopia_sketcher

Tags: bacteria taxonomy classification minhash sketch mash sourmash refseq gtdb sample-scope

Crie esboços genômicos e realize classificação taxonômica rápida.

Utiliza Mash e Sourmash para criar esboços MinHash das sequências de entrada. Esses esboços são então consultados em bancos de dados pré-construídos (RefSeq e GTDB) para identificar os genomas de referência mais próximos.

Bancos de Dados Necessários

Requer os bancos de dados pré-compilados RefSeq (Mash) e GTDB (Sourmash), geralmente baixados pelo módulo datasets.

Entradas

record (
meta: Record,
fna: Path
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
fnaPathContigs montados no formato FASTA
mash_db: Path
sourmash_db: Path
NomeTipoDescrição
mash_dbPathCaminho para o banco de dados Mash RefSeq
sourmash_dbPathCaminho para o banco de dados Sourmash GTDB LCA

Saídas

record (
meta: Record,
sig: Path,
msh: Set<Path>,
mash: Path,
sourmash: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro de informações da amostra
sigPathO arquivo de assinatura do Sourmash (*.sig)
mshSet<Path>Os arquivos de esboço Mash para k=21 e k=31 (*.msh)
mashPathUm relatório de classificação dos resultados do Mash Screen contra o banco de dados RefSeq
sourmashPathUm relatório de classificação do Sourmash LCA contra o banco de dados GTDB
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log específicos de programas (opcionais)
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Um arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros do Sketcher

ParâmetroTipoPadrãoDescrição
--sketch_sizeinteiro10000Tamanho do esboço. Cada esboço terá no máximo esse número de min-hashes não redundantes.
--sourmash_scaleinteiro10000Escolhe o número de hashes como 1 em FRAÇÃO dos k-mers de entrada
--no_winner_take_allbooleanoDesativa a estratégia winner-takes-all para estimativas de identidade
--screen_inúmero0.8Identidade mínima a ser reportada.

Usado Por

Subworkflows

  • bactopia_sketcher - Crie esboços genômicos e realize classificação taxonômica rápida.

Workflows

  • bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
  • staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.

Citações

Se você usar isso em sua análise, por favor cite o seguinte.

Fonte

Ver fonte no GitHub

Versão

BACTOPIA_SKETCHER:
- bactopia-sketcher: 1.0.3