Pular para o conteúdo principal

teton

Tags: metagenomics taxonomy classification kraken bracken genome-size run-scope

Realize classificação taxonômica e estime tamanhos de genomas bacterianos.

Este subworkflow processa reads de sequenciamento brutos por meio de um pipeline de classificação taxonômica usando Kraken2 e Bracken para estimar tamanhos de genomas bacterianos e separar organismos bacterianos dos não bacterianos. Primeiro, ele remove reads do hospedeiro usando o subworkflow scrubber, em seguida classifica os reads e, por fim, cria planilhas de amostras com estimativas de tamanho de genoma para análises downstream no Bactopia.

Utiliza campos de registro posicionais explícitos para reads:

  • Entrada: record(meta, r1, r2, se, lr) onde cada slot de read é Path?

Take

reads: Channel<Record>
CampoDescrição
metaRegistro Groovy contendo informações da amostra
r1Reads Illumina R1 (paired-end)
r2Reads Illumina R2 (paired-end)
seReads Illumina single-end
lrReads longas (ONT/PacBio)
db: Path?
use_srascrubber: Boolean
use_nohuman: Boolean
nohuman_db: Path?
download_nohuman: Boolean
nohuman_save_as_tarball: Boolean
deacon_db: Path?
download_deacon: Boolean
NomeTipoDescrição
dbPath?Caminho opcional para o banco de dados Kraken2 para classificação taxonômica
use_srascrubberBooleanFlag booleano para usar o SRA scrubber na remoção de reads do hospedeiro
use_nohumanBooleanFlag booleano para usar o nohuman na remoção de reads do hospedeiro
nohuman_dbPath?Caminho para o diretório ou tarball do banco de dados nohuman
download_nohumanBooleanFlag booleano para baixar o banco de dados nohuman
nohuman_save_as_tarballBooleanFlag booleano para salvar o banco de dados nohuman baixado como tarball
deacon_dbPath?Caminho para o arquivo de índice minimizer do deacon (.idx)
download_deaconBooleanFlag booleano para baixar o índice do deacon

Emit

Publicados

As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no workflow de entrada.

sample_outputs

Nenhuma saída com escopo de amostra.

run_outputs

Nenhuma saída com escopo de execução.

Composição de Subworkflows

Este subworkflow chama os seguintes subworkflows:

  • scrubber - Remove sequências contaminantes de dados metagenômicos.
  • bracken - Estima a abundância de espécies a partir de reads metagenômicos.

Composição de Módulos

Este subworkflow chama os seguintes módulos:

  • bactopia_teton - Prediz o tamanho do genoma e direciona amostras com base na classificação taxonômica.
  • csvtk_join - Une dois arquivos CSV ou TSV com base em campos comuns.
  • csvtk_concat - Concatena múltiplos arquivos CSV ou TSV em uma única tabela.

Usado Por

Este subworkflow é usado pelos seguintes workflows:

  • teton - Classificação taxonômica e perfil de abundância de reads metagenômicos.

Citações

Se você usar este subworkflow em sua análise, cite o seguinte.

Fonte

Ver fonte no GitHub