Pular para o conteúdo principal

scrubber

Tags: metagenomics decontamination human-removal read-filtering sample-scope

Remova sequências contaminantes de dados metagenômicos.

Este subworkflow remove sequências humanas e de outros contaminantes de reads metagenômicos utilizando deacon (padrão), nohuman, ou o SRA Human Scrubber. Ele oferece remoção flexível de contaminação com relatórios detalhados e agrega resultados entre múltiplas amostras.

Take

reads: Channel<Record>
CampoDescrição
metaRegistro Groovy contendo informações da amostra
r1Reads Illumina R1 (paired-end)
r2Reads Illumina R2 (paired-end)
seReads Illumina single-end
lrLong reads (ONT/PacBio)
use_srascrubber: Boolean
use_nohuman: Boolean
nohuman_db: Path?
download_nohuman: Boolean
nohuman_save_as_tarball: Boolean
deacon_db: Path?
download_deacon: Boolean
NomeTipoDescrição
use_srascrubberBooleanFlag booleana para usar o SRA Human Scrubber na descontaminação
use_nohumanBooleanFlag booleana para usar nohuman na descontaminação
nohuman_dbPath?Caminho para o diretório ou tarball do banco de dados do nohuman (usado quando use_nohuman é verdadeiro)
download_nohumanBooleanFlag booleana para baixar o banco de dados do nohuman em vez de usar o caminho fornecido
nohuman_save_as_tarballBooleanFlag booleana para salvar o banco de dados do nohuman baixado como tarball
deacon_dbPath?Caminho para o arquivo de índice minimizador do deacon (.idx) (usado quando deacon é selecionado)
download_deaconBooleanFlag booleana para baixar o índice do deacon em vez de usar o caminho fornecido

Emit

Publicados

As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no workflow de entrada.

sample_outputs

SaídaDescrição
special_metaRegistro de metadados simplificado para junção em relatórios downstream
r1Reads paired-end forward processados
r2Reads paired-end reverse processados
seReads single-end processados
lrLong reads processados
scrub_reportRelatório de estatísticas de remoção de contaminação

run_outputs

SaídaDescrição
csvRelatórios de contaminação agregados de todas as amostras

Entradas Downstream

As emissões a seguir devem ser usadas como entradas para subworkflows downstream.

scrubbed

SaídaDescrição
r1Reads paired-end forward processados
r2Reads paired-end reverse processados
seReads single-end processados
lrLong reads processados

scrubbed_extra

SaídaDescrição
r1Reads paired-end forward processados
r2Reads paired-end reverse processados
seReads single-end processados
lrLong reads processados
fnaArquivo de montagem (repassado)

special_tsv

SaídaDescrição
special_metaRegistro de metadados simplificado para junção em relatórios downstream
scrub_reportRelatório de estatísticas de remoção de contaminação

Composição de Subworkflows

Este subworkflow chama os seguintes subworkflows:

  • deacon - Remove reads do hospedeiro de dados de sequenciamento usando deacon.
  • srahumanscrubber - Remove contaminação humana de reads de sequenciamento para submissão ao SRA.
  • nohuman - Remove reads humanos de dados de sequenciamento usando nohuman.

Composição de Módulos

Este subworkflow chama os seguintes módulos:

  • csvtk_concat - Concatena múltiplos arquivos CSV ou TSV em uma única tabela.

Usado Por

Este subworkflow é usado pelos seguintes workflows:

  • cleanyerreads - Controle de qualidade e remoção opcional de reads do hospedeiro a partir de reads brutos de sequenciamento.
  • scrubber - Remoção de sequências humanas e contaminantes de reads metagenômicos.

Citations

If you use this in your analysis, please cite the following.

Source

Visualizar fonte no GitHub