scrubber
Tags: metagenomics decontamination human-removal read-filtering sample-scope
Remova sequências contaminantes de dados metagenômicos.
Este subworkflow remove sequências humanas e de outros contaminantes de reads metagenômicos utilizando deacon (padrão), nohuman, ou o SRA Human Scrubber. Ele oferece remoção flexível de contaminação com relatórios detalhados e agrega resultados entre múltiplas amostras.
Take
reads: Channel<Record>
| Campo | Descrição |
|---|---|
meta | Registro Groovy contendo informações da amostra |
r1 | Reads Illumina R1 (paired-end) |
r2 | Reads Illumina R2 (paired-end) |
se | Reads Illumina single-end |
lr | Long reads (ONT/PacBio) |
use_srascrubber: Boolean
use_nohuman: Boolean
nohuman_db: Path?
download_nohuman: Boolean
nohuman_save_as_tarball: Boolean
deacon_db: Path?
download_deacon: Boolean
| Nome | Tipo | Descrição |
|---|---|---|
use_srascrubber | Boolean | Flag booleana para usar o SRA Human Scrubber na descontaminação |
use_nohuman | Boolean | Flag booleana para usar nohuman na descontaminação |
nohuman_db | Path? | Caminho para o diretório ou tarball do banco de dados do nohuman (usado quando use_nohuman é verdadeiro) |
download_nohuman | Boolean | Flag booleana para baixar o banco de dados do nohuman em vez de usar o caminho fornecido |
nohuman_save_as_tarball | Boolean | Flag booleana para salvar o banco de dados do nohuman baixado como tarball |
deacon_db | Path? | Caminho para o arquivo de índice minimizador do deacon (.idx) (usado quando deacon é selecionado) |
download_deacon | Boolean | Flag booleana para baixar o índice do deacon em vez de usar o caminho fornecido |
Emit
Publicados
As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no workflow de entrada.
sample_outputs
| Saída | Descrição |
|---|---|
special_meta | Registro de metadados simplificado para junção em relatórios downstream |
r1 | Reads paired-end forward processados |
r2 | Reads paired-end reverse processados |
se | Reads single-end processados |
lr | Long reads processados |
scrub_report | Relatório de estatísticas de remoção de contaminação |
run_outputs
| Saída | Descrição |
|---|---|
csv | Relatórios de contaminação agregados de todas as amostras |
Entradas Downstream
As emissões a seguir devem ser usadas como entradas para subworkflows downstream.
scrubbed
| Saída | Descrição |
|---|---|
r1 | Reads paired-end forward processados |
r2 | Reads paired-end reverse processados |
se | Reads single-end processados |
lr | Long reads processados |
scrubbed_extra
| Saída | Descrição |
|---|---|
r1 | Reads paired-end forward processados |
r2 | Reads paired-end reverse processados |
se | Reads single-end processados |
lr | Long reads processados |
fna | Arquivo de montagem (repassado) |
special_tsv
| Saída | Descrição |
|---|---|
special_meta | Registro de metadados simplificado para junção em relatórios downstream |
scrub_report | Relatório de estatísticas de remoção de contaminação |
Composição de Subworkflows
Este subworkflow chama os seguintes subworkflows:
- deacon - Remove reads do hospedeiro de dados de sequenciamento usando deacon.
- srahumanscrubber - Remove contaminação humana de reads de sequenciamento para submissão ao SRA.
- nohuman - Remove reads humanos de dados de sequenciamento usando nohuman.
Composição de Módulos
Este subworkflow chama os seguintes módulos:
- csvtk_concat - Concatena múltiplos arquivos CSV ou TSV em uma única tabela.
Usado Por
Este subworkflow é usado pelos seguintes workflows:
- cleanyerreads - Controle de qualidade e remoção opcional de reads do hospedeiro a partir de reads brutos de sequenciamento.
- scrubber - Remoção de sequências humanas e contaminantes de reads metagenômicos.
Citations
If you use this in your analysis, please cite the following.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
deacon
Bede N. deacon: SIMD-accelerated filtering of DNA sequences using minimizer-based comparison. (GitHub) -
Kraken2
Wood DE, Lu J, Langmead B Improved metagenomic analysis with Kraken 2. Genome Biology, 20(1), 257. (2019) -
SRA Human Scrubber
Katz KS, Shutov O, Lapoint R, Kimelman M, Brister JR, and O'Sullivan C STAT: a fast, scalable, MinHash-based k-mer tool to assess Sequence Read Archive next-generation sequence submissions. Genome Biology, 22(1), 270 (2021)