Pular para o conteúdo principal

kraken2

Tags: metagenomics taxonomy classification contamination scrubbing k-mer lca sample-scope

Classificação taxonômica e filtragem de hospedeiro de reads de sequência.

Utiliza o Kraken2 para atribuir rótulos taxonômicos a reads de DNA curtas, examinando correspondências exatas de k-mers contra um grande banco de dados de referência. O algoritmo de Menor Ancestral Comum (LCA) é usado para fornecer classificação de alta precisão, tornando-o ideal para metagenômica ou remoção de contaminação do hospedeiro (scrubbing).

Utiliza campos de registro posicionais explícitos para reads:

  • Entrada: record(meta, r1, r2, se, lr) onde cada slot de read é Path?
Banco de Dados Necessário

Requer um banco de dados Kraken2 padrão (diretório ou tarball). O uso de memória depende do tamanho do banco de dados (Padrão ~50GB).

Entradas

record (
meta: Record,
r1: Path?,
r2: Path?,
se: Path?,
lr: Path?
)
CampoTipoDescrição
metaRecordGroovy Record contendo informações da amostra
r1Path?Reads R1 Illumina (paired-end)
r2Path?Reads R2 Illumina (paired-end)
sePath?Reads Illumina single-end
lrPath?Long reads (ONT/PacBio) - normalmente não utilizados pelo Kraken2
db: Path
NomeTipoDescrição
dbPathBanco de dados Kraken2 (Diretório ou tarball comprimido)

Saídas

record (
meta: Record,
special_meta: Record,
kraken2_report: Path,
scrub_report: Path?,
classified: Set<Path?>,
unclassified: Set<Path?>,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro de informações da amostra
special_metaRecordUm registro de metadados simplificado para uso interno
kraken2_reportPathRelatório padrão do Kraken2 contendo contagens de abundância taxonômica
scrub_reportPath?Relatório resumido dos reads removidos durante o scrubbing do hospedeiro
classifiedSet<Path?>Reads atribuídas a um táxon no banco de dados (FASTQ)
unclassifiedSet<Path?>Reads NÃO atribuídas a nenhum táxon (FASTQ)
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo formatado em YAML com as versões dos programas

Parâmetros

Parâmetros do Kraken2

ParâmetroTipoPadrãoDescrição
--kraken2_dbstringUm único tarball ou caminho para um banco de dados formatado para Kraken2
--kraken2_quick_modebooleanfalseOperação rápida (usa o primeiro hit ou hits)
--kraken2_confidencenumber0.0Limiar de pontuação de confiança entre 0 e 1
--kraken2_minimum_base_qualityinteger0Qualidade mínima de base usada na classificação
--kraken2_use_mpa_stylebooleanfalseFormata a saída do relatório como o kraken-mpa-report do Kraken 1
--kraken2_report_zero_countsbooleanfalseReporta contagens para TODOS os táxons, mesmo que sejam zero
--kraken2_report_minimizer_databooleanfalseInclui informações de minimizador e contagem de minimizadores distintos no relatório
--kraken2_use_namesbooleanfalseImprime nomes científicos em vez de apenas taxids
--kraken2_memory_mappingbooleanfalseEvita carregar o banco de dados na RAM
--kraken2_minimum_hit_groupsinteger2Número mínimo de grupos de hits necessários para realizar uma classificação
--kraken2_keep_filtered_readsbooleanfalseMantém os FASTQs classificados e não classificados produzidos pelo Kraken2

Usado Por

Subworkflows

  • kraken2 - Classifica reads metagenômicas usando Kraken2.

Workflows

  • kraken2 - Classificação taxonômica de reads de sequência metagenômica.

Citações

Se você usar isso em sua análise, por favor cite o seguinte.

Fonte

Ver fonte no GitHub

Versão

KRAKEN2:
- bactopia-teton: 1.1.4