Pular para o conteúdo principal

bactopia

Tags: bacteria assembly annotation amr mlst genomics pipeline named-workflow

Pipeline abrangente de análise bacteriana para caracterização genômica completa.

Este fluxo de trabalho realiza análises de ponta a ponta, incluindo controle de qualidade, montagem, anotação, detecção de resistência antimicrobiana, tipagem MLST e análise opcional específica de patógenos via Merlin. Ele processa reads de sequenciamento brutos e produz uma caracterização genômica completa adequada para análises posteriores.

Visão Geral do Pipeline

Bactopia Workflow

Ao olhar para o fluxo de trabalho acima, pode parecer que não há muita coisa acontecendo, mas posso garantir que muita coisa está ocorrendo. O fluxo de trabalho é dividido em 8 etapas:

  1. Gather - Coletar todos os dados em um único lugar
  2. QC - Controle de qualidade dos dados
  3. Assembler - Montar os reads em contigs
  4. Annotator - Anotar os contigs
  5. Sketcher - Criar um esboço dos contigs e consultar bancos de dados
  6. Sequence Typing - Determinar o tipo de sequência dos contigs
  7. Antibiotic Resistance - Determinar a resistência a antibióticos dos contigs e proteínas
  8. Merlin - Executar automaticamente ferramentas específicas por espécie com base na distância

Se você está procurando um guia para começar rapidamente, consulte o Guia para Iniciantes.

Etapa 1 - Gather

O objetivo principal da etapa gather é reunir todas as amostras em um único lugar. Isso inclui o download de amostras do ENA/SRA ou NCBI Assembly. As ferramentas utilizadas são:

FerramentaDescrição
artPara simular reads sem erros a partir de uma montagem de entrada
fastq-dlDownload de arquivos FASTQ do ENA/SRA
ncbi-genome-downloadDownload de arquivos FASTA do NCBI Assembly

A etapa gather também realiza verificações básicas de controle de qualidade para ajudar a prevenir falhas posteriores.

Verificações de Qualidade com Falha

Nome do ArquivoDescrição
-gzip-error.txtAmostra falhou nas verificações de Gzip e foi excluída de análises posteriores
-low-basepair-proportion-error.txtAmostra falhou nas verificações de proporção de pares de bases e foi excluída de análises posteriores
-low-read-count-error.txtAmostra falhou nas verificações de contagem de reads e foi excluída de análises posteriores
-low-sequence-depth-error.txtAmostra falhou nas verificações de pares de bases sequenciados e foi excluída de análises posteriores
Amostras de baixa qualidade são excluídas para evitar falhas posteriores

Amostras que falham em qualquer uma das verificações de qualidade serão excluídas de análises posteriores. Essas amostras gerarão um arquivo *-error.txt com a mensagem de erro. Excluir essas amostras previne falhas posteriores que causariam a falha de todo o fluxo de trabalho.

Exemplo de Erro: FASTQ(s) de entrada falharam nas verificações de Gzip

Se os FASTQ(s) de entrada não passarem no teste de Gzip, a amostra será excluída de análises posteriores.

Exemplo de texto em <SAMPLE_NAME>-gzip-error.txt <SAMPLE_NAME> FASTQs failed Gzip tests. Please check the input FASTQs. Further analysis is discontinued.

Exemplo de Erro: FASTQs de entrada têm número desproporcional de reads

Se os FASTQ(s) de entrada de uma amostra tiverem um número desproporcionalmente diferente de reads entre os dois pares, a amostra será excluída de análises posteriores. Você pode ajustar essa contagem mínima de reads usando o parâmetro --min_proportion.

Exemplo de texto em <SAMPLE_NAME>-low-basepair-proportion-error.txt <SAMPLE_NAME> FASTQs failed to meet the minimum shared basepairs. They shared Y basepairs, with R1 having A bp and R2 having B bp. Further analysis is discontinued.

Exemplo de Erro: FASTQ(s) de entrada têm reads insuficientes

Se os FASTQ(s) de entrada de uma amostra tiverem menos reads do que o mínimo exigido, a amostra será excluída de análises posteriores. Você pode ajustar essa contagem mínima de reads usando o parâmetro --min_reads.

Exemplo de texto em <SAMPLE_NAME>-low-read-count-error.txt <SAMPLE_NAME> FASTQ(s) contain X total reads. This does not exceed the required minimum Y read count. Further analysis is discontinued.

Exemplo de Erro: FASTQ(s) de entrada têm pares de bases sequenciados insuficientes

Se os FASTQ(s) de entrada de uma amostra não atingirem o número mínimo de pares de bases sequenciados, a amostra será excluída de análises posteriores. Você pode ajustar essa contagem mínima usando o parâmetro --min_basepairs.

Exemplo de texto em <SAMPLE_NAME>-low-sequence-depth-error.txt <SAMPLE_NAME> FASTQ(s) contain X total basepairs. This does not exceed the required minimum Y bp. Further analysis is discontinued.

Etapa 2 - QC

O módulo qc usa uma variedade de ferramentas para realizar controle de qualidade em reads do Illumina e Oxford Nanopore. As ferramentas utilizadas são:

FerramentaTecnologiaDescrição
bbtoolsIlluminaUm conjunto de ferramentas para manipulação de reads
fastpIlluminaUma ferramenta projetada para fornecer pré-processamento rápido e completo de arquivos FastQ
fastqcIlluminaUma ferramenta de controle de qualidade para dados de sequenciamento de alto rendimento
fastq_scanNanoporeUma ferramenta para varredura rápida de arquivos FASTQ
lighterIlluminaUma ferramenta para correção de erros de sequenciamento em reads do Illumina
NanoPlotNanoporeUma ferramenta para visualização de dados de sequenciamento de leituras longas
nanoqNanoporeUma ferramenta para calcular métricas de qualidade para reads do Oxford Nanopore
porechopNanoporeUma ferramenta para remoção de adaptadores de reads do Oxford Nanopore
rasusaNanoporeSubamostragem aleatória de reads de sequenciamento para uma cobertura especificada

Semelhante à etapa gather, a etapa qc também impedirá que amostras que não atendam às verificações básicas de qualidade continuem para as etapas posteriores.

Verificações de Qualidade com Falha

Nome do ArquivoDescrição
.error-fastq.gzUm arquivo FASTQ comprimido com reads que falharam no controle de qualidade
-low-read-count-error.txtAmostra falhou nas verificações de contagem de reads e foi excluída de análises posteriores
-low-sequence-coverage-error.txtAmostra falhou nas verificações de cobertura de sequenciamento e foi excluída de análises posteriores
-low-sequence-depth-error.txtAmostra falhou nas verificações de pares de bases sequenciados e foi excluída de análises posteriores
Amostras de baixa qualidade são excluídas para evitar falhas posteriores

Amostras que falham em qualquer uma das verificações de qualidade serão excluídas de análises posteriores. Essas amostras gerarão um arquivo *-error.txt com a mensagem de erro. Excluir essas amostras previne falhas posteriores que causariam a falha de todo o fluxo de trabalho.

Exemplo de Erro: Após o controle de qualidade, restam reads insuficientes

Se após a limpeza dos reads, uma amostra tiver menos reads do que o mínimo exigido, a amostra será excluída de análises posteriores. Você pode ajustar essa contagem mínima de reads usando o parâmetro --min_reads.

Exemplo de texto em <SAMPLE_NAME>-low-read-count-error.txt <SAMPLE_NAME> FASTQ(s) contain X total reads. This does not exceed the required minimum Y read count. Further analysis is discontinued.

Exemplo de Erro: Após o controle de qualidade, resta cobertura de sequenciamento insuficiente

Se após a limpeza dos reads, uma amostra não atingir a cobertura mínima de sequenciamento exigida, a amostra será excluída de análises posteriores. Você pode ajustar esse mínimo usando o parâmetro --min_coverage.

Nota: Esta verificação é realizada apenas quando o tamanho do genoma está disponível.

Exemplo de texto em <SAMPLE_NAME>-low-sequence-coverage-error.txt After QC, <SAMPLE_NAME> FASTQ(s) contain X total basepairs. This does not exceed the required minimum Y bp (Zx coverage). Further analysis is discontinued.

Exemplo de Erro: Após o controle de qualidade, restam pares de bases sequenciados insuficientes

Se após a limpeza dos reads, uma amostra não atingir o número mínimo de pares de bases sequenciados, a amostra será excluída de análises posteriores. Você pode ajustar esse mínimo usando o parâmetro --min_basepairs.

Exemplo de texto em <SAMPLE_NAME>-low-sequence-depth-error.txt <SAMPLE_NAME> FASTQ(s) contain X total basepairs. This does not exceed the required minimum Y bp. Further analysis is discontinued.

Etapa 3 - Assembler

O módulo assembler usa uma variedade de ferramentas de montagem para criar uma montagem de reads do Illumina e Oxford Nanopore. As ferramentas utilizadas são:

FerramentaDescrição
DragonflyeMontagem de reads do Oxford Nanopore, bem como montagem híbrida com polimento por reads curtos
ShovillMontagem de reads paired-end do Illumina
Shovill-SEMontagem de reads single-end do Illumina
UnicyclerMontagem híbrida, utilizando primeiro reads curtos e depois reads longos

Estatísticas resumidas para cada montagem são geradas usando assembly-scan.

Prefira --short_polish em vez de --hybrid com sequenciamento ONT recente

Usar Unicycler (--hybrid) para criar uma montagem híbrida funciona muito bem quando você tem reads longos com baixa cobertura e muito ruído. No entanto, se você estiver usando sequenciamento ONT recente, provavelmente tem alta cobertura e o uso do método --short_polish vai gerar resultados melhores (e mais rápidos!) do que --hybrid.

Verificações de Qualidade com Falha

Nome do ArquivoDescrição
-assembly-error.txtAmostra falhou nas verificações de montagem e foi excluída de análises posteriores
Amostras de baixa qualidade são excluídas para evitar falhas posteriores

Amostras que falham em qualquer uma das verificações de qualidade serão excluídas de análises posteriores. Essas amostras gerarão um arquivo *-error.txt com a mensagem de erro. Excluir essas amostras previne falhas posteriores que causariam a falha de todo o fluxo de trabalho.

Exemplo de Erro: Montagem realizada com sucesso, mas 0 contigs

Se uma amostra for montada com sucesso, mas 0 contigs forem formados, a amostra será excluída de análises posteriores.

Exemplo de texto em <SAMPLE_NAME>-assembly-error.txt <SAMPLE_NAME> assembled successfully, but 0 contigs were formed. Please investigate <SAMPLE_NAME> to determine a cause (e.g. metagenomic, contaminants, etc...) for this outcome. Further assembly-based analysis of <SAMPLE_NAME> will be discontinued.

Exemplo de Erro: Montagem realizada com sucesso, mas tamanho da montagem ruim

Se sua amostra for montada com sucesso, mas o tamanho da montagem for menor do que o tamanho mínimo permitido do genoma, a amostra será excluída de análises posteriores. Você pode ajustar esse tamanho mínimo usando o parâmetro --min_genome_size.

Exemplo de texto em <SAMPLE_NAME>-assembly-error.txt <SAMPLE_NAME> assembled size (000 bp) is less than the minimum allowed genome size (000 bp). If this is unexpected, please investigate <SAMPLE_NAME> to determine a cause (e.g. metagenomic, contaminants, etc...) for the poor assembly. Otherwise, adjust the --min_genome_size parameter to fit your need. Further assembly based analysis of <SAMPLE_NAME> will be discontinued.

Etapa 4 - Annotator

A etapa annotator usa Prokka (padrão) ou Bakta (via --use_bakta) para anotar contigs montados com informações funcionais incluindo genes, proteínas, rRNA, tRNA e outras características genômicas.

Etapa 5 - Sketcher

O módulo sketcher usa Mash e Sourmash para criar esboços e consultar RefSeq e GTDB.

Etapa 6 - Sequence Typing

A etapa mlst usa mlst para varrer montagens contra esquemas de tipagem do PubMLST e determinar o tipo de sequência.

Etapa 7 - Antibiotic Resistance

A etapa amrfinderplus usa AMRFinder+ para identificar genes de resistência antimicrobiana e mutações pontuais tanto de contigs montados quanto de sequências de proteínas anotadas.

Etapa 8 - Merlin

A etapa merlin seleciona e executa automaticamente ferramentas de tipagem específicas por espécie com base nos resultados de distância Mash da etapa sketcher. Ative com --ask_merlin. Consulte a seção de saídas de Análise Específica de Patógenos abaixo para a lista completa de organismos e ferramentas suportados.

Uso

Bactopia CLI:

bactopia \
--input samples.csv \
--outdir results/

Nextflow:

nextflow run bactopia/bactopia \
--input samples.csv \
--outdir results/

Saídas

Arquivos de Saída Esperados

<BACTOPIA_DIR>
├── <SAMPLE_NAME>
│ ├── main
│ │ ├── annotator
│ │ │ └── prokka
│ │ │ ├── <SAMPLE_NAME>-blastdb.tar.gz
│ │ │ ├── <SAMPLE_NAME>.faa.gz
│ │ │ ├── <SAMPLE_NAME>.ffn.gz
│ │ │ ├── <SAMPLE_NAME>.fna.gz
│ │ │ ├── <SAMPLE_NAME>.fsa.gz
│ │ │ ├── <SAMPLE_NAME>.gbk.gz
│ │ │ ├── <SAMPLE_NAME>.gff.gz
│ │ │ ├── <SAMPLE_NAME>.sqn.gz
│ │ │ ├── <SAMPLE_NAME>.tbl.gz
│ │ │ ├── <SAMPLE_NAME>.tsv
│ │ │ ├── <SAMPLE_NAME>.txt
│ │ │ └── logs
│ │ │ ├── <SAMPLE_NAME>.err
│ │ │ ├── <SAMPLE_NAME>.log
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── assembler
│ │ │ ├── <SAMPLE_NAME>.fna.gz
│ │ │ ├── <SAMPLE_NAME>.tsv
│ │ │ ├── logs
│ │ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ │ ├── shovill-se.log
│ │ │ │ └── versions.yml
│ │ │ └── supplemental
│ │ │ ├── illumina.txt
│ │ │ └── shovill.corrections
│ │ ├── gather
│ │ │ ├── <SAMPLE_NAME>-meta.tsv
│ │ │ └── logs
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── qc
│ │ │ ├── <SAMPLE_NAME>_SE.fastq.gz
│ │ │ ├── logs
│ │ │ │ ├── <SAMPLE_NAME>-fastp.log
│ │ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ │ └── versions.yml
│ │ │ └── supplemental
│ │ │ ├── <SAMPLE_NAME>.fastp.html
│ │ │ ├── <SAMPLE_NAME>.fastp.json
│ │ │ ├── <SAMPLE_NAME>_SE-final.json
│ │ │ ├── <SAMPLE_NAME>_SE-final_fastqc.html
│ │ │ ├── <SAMPLE_NAME>_SE-final_fastqc.zip
│ │ │ ├── <SAMPLE_NAME>_SE-original.json
│ │ │ ├── <SAMPLE_NAME>_SE-original_fastqc.html
│ │ │ └── <SAMPLE_NAME>_SE-original_fastqc.zip
│ │ └── sketcher
│ │ ├── <SAMPLE_NAME>-k21.msh
│ │ ├── <SAMPLE_NAME>-k31.msh
│ │ ├── <SAMPLE_NAME>-mash-refseq88-k21.txt
│ │ ├── <SAMPLE_NAME>-sourmash-gtdb-rs207-k31.txt
│ │ ├── <SAMPLE_NAME>.sig
│ │ └── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ └── tools
│ ├── amrfinderplus
│ │ ├── <SAMPLE_NAME>.tsv
│ │ └── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ └── mlst
│ ├── <SAMPLE_NAME>.tsv
│ └── logs
│ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ └── versions.yml
└── bactopia-runs
└── bactopia-<TIMESTAMP>
├── merged-results
│ ├── amrfinderplus.tsv
│ ├── assembly-scan.tsv
│ ├── logs
│ │ ├── amrfinderplus-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── assembly-scan-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── meta-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ └── mlst-concat
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ ├── meta.tsv
│ └── mlst.tsv
└── nf-reports
├── bactopia-dag.dot
├── bactopia-report.html
└── bactopia-timeline.html

Controle de Qualidade

ArquivoDescrição
supplemental/*_fastqc.*Relatórios de controle de qualidade do FastQC para reads brutos e limpos
supplemental/*-NanoPlot.*Relatórios do NanoPlot para reads do Nanopore
supplemental/*.fastp.*Relatórios de qualidade do Fastp (quando aplicável)
supplemental/*_original.jsonMétricas de qualidade para reads originais
supplemental/*_final.jsonMétricas de qualidade para reads finais

Montagem

ArquivoDescrição
*.fastaSequências do genoma montado
assembly-stats.tsvMétricas de qualidade da montagem
merged-assembly-stats.tsvEstatísticas consolidadas de montagem

Anotação

Nota

O formato de saída depende da ferramenta de anotação escolhida (Bakta ou Prokka)

ArquivoDescrição
*.gff.gzAnotação do genoma no formato GFF3 (comprimida)
*.gbk.gzAnotação do genoma no formato GenBank (comprimida)
*.faa.gzSequências de proteínas (comprimidas)
*.fna.gzSequências de nucleotídeos da anotação (comprimidas)
*.ffn.gzSequências de nucleotídeos de características (comprimidas)
annotation.tsvTabelas de resumo de anotação
blastdb.*Banco de dados BLAST criado a partir da anotação

Tipagem

ArquivoDescrição
mlst.tsvResultados do tipo de sequência MLST
merged-mlst.tsvResultados consolidados de MLST

Resistência Antimicrobiana

ArquivoDescrição
amrfinderplus.tsvResultados de detecção de genes de resistência antimicrobiana
amrfinderplus.mutation.tsvResultados de mutações pontuais de resistência antimicrobiana
merged-amrfinderplus.tsvResultados consolidados de resistência antimicrobiana

Análise Comparativa

ArquivoDescrição
*-k21.mshArquivos de esboço Mash (k=21)
*-k31.mshArquivos de esboço Mash (k=31)
*-mash-refseq88-*.txtResultados de triagem Mash contra RefSeq
*.sigAssinaturas do Sourmash
sourmash-*.txtResultados de classificação do Sourmash

Análise Específica de Patógenos

Nota

Criada apenas se --ask_merlin estiver ativado

ArquivoDescrição
merlin/clermontyping/*Tipagem de filogrupo de E. coli
merlin/ectyper/*Tipagem de E. coli enterotoxigênica
merlin/shigatyper/*Predição de sorotipo de Shigella
merlin/shigapass/*Vigilância passiva de Shigella
merlin/shigeifinder/*Detecção de Shigella e EIEC
merlin/stecfinder/*Detecção e tipagem de STEC
merlin/emmtyper/*Tipagem emm de S. pyogenes
merlin/hicap/*Tipagem capsular de H. influenzae
merlin/hpsuissero/*Sorotipagem de H. parasuis
merlin/kleborate/*Tipagem de espécies de Klebsiella
merlin/staphtyper/*Tipagem spa de S. aureus
merlin/agrvate/*Tipagem agr de S. aureus
merlin/sccmec/*Tipagem SCCmec de S. aureus

Resultados Consolidados

Nota

Resultados agregados no nível de execução de todas as amostras

ArquivoDescrição
samplesheet.tsvMetadados das amostras e métricas de qualidade

Trilha de Auditoria

Abaixo estão os arquivos que podem ajudá-lo a entender quais parâmetros e versões de programas foram utilizados.

Logs

Cada processo executado terá uma pasta chamada logs. Nessa pasta há arquivos úteis para você revisar caso necessário.

ExtensãoDescrição
.beginUm arquivo vazio usado para indicar que o processo foi iniciado
.errContém saídas STDERR do processo
.logContém saídas STDERR e STDOUT do processo
.outContém saídas STDOUT do processo
.runO script que o Nextflow usa para preparar/desfazer o staging de arquivos e enfileirar processos com base no perfil definido
.shO script executado pelo bash para o processo
.traceO relatório de rastreamento do Nextflow para o processo
versions.ymlUm arquivo no formato YAML com as versões dos programas

Relatórios do Nextflow

Esses relatórios do Nextflow fornecem um excelente resumo da sua execução. Eles podem ser usados para otimizar o uso de recursos e estimar custos esperados ao utilizar plataformas em nuvem.

Nome do ArquivoDescrição
bactopia-dag.dotA visualização DAG do Nextflow
bactopia-report.htmlO Relatório de Execução do Nextflow
bactopia-timeline.htmlO Relatório de Linha do Tempo do Nextflow
bactopia-trace.txtO relatório de Rastreamento do Nextflow

Parâmetros

Parâmetros Obrigatórios

Os parâmetros a seguir são a forma como você fornecerá amostras locais ou remotas para serem processadas pelo Bactopia.

ParâmetroTipoPadrãoDescrição
--samplesstringUm FOFN (via bactopia prepare) com nomes de amostras e caminhos para FASTQ/FASTAs a serem processados
--r1stringPrimeiro conjunto de reads paired-end do Illumina comprimidos (gzip) (requer --r2 e --sample)
--r2stringSegundo conjunto de reads paired-end do Illumina comprimidos (gzip) (requer --r1 e --sample)
--sestringReads single-end do Illumina comprimidos (gzip) (requer --sample)
--ontstringReads do Oxford Nanopore comprimidos (gzip) (requer --sample)
--hybridbooleanfalseCriar montagem híbrida usando Unicycler (requer --r1, --r2, --ont e --sample)
--short_polishbooleanfalseCriar montagem híbrida a partir de montagem de reads longos com polimento por reads curtos (requer --r1, --r2, --ont e --sample)
--samplestringNome da amostra a ser usado para as sequências de entrada
--accessionsstringUm arquivo contendo accessions de Experimentos ENA/SRA ou accessions de NCBI Assembly a serem processados
--accessionstringNome da amostra a ser usado para as sequências de entrada
--assemblystringUm genoma montado em formato FASTA comprimido (requer --sample)
--check_samplesbooleanfalseValidar o FOFN de entrada fornecido por --samples

Parâmetros do AMRFinder+

ParâmetroTipoPadrãoDescrição
--amrfinderplus_ident_minnumber-1Proporção mínima de aminoácidos idênticos no alinhamento para um hit (0..1)
--amrfinderplus_coverage_minnumber0.5Cobertura mínima da proteína de referência (0..1)
--amrfinderplus_organismstringGrupo taxonômico para executar triagens adicionais
--amrfinderplus_translation_tableinteger11Código genético NCBI para BLAST traduzido
--amrfinderplus_noplusbooleanfalseDesativar a execução do AMRFinder+ com a opção --plus
--amrfinderplus_report_commonbooleanfalseReportar proteínas comuns a um grupo taxonômico
--amrfinderplus_report_all_equalbooleanfalseReportar todos os hits BLAST e HMM com pontuação igual
--amrfinderplus_optsstringOpções extras do AMRFinder+ entre aspas
--amrfinderplus_dbstringUm banco de dados AMRFinder+ personalizado a ser usado, seja um tarball ou uma pasta

Parâmetros do csvtk concat

ParâmetroTipoPadrãoDescrição
--csvtk_concat_optsstringOpções extras do csvtk concat entre aspas

Parâmetros do Assembler

ParâmetroTipoPadrãoDescrição
--shovill_assemblerstringskesaMontador a ser usado pelo Shovill (opções: skesa, megahit, spades, velvet)
--dragonflye_assemblerstringflyeMontador a ser usado pelo Dragonflye (opções: flye, miniasm, raven)
--use_unicyclerbooleanUsar Unicycler para montagem paired-end
--min_contig_leninteger500Comprimento mínimo de contig <0=AUTO>
--min_contig_covinteger2Cobertura mínima de contig <0=AUTO>
--contig_namefmtstringFormato dos IDs FASTA dos contigs no estilo 'printf'
--shovill_optsstringOpções extras do montador entre aspas para o Shovill
--shovill_kmersstringK-mers a serem usados <em branco=AUTO>
--dragonflye_optsstringOpções extras do montador entre aspas para o Dragonflye
--trimbooleanAtivar trimagem de adaptadores
--no_stitchbooleanDesativar costura de reads para reads paired-end
--no_corrbooleanDesativar correção pós-montagem
--unicycler_modestringnormalModo de bridging usado pelo Unicycler (opções: conservative, normal, bold)
--min_component_sizeinteger1000Extremidades mortas do grafo menores que este tamanho (bp) serão removidas do grafo final
--min_dead_end_sizeinteger1000Extremidades mortas do grafo menores que este tamanho (bp) serão removidas do grafo final
--nanohqbooleanfalsePara o Flye, usar '--nano-hq' em vez de --nano-raw
--medaka_modelstringO modelo a ser usado para polimento com Medaka
--medaka_roundsinteger0O número de rodadas de polimento com Medaka a realizar
--racon_roundsinteger1O número de rodadas de polimento com Racon a realizar
--no_polishbooleanPular a etapa de polimento da montagem
--no_miniasmbooleanPular bridging com miniasm+Racon
--no_rotatebooleanNão rotacionar replicons completos para iniciar em um gene padrão
--reassemblebooleanfalseSe os reads foram simulados, eles serão usados para criar uma nova montagem
--polypolish_roundsinteger1Número de rodadas de polimento a realizar com Polypolish para polimento por reads curtos
--pilon_roundsinteger0Número de rodadas de polimento a realizar com Pilon para polimento por reads curtos

Parâmetros do Gather

ParâmetroTipoPadrãoDescrição
--skip_fastq_checkbooleanPular verificações de requisitos mínimos para FASTQs de entrada
--min_basepairsinteger2241820A quantidade mínima de pares de bases necessária para continuar as análises posteriores
--min_readsinteger7472A quantidade mínima de reads necessária para continuar as análises posteriores
--min_coverageinteger10A cobertura mínima necessária para continuar as análises posteriores
--min_proportionnumber0.5A proporção mínima de pares de bases para reads paired-end continuarem as análises posteriores
--min_genome_sizeinteger100000O tamanho mínimo estimado do genoma permitido para a sequência de entrada continuar as análises posteriores
--max_genome_sizeinteger18040666O tamanho máximo estimado do genoma permitido para a sequência de entrada continuar as análises posteriores
--attemptsinteger3Número máximo de tentativas de download
--use_enabooleanBaixar FASTQs do ENA
--no_cachebooleanPular o cache do arquivo de resumo de montagem do ncbi-genome-download

Parâmetros do Sketcher

ParâmetroTipoPadrãoDescrição
--sketch_sizeinteger10000Tamanho do esboço. Cada esboço terá no máximo este número de min-hashes não redundantes
--sourmash_scaleinteger10000Escolher o número de hashes como 1 em uma FRAÇÃO dos k-mers de entrada
--no_winner_take_allbooleanDesativar a estratégia winner-takes-all para estimativas de identidade
--screen_inumber0.8Identidade mínima para reportar

Parâmetros do MLST

ParâmetroTipoPadrãoDescrição
--mlst_schemestringNão detectar automaticamente, forçar este esquema em todas as entradas
--mlst_minidinteger95Porcentagem mínima de identidade de DNA do alelo completo para considerar 'similar'
--mlst_mincovinteger10Porcentagem mínima de cobertura de DNA para reportar alelo parcial
--mlst_minscoreinteger50Pontuação mínima de 100 para corresponder a um esquema
--mlst_nopathbooleanfalseRemover caminhos de arquivo da coluna FILE
--mlst_dbstringUm banco de dados MLST personalizado a ser usado, seja um tarball ou um diretório

Parâmetros do QC

ParâmetroTipoPadrãoDescrição
--use_bbmapbooleanReads do Illumina serão processados com BBMap
--use_porechopbooleanfalseUsar Porechop para remover adaptadores de reads ONT
--skip_qcbooleanA etapa de controle de qualidade será ignorada e assumirá que as sequências de entrada já foram submetidas ao controle de qualidade
--skip_qc_plotsbooleanA criação de gráficos de controle de qualidade pelo FastQC ou Nanoplot será ignorada
--skip_error_correctionbooleanA correção de erros de reads pelo FLASH será ignorada
--adaptersstringUm arquivo FASTA contendo adaptadores a serem removidos
--adapter_kinteger23Comprimento do k-mer usado para encontrar adaptadores
--phixstringGenoma de referência do phiX174 para remoção
--phix_kinteger31Comprimento do k-mer usado para encontrar o phiX174
--ktrimstringrTrimar reads para remover bases correspondentes a k-mers de referência (opções: f, r, l)
--minkinteger11Procurar k-mers mais curtos nas extremidades dos reads até este comprimento ao trimar ou mascarar por k-mer
--hdistinteger1Distância máxima de Hamming para k-mers de referência (apenas substituições)
--tpestringtAo trimar pelo lado direito do k-mer, trimar ambos os reads para o comprimento mínimo de qualquer um (opções: f, t)
--tbostringtTrimar adaptadores com base em onde os reads emparelhados se sobrepõem (opções: f, t)
--qtrimstringrlTrimar extremidades dos reads para remover bases com qualidade abaixo de trimq (opções: rl, f, r, l, w)
--trimqinteger6Regiões com qualidade média ABAIXO deste valor serão trimadas se qtrim estiver definido como algo diferente de f
--maqinteger10Reads com qualidade média (após a trimagem) abaixo deste valor serão descartados
--minlengthinteger35Reads mais curtos que este valor após a trimagem serão descartados
--ftminteger5Se positivo, trimar o comprimento pelo lado direito para ser igual a zero, módulo deste número
--tossjunkstringtDescartar reads com caracteres inválidos como bases (opções: f, t)
--ainstringfAo detectar nomes de pares, permitir nomes idênticos (opções: f, t)
--qoutstring33Offset PHRED a ser usado para FASTQs de saída (opções: 33, 64)
--maxcorinteger1Número máximo de correções em uma janela de 20bp
--sampleseedinteger42Definir um número positivo para usar como semente do gerador de números aleatórios para amostragem
--ont_minlengthinteger1000Reads ONT menores que este valor serão descartados
--ont_minqualinteger0Filtro mínimo de qualidade média de reads ONT
--porechop_optsstringOpções extras do Porechop entre aspas
--nanoplot_optsstringOpções extras do NanoPlot entre aspas
--bbduk_optsstringOpções extras do BBDuk entre aspas
--fastp_optsstringOpções extras do fastp entre aspas

Parâmetros de Download do Bakta

ParâmetroTipoPadrãoDescrição
--bakta_dbstringTarball ou caminho para o banco de dados do Bakta
--bakta_db_typestringfullQual BD do Bakta baixar: 'full' (~30GB) ou 'light' (~2GB) (opções: full, light)
--bakta_save_as_tarballbooleanfalseSalvar o banco de dados do Bakta como tarball
--download_baktabooleanfalseBaixar o banco de dados do Bakta para o caminho especificado em --bakta_db

Parâmetros do Bakta

ParâmetroTipoPadrãoDescrição
--bakta_proteinsstringArquivo FASTA de proteínas confiáveis para anotar primeiro
--bakta_prodigal_tfstringArquivo de treinamento a ser usado para o Prodigal
--bakta_repliconsstringTabela de informações de replicons (tsv/csv)
--bakta_min_contig_lengthinteger1Tamanho mínimo de contig para anotar
--bakta_keep_contig_headersbooleanfalseManter os cabeçalhos originais dos contigs
--bakta_compliantbooleanfalseForçar conformidade com Genbank/ENA/DDJB
--bakta_skip_trnabooleanfalsePular detecção e anotação de tRNA
--bakta_skip_tmrnabooleanfalsePular detecção e anotação de tmRNA
--bakta_skip_rrnabooleanfalsePular detecção e anotação de rRNA
--bakta_skip_ncrnabooleanfalsePular detecção e anotação de ncRNA
--bakta_skip_ncrna_regionbooleanfalsePular detecção e anotação de regiões de ncRNA
--bakta_skip_crisprbooleanfalsePular detecção e anotação de arrays CRISPR
--bakta_skip_cdsbooleanfalsePular detecção e anotação de CDS
--bakta_skip_sorfbooleanfalsePular detecção e anotação de sORF
--bakta_skip_gapbooleanfalsePular detecção e anotação de gaps
--bakta_skip_oribooleanfalsePular detecção e anotação de oriC/oriT
--bakta_optsstringOpções extras do Bakta entre aspas. Exemplo: '--gram +'

Parâmetros do Prokka

ParâmetroTipoPadrãoDescrição
--prokka_proteinsstring${projectDir}/data/proteins.faaArquivo FASTA de proteínas confiáveis para anotar primeiro
--prokka_prodigal_tfstringArquivo de treinamento a ser usado para o Prodigal
--prokka_compliantbooleanfalseForçar conformidade com Genbank/ENA/DDJB
--prokka_centrestringBactopiaID do centro de sequenciamento
--prokka_coverageinteger80Cobertura mínima na proteína de consulta
--prokka_evaluestring1e-09Corte do e-value de similaridade
--prokka_optsstringOpções extras do Prokka entre aspas
--prokka_debugbooleanfalseAtivar modo de depuração para o Prokka

Parâmetros do mashdist

ParâmetroTipoPadrãoDescrição
--mash_sketchstringA sequência de referência como um Mash Sketch (arquivo .msh)
--mash_seedinteger42Semente a fornecer à função de hash
--mash_tablebooleanfalseSaída em formato de tabela (campos ficarão em branco se não atingirem o limiar do p-value)
--mash_minteger1Cópias mínimas de cada k-mer necessárias para passar o filtro de ruído para reads
--mash_wnumber0.01Limiar de probabilidade para avisar sobre tamanho de k-mer baixo
--mash_max_pnumber1.0P-value máximo a reportar
--mash_max_distnumber1.0Distância máxima a reportar
--merlin_distnumber0.1Distância máxima a reportar ao usar o Merlin
--full_merlinbooleanfalseExecutar o Merlin completo e todas as ferramentas específicas por espécie, independentemente da distância Mash
--mash_use_fastqsbooleanfalseConsultar usando FASTQs em vez das montagens

Parâmetros do ClermonTyping

ParâmetroTipoPadrãoDescrição
--clermontyping_thresholdinteger0Não usar contigs abaixo deste tamanho

Parâmetros do ECTyper

ParâmetroTipoPadrãoDescrição
--ectyper_opidinteger90Porcentagem de identidade exigida para uma correspondência de alelo do antígeno O
--ectyper_opcovinteger90Porcentagem mínima de cobertura exigida para uma correspondência de alelo do antígeno O
--ectyper_hpidinteger95Porcentagem de identidade exigida para uma correspondência de alelo do antígeno H
--ectyper_hpcovinteger50Porcentagem mínima de cobertura exigida para uma correspondência de alelo do antígeno H
--ectyper_verifybooleanfalseAtivar verificação de espécie de E. coli
--ectyper_print_allelesbooleanfalseImprime as sequências dos alelos como coluna final, se ativado

Parâmetros do emmtyper

ParâmetroTipoPadrãoDescrição
--emmtyper_wfstringblastFluxo de trabalho para o emmtyper usar (opções: blast, pcr)
--emmtyper_blastdbstringCaminho para um banco de dados EMM BLAST personalizado
--emmtyper_cluster_distanceinteger500Distância entre cluster de correspondências para considerar como clusters diferentes
--emmtyper_percidinteger95Porcentagem mínima de identidade da sequência
--emmtyper_culling_limitinteger5Total de hits a retornar em uma posição
--emmtyper_mismatchinteger5Limiar para número de incompatibilidades permitidas no hit BLAST
--emmtyper_align_diffinteger5Limiar para diferença entre o comprimento do alinhamento e o comprimento do sujeito no BLAST
--emmtyper_gapinteger2Limiar de gap permitido no hit BLAST
--emmtyper_min_perfectinteger15Tamanho mínimo de correspondência perfeita na extremidade 3' do primer
--emmtyper_min_goodinteger15Tamanho mínimo onde deve haver 2 correspondências para cada incompatibilidade
--emmtyper_max_sizeinteger2000Tamanho máximo do produto de PCR

Parâmetros do hicap

ParâmetroTipoPadrãoDescrição
--hicap_database_dirstringDiretório contendo o banco de dados de loci
--hicap_model_fpstringCaminho para o modelo do Prodigal
--hicap_full_sequencebooleanfalseEscrever a sequência de entrada completa no arquivo genbank em vez de apenas a região ao redor e incluindo o locus
--hicap_debugbooleanfalsehicap imprimirá mensagens de depuração
--hicap_gene_coveragenumber0.8Porcentagem mínima de cobertura para considerar um gene único completo
--hicap_gene_identitynumber0.7Porcentagem mínima de identidade para considerar um gene único completo
--hicap_broken_gene_lengthinteger60Comprimento mínimo para considerar um gene quebrado
--hicap_broken_gene_identitynumber0.8Porcentagem mínima de identidade para considerar um gene quebrado

Parâmetros do Mykrobe

ParâmetroTipoPadrãoDescrição
--mykrobe_speciesstringPainel de espécies a usar (opções: sonnei, staph, tb, typhi)
--mykrobe_kmerinteger21Comprimento do k-mer
--mykrobe_min_depthinteger1Profundidade mínima
--mykrobe_modelstringkmer_countModelo de genótipo usado (opções: kmer_count, median_depth)
--mykrobe_report_all_callsbooleanfalseReportar todas as chamadas
--mykrobe_optsstringOpções extras do Mykrobe entre aspas

Parâmetros do GenoTyphi

ParâmetroTipoPadrãoDescrição
--genotyphi_kmerinteger21Comprimento do k-mer
--genotyphi_min_depthinteger1Profundidade mínima
--genotyphi_modelstringkmer_countModelo de genótipo usado (opções: kmer_count, median_depth)
--genotyphi_report_all_callsbooleanfalseReportar todas as chamadas
--genotyphi_mykrobe_optsstringOpções extras do Mykrobe entre aspas

Parâmetros do Kleborate

ParâmetroTipoPadrãoDescrição
--kleborate_presetstringkpscMódulo predefinido a usar para o Kleborate (opções: kpsc, kosc, escherichia)
--kleborate_optsstringOpções extras entre aspas para o Kleborate

Parâmetros do legsta

ParâmetroTipoPadrãoDescrição
--legsta_noheaderbooleanfalseNão imprimir a linha de cabeçalho

Parâmetros do LisSero

ParâmetroTipoPadrãoDescrição
--lissero_min_idnumber95.0Porcentagem mínima de identidade para aceitar uma correspondência
--lissero_min_covnumber95.0Cobertura mínima do gene para aceitar uma correspondência

Parâmetros do ngmaster

ParâmetroTipoPadrãoDescrição
--ngmaster_csvbooleanfalseGerar saída no formato separado por vírgula (CSV) em vez de separado por tabulação

Parâmetros do pasty

ParâmetroTipoPadrãoDescrição
--pasty_min_pidentinteger95Porcentagem mínima de identidade para contar um hit
--pasty_min_coverageinteger95Porcentagem mínima de cobertura para contar um hit

Parâmetros do pbptyper

ParâmetroTipoPadrãoDescrição
--pbptyper_min_pidentinteger95Porcentagem mínima de identidade para contar um hit
--pbptyper_min_coverageinteger95Porcentagem mínima de cobertura para contar um hit

Parâmetros do SeqSero2

ParâmetroTipoPadrãoDescrição
--seqsero2_run_modestringkFluxo de trabalho a executar: modo 'a' de alelo ou modo 'k' de k-mer (opções: a, k)
--seqsero2_input_typestringassemblyFormato de entrada a analisar: 'assembly' ou 'fastq' (opções: assembly, fastq)
--seqsero2_bwa_modestringmemAlgoritmos para mapeamento bwa no modo de alelo (opções: mem, sam)

Parâmetros do SeroBA

ParâmetroTipoPadrãoDescrição
--seroba_nocleanbooleanfalseNão limpar arquivos intermediários
--seroba_coverageinteger20Limiar para cobertura de k-mer da sequência de referência

Parâmetros do SISTR

ParâmetroTipoPadrãoDescrição
--sistr_full_cgmlstbooleanfalseUsar o conjunto completo de alelos cgMLST, que pode incluir alelos altamente similares

Parâmetros do AgrVATE

ParâmetroTipoPadrãoDescrição
--agrvate_typing_onlybooleanfalseApenas tipagem agr. Pula a extração do operon agr e a detecção de frameshift

Parâmetros do spaTyper

ParâmetroTipoPadrãoDescrição
--spatyper_repeatsstringLista de repetições spa
--spatyper_repeat_orderstringLista de tipos spa e ordem das repetições
--spatyper_do_enrichbooleanfalseRealizar enriquecimento de produto de PCR

Parâmetros do sccmec

ParâmetroTipoPadrãoDescrição
--sccmec_min_targets_pidentinteger90Porcentagem mínima de identidade para contar um hit de alvo
--sccmec_min_targets_coverageinteger80Porcentagem mínima de cobertura para contar um hit de alvo
--sccmec_min_regions_pidentinteger85Porcentagem mínima de identidade para contar um hit de região
--sccmec_min_regions_coverageinteger93Porcentagem mínima de cobertura para contar um hit de região

Parâmetros do STECFinder

ParâmetroTipoPadrãoDescrição
--stecfinder_use_readsbooleanfalseReads paired-end do Illumina serão usados em vez de montagens
--stecfinder_hitsbooleanfalseMostrar resultados detalhados de busca de genes
--stecfinder_cutoffnumber10.0Cobertura mínima de reads para o gene ser chamado
--stecfinder_lengthnumber50.0Porcentagem do comprimento do gene necessária para chamada positiva
--stecfinder_ipah_lengthnumber10.0Porcentagem do comprimento do gene ipaH necessária para chamada positiva
--stecfinder_ipah_depthnumber1.0Profundidade mínima para chamada positiva do gene ipaH (requer --stecfinder_use_reads)
--stecfinder_stx_lengthnumber10.0Porcentagem do comprimento do gene stx necessária para chamada positiva
--stecfinder_stx_depthnumber1.0Profundidade mínima para chamada positiva do gene stx (requer --stecfinder_use_reads)
--stecfinder_o_lengthnumber60.0Porcentagem do comprimento do gene wz_ necessária para chamada positiva
--stecfinder_o_depthnumber1.0Profundidade mínima para chamada positiva do gene qz_ (requer --stecfinder_use_reads)
--stecfinder_h_lengthnumber60.0Porcentagem do comprimento do gene fliC necessária para chamada positiva
--stecfinder_h_depthnumber1.0Profundidade mínima para chamada positiva do gene fliC (requer --stecfinder_use_reads)

Parâmetros do TB-Profiler Profile

ParâmetroTipoPadrãoDescrição
--tbprofiler_call_whole_genomebooleanfalseChamar o genoma completo
--tbprofiler_mapperstringbwaFerramenta de mapeamento a usar. Se estiver usando dados de nanopore, o padrão será minimap2 (opções: bwa, minimap2, bowtie2, bwa-mem2)
--tbprofiler_callerstringfreebayesFerramenta de chamada de variantes a usar (opções: bcftools, gatk, freebayes)
--tbprofiler_calling_paramsstringOpções extras do chamador de variantes entre aspas
--tbprofiler_suspectbooleanfalseUsar o conjunto de ferramentas suspect para adicionar predições de ML
--tbprofiler_no_flagstatbooleanfalseNão coletar flagstats
--tbprofiler_no_dellybooleanfalseNão executar delly
--tbprofiler_optsstringOpções extras entre aspas para o TBProfiler

Parâmetros do TB-Profiler Collate

ParâmetroTipoPadrãoDescrição
--tbprofiler_itolbooleanfalseGerar arquivos de configuração do iTOL
--tbprofiler_fullbooleanfalseGerar mutações no arquivo de resultado principal
--tbprofiler_all_variantsbooleanfalseGerar todas as variantes na matriz de variantes
--tbprofiler_mark_missingbooleanfalseUm asterisco será usado para marcar predições afetadas por dados ausentes em uma posição de resistência a drogas
Parâmetros de Dataset

Define onde o pipeline deve encontrar os dados de entrada e salvar os dados de saída.

ParâmetroTipoPadrãoDescrição
--speciesstringNome da espécie para usar o conjunto de dados específico da espécie
--ask_merlinbooleanPedir ao Merlin para executar ferramentas Bactopia específicas por espécie com base nas distâncias Mash
--coverageinteger100Reduzir amostras a uma cobertura específica, requer o tamanho do genoma
--genome_sizeinteger0Tamanho esperado do genoma (bp) para todas as amostras, necessário para correção de erros e subamostragem de reads
--use_baktabooleanUsar Bakta para anotação, em vez de Prokka
Parâmetros Opcionais

Estes parâmetros opcionais podem ser úteis em determinadas situações.

ParâmetroTipoPadrãoDescrição
--outdirstringbactopiaDiretório base para gravar os resultados
--skip_compressionbooleanfalseOs arquivos de saída não serão comprimidos
--datasetsstringO caminho para armazenar em cache os conjuntos de dados
--keep_all_filesbooleanfalseMantém todos os arquivos de análise criados
Parâmetros de Requisição Máxima de Jobs

Define o limite máximo de recursos solicitados para qualquer job individual.

ParâmetroTipoPadrãoDescrição
--max_retryinteger3Número máximo de tentativas de um processo antes de permitir que ele falhe
--max_cpusinteger4Número máximo de CPUs que podem ser solicitadas para qualquer job individual
--max_memorystring128.GBQuantidade máxima de memória que pode ser solicitada para qualquer job individual
--max_timestring240.hQuantidade máxima de tempo que pode ser solicitada para qualquer job individual
--max_downloadsinteger3Número máximo de amostras a baixar ao mesmo tempo
Parâmetros de Configuração do Nextflow

Parâmetros para ajustar a configuração do Nextflow.

ParâmetroTipoPadrãoDescrição
--nfconfigstringUm arquivo de configuração compatível com Nextflow para perfis personalizados, carregado por último e que substituirá variáveis existentes se definido
--publish_dir_modestringcopyMétodo usado para salvar os resultados do pipeline no diretório de saída (opções: symlink, rellink, link, copy, copyNoFollow, move)
--infodirstring${params.outdir}/pipeline_infoDiretório para manter logs e relatórios do Nextflow do pipeline
--forcebooleanfalseO Nextflow sobrescreverá arquivos de saída existentes
--cleanup_workdirbooleanfalseApós a execução bem-sucedida do Bactopia, o diretório work será excluído
Opções de configuração institucional

Parâmetros usados para descrever perfis de configuração centralizados. Estes não devem ser editados.

ParâmetroTipoPadrãoDescrição
--custom_config_versionstringmasterID de commit Git para configurações institucionais
--custom_config_basestringhttps://raw.githubusercontent.com/nf-core/configs/masterDiretório base para configurações institucionais
--config_profile_namestringNome da configuração institucional
--config_profile_descriptionstringDescrição da configuração institucional
--config_profile_contactstringInformações de contato da configuração institucional
--config_profile_urlstringURL da configuração institucional
Parâmetros de Perfil do Nextflow

Parâmetros para ajustar a configuração do Nextflow.

ParâmetroTipoPadrãoDescrição
--condadirstringDiretório que o Nextflow deve usar para ambientes Conda
--registrystringquay.ioRegistro para baixar contêineres Docker
--datasets_cachestring<HOME>/.bactopia/datasetsDiretório onde os conjuntos de dados baixados devem ser armazenados
--singularity_cachestringDiretório onde imagens Singularity remotas são armazenadas
--singularity_pull_docker_containerbooleanEm vez de baixar imagens Singularity diretamente, forçar o fluxo de trabalho a baixar e converter contêineres Docker
--force_rebuildbooleanfalseForçar a sobrescrita de ambientes pré-compilados existentes
--queuestringgeneral,high-memoryNome(s) da(s) fila(s) separado(s) por vírgula a serem usados por um agendador de jobs (ex: AWS Batch ou SLURM)
--cluster_optsstringOpções adicionais a passar ao executor (ex: SLURM: '--account=my_acct_name')
--container_optsstringOpções adicionais a passar ao Apptainer, Docker ou Singularity (ex: Singularity: '-D pwd')
--disable_scratchbooleanfalseTodos os arquivos intermediários criados nos nós de trabalho serão transferidos para o nó principal
Parâmetros Úteis

Parâmetros raramente usados que podem ser úteis.

ParâmetroTipoPadrãoDescrição
--monochrome_logsbooleanNão usar saídas de log coloridas
--nfdirbooleanImprimir o diretório para o qual o Nextflow baixou o Bactopia
--sleep_timeinteger5O tempo (em segundos) que o Nextflow aguardará após configurar os conjuntos de dados antes da execução
--validate_paramsbooleantrueBooleano para validar parâmetros em relação ao esquema em tempo de execução
--helpbooleanExibir texto de ajuda
--wfstringbactopiaEspecificar qual fluxo de trabalho ou Bactopia Tool executar
--list_wfsbooleanListar os fluxos de trabalho e Bactopia Tools disponíveis para usar com '--wf'
--show_hidden_paramsbooleanMostrar todos os parâmetros ao usar --help
--help_allbooleanUm alias para --help --show_hidden_params
--versionbooleanExibir texto de versão

Composição

Este fluxo de trabalho usa os seguintes subworkflows:

  • amrfinderplus - Encontrar genes de resistência antimicrobiana e mutações pontuais.
  • bactopia_assembler - Montar genomas bacterianos usando seleção automatizada de montador.
  • bactopia_datasets - Baixar e fornecer conjuntos de dados pré-compilados necessários pelo Bactopia.
  • bactopia_gather - Buscar, validar, reunir e padronizar amostras de entrada.
  • bactopia_qc - Realizar controle de qualidade abrangente em reads de sequenciamento.
  • bactopia_sketcher - Criar esboços genômicos e realizar classificação taxonômica rápida.
  • bakta - Anotação rápida de genomas bacterianos.
  • merlin - MinER assisted species-specific bactopia tool seLectIoN.
  • mlst - Determinar tipos de sequência multilocus (MLST) a partir de montagens bacterianas.
  • prokka - Anotar genomas bacterianos com informações funcionais.

Fonte

Ver fonte no GitHub