Pular para o conteúdo principal

staphopia

Tags: staphylococcus-aureus assembly annotation amr mlst spa-typing agr-typing sccmec named-workflow

Pipeline de análise abrangente para isolados de Staphylococcus aureus.

Este fluxo de trabalho realiza análise bacteriana completa, incluindo controle de qualidade, montagem, anotação, detecção de resistência antimicrobiana, tipagem MLST, e análise específica para Staphylococcus usando Spatyper, AgrVATE, SCCmecFinder, e StaphSCAN. Ele processa reads de sequenciamento brutos e produz uma caracterização genômica abrangente para isolados de S. aureus.

Uso

CLI do staphopia:

staphopia \
--input samples.csv \
--outdir results/

Nextflow:

nextflow run bactopia/bactopia/workflows/staphopia/main.nf \
--input samples.csv \
--outdir results/

Saídas

Arquivos de Saída Esperados

<BACTOPIA_DIR>
├── <SAMPLE_NAME>
│ ├── main
│ │ ├── annotator
│ │ │ └── prokka
│ │ │ ├── <SAMPLE_NAME>-blastdb.tar.gz
│ │ │ ├── <SAMPLE_NAME>.faa.gz
│ │ │ ├── <SAMPLE_NAME>.ffn.gz
│ │ │ ├── <SAMPLE_NAME>.fna.gz
│ │ │ ├── <SAMPLE_NAME>.fsa.gz
│ │ │ ├── <SAMPLE_NAME>.gbk.gz
│ │ │ ├── <SAMPLE_NAME>.gff.gz
│ │ │ ├── <SAMPLE_NAME>.sqn.gz
│ │ │ ├── <SAMPLE_NAME>.tbl.gz
│ │ │ ├── <SAMPLE_NAME>.tsv
│ │ │ ├── <SAMPLE_NAME>.txt
│ │ │ └── logs
│ │ │ ├── <SAMPLE_NAME>.err
│ │ │ ├── <SAMPLE_NAME>.log
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── assembler
│ │ │ ├── <SAMPLE_NAME>.fna.gz
│ │ │ ├── <SAMPLE_NAME>.tsv
│ │ │ ├── logs
│ │ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ │ ├── shovill.log
│ │ │ │ └── versions.yml
│ │ │ └── supplemental
│ │ │ ├── flash.hist
│ │ │ ├── flash.histogram
│ │ │ ├── illumina.txt
│ │ │ └── shovill.corrections
│ │ ├── gather
│ │ │ ├── <SAMPLE_NAME>-meta.tsv
│ │ │ └── logs
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── qc
│ │ │ ├── <SAMPLE_NAME>_R1.fastq.gz
│ │ │ ├── <SAMPLE_NAME>_R2.fastq.gz
│ │ │ ├── logs
│ │ │ │ ├── <SAMPLE_NAME>-fastp.log
│ │ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ │ └── versions.yml
│ │ │ └── supplemental
│ │ │ ├── <SAMPLE_NAME>.fastp.html
│ │ │ ├── <SAMPLE_NAME>.fastp.json
│ │ │ ├── <SAMPLE_NAME>_R1-final.json
│ │ │ ├── <SAMPLE_NAME>_R1-final_fastqc.html
│ │ │ ├── <SAMPLE_NAME>_R1-final_fastqc.zip
│ │ │ ├── <SAMPLE_NAME>_R1-original.json
│ │ │ ├── <SAMPLE_NAME>_R1-original_fastqc.html
│ │ │ ├── <SAMPLE_NAME>_R1-original_fastqc.zip
│ │ │ ├── <SAMPLE_NAME>_R2-final.json
│ │ │ ├── <SAMPLE_NAME>_R2-final_fastqc.html
│ │ │ ├── <SAMPLE_NAME>_R2-final_fastqc.zip
│ │ │ ├── <SAMPLE_NAME>_R2-original.json
│ │ │ ├── <SAMPLE_NAME>_R2-original_fastqc.html
│ │ │ └── <SAMPLE_NAME>_R2-original_fastqc.zip
│ │ └── sketcher
│ │ ├── <SAMPLE_NAME>-k21.msh
│ │ ├── <SAMPLE_NAME>-k31.msh
│ │ ├── <SAMPLE_NAME>-mash-refseq88-k21.txt
│ │ ├── <SAMPLE_NAME>-sourmash-gtdb-rs207-k31.txt
│ │ ├── <SAMPLE_NAME>.sig
│ │ └── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ └── tools
│ ├── agrvate
│ │ ├── <SAMPLE_NAME>.tsv
│ │ ├── logs
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ └── supplemental
│ │ ├── <SAMPLE_NAME>-agr_gp.tab
│ │ ├── <SAMPLE_NAME>-blastn_log.txt
│ │ ├── <SAMPLE_NAME>-hmm-log.txt
│ │ ├── <SAMPLE_NAME>-hmm.tab
│ │ └── <SAMPLE_NAME>.fna-error-report.tab
│ ├── amrfinderplus
│ │ ├── <SAMPLE_NAME>.tsv
│ │ └── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ ├── mlst
│ │ ├── <SAMPLE_NAME>.tsv
│ │ └── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ ├── sccmec
│ │ ├── <SAMPLE_NAME>.regions.blastn.tsv
│ │ ├── <SAMPLE_NAME>.regions.details.tsv
│ │ ├── <SAMPLE_NAME>.targets.blastn.tsv
│ │ ├── <SAMPLE_NAME>.targets.details.tsv
│ │ ├── <SAMPLE_NAME>.tsv
│ │ └── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ ├── spatyper
│ │ ├── <SAMPLE_NAME>.tsv
│ │ └── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ └── staphscan
│ ├── <SAMPLE_NAME>.tsv
│ └── logs
│ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ └── versions.yml
└── bactopia-runs
└── staphopia-<TIMESTAMP>
├── merged-results
│ ├── agrvate.tsv
│ ├── amrfinderplus.tsv
│ ├── assembly-scan.tsv
│ ├── logs
│ │ ├── agrvate-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── amrfinderplus-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── assembly-scan-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── meta-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── mlst-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── sccmec-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ ├── spatyper-concat
│ │ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ │ └── versions.yml
│ │ └── staphscan-concat
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ ├── meta.tsv
│ ├── mlst.tsv
│ ├── sccmec.tsv
│ ├── spatyper.tsv
│ └── staphscan.tsv
└── nf-reports
├── staphopia-dag.dot
├── staphopia-report.html
└── staphopia-timeline.html

Controle de Qualidade

ArquivoDescrição
supplemental/*_fastqc.*Relatórios de controle de qualidade do FastQC para reads brutos e limpos
supplemental/*-NanoPlot.*Relatórios NanoPlot para reads Nanopore
supplemental/*.fastp.*Relatórios de qualidade do Fastp (quando aplicável)

Montagem

ArquivoDescrição
*.fnaSequências do genoma montado no formato FASTA
assembly-stats.tsvMétricas de qualidade de montagem por amostra

Anotação

Nota

O formato de saída depende da ferramenta de anotação escolhida (Bakta ou Prokka)

ArquivoDescrição
*.gff.gzAnotação do genoma no formato GFF3 (comprimido)
*.gbk.gzAnotação do genoma no formato GenBank (comprimido)
*.faa.gzSequências de proteínas (comprimido)
*.fna.gzSequências de nucleotídeos da anotação (comprimido)
annotation.tsvTabelas de resumo da anotação

Tipagem

ArquivoDescrição
mlst.tsvResultados do tipo de sequência MLST
agrvate-*Resultados da tipagem do locus Agr
spatyper-*Resultados da tipagem spa
sccmec-*Resultados da tipagem SCCmec (alvos, regiões, detalhes)

Resistência Antimicrobiana

ArquivoDescrição
amrfinderplus.tsvResultados de detecção de genes de resistência antimicrobiana
amrfinderplus.mutation.tsvResultados de mutações pontuais de resistência antimicrobiana

Análise Comparativa

ArquivoDescrição
*-k21.mshArquivos de sketch Mash (k=21)
*-k31.mshArquivos de sketch Mash (k=31)
*-mash-refseq88-*.txtResultados de triagem Mash contra RefSeq
*.sigAssinaturas Sourmash
sourmash-*.txtResultados de classificação Sourmash

Resultados Consolidados

Nota

Resultados agregados no nível de execução de todas as amostras

ArquivoDescrição
merged-assembly-stats.tsvEstatísticas de montagem consolidadas
merged-mlst.tsvResultados MLST consolidados
staphtyper.tsvResumo consolidado da tipagem de Staphylococcus

Trilha de Auditoria

A seguir estão os arquivos que podem ajudar a entender quais parâmetros e versões de programas foram utilizados.

Logs

Cada processo executado terá uma pasta chamada logs. Nessa pasta estão arquivos úteis para consulta caso necessário.

ExtensãoDescrição
.beginUm arquivo vazio usado para indicar que o processo foi iniciado
.errContém as saídas STDERR do processo
.logContém as saídas STDERR e STDOUT do processo
.outContém as saídas STDOUT do processo
.runO script que o Nextflow usa para preparar/remover arquivos e enfileirar processos com base no perfil definido
.shO script executado pelo bash para o processo
.traceO relatório de rastreamento do Nextflow para o processo
versions.ymlUm arquivo no formato YAML com as versões dos programas

Relatórios Nextflow

Esses relatórios do Nextflow fornecem um ótimo resumo da sua execução. Eles podem ser usados para otimizar o uso de recursos e estimar custos esperados ao utilizar plataformas em nuvem.

Nome do arquivoDescrição
staphopia-dag.dotA visualização DAG do Nextflow
staphopia-report.htmlO Relatório de Execução do Nextflow
staphopia-timeline.htmlO Relatório de Linha do Tempo do Nextflow
staphopia-trace.txtO relatório de Rastreamento do Nextflow

Parâmetros

Parâmetros Obrigatórios

Os parâmetros a seguir são utilizados para fornecer amostras locais ou remotas a serem processadas pelo Bactopia.

ParâmetroTipoPadrãoDescrição
--samplesstringUm FOFN (via bactopia prepare) com nomes de amostras e caminhos para FASTQ/FASTAs a serem processados
--r1stringPrimeiro conjunto de reads Illumina paired-end comprimidos (gzip) (requer --r2 e --sample)
--r2stringSegundo conjunto de reads Illumina paired-end comprimidos (gzip) (requer --r1 e --sample)
--sestringReads Illumina single-end comprimidos (gzip) (requer --sample)
--ontstringReads Oxford Nanopore comprimidos (gzip) (requer --sample)
--hybridbooleanfalseCriar montagem híbrida usando Unicycler (requer --r1, --r2, --ont e --sample)
--short_polishbooleanfalseCriar montagem híbrida a partir de montagem de long reads com polimento de short reads (requer --r1, --r2, --ont e --sample)
--samplestringNome da amostra a ser usado para as sequências de entrada
--accessionsstringUm arquivo contendo números de acesso de Experimentos ENA/SRA ou montagens NCBI Assembly a serem processados
--accessionstringNome da amostra a ser usado para as sequências de entrada
--assemblystringUm genoma montado no formato FASTA comprimido (requer --sample)
--check_samplesbooleanfalseValidar o FOFN de entrada fornecido por --samples

Parâmetros do AMRFinder+

ParâmetroTipoPadrãoDescrição
--amrfinderplus_ident_minnumber-1Proporção mínima de aminoácidos idênticos no alinhamento para um hit (0..1)
--amrfinderplus_coverage_minnumber0.5Cobertura mínima da proteína de referência (0..1)
--amrfinderplus_organismstringGrupo taxonômico para executar triagens adicionais
--amrfinderplus_translation_tableinteger11Código genético NCBI para BLAST traduzido
--amrfinderplus_noplusbooleanfalseDesativar a execução do AMRFinder+ com a opção --plus
--amrfinderplus_report_commonbooleanfalseReportar proteínas comuns a um grupo taxonômico
--amrfinderplus_report_all_equalbooleanfalseReportar todos os hits BLAST e HMM com pontuação igual
--amrfinderplus_optsstringOpções extras do AMRFinder+ entre aspas
--amrfinderplus_dbstringUm banco de dados personalizado do AMRFinder+ a ser usado, como tarball ou pasta

Parâmetros do csvtk concat

ParâmetroTipoPadrãoDescrição
--csvtk_concat_optsstringOpções extras do csvtk concat entre aspas

Parâmetros do Assembler

ParâmetroTipoPadrãoDescrição
--shovill_assemblerstringskesaAssembler a ser usado pelo Shovill (opções: skesa, megahit, spades, velvet)
--dragonflye_assemblerstringflyeAssembler a ser usado pelo Dragonflye (opções: flye, miniasm, raven)
--use_unicyclerbooleanUsar Unicycler para montagem paired-end
--min_contig_leninteger500Comprimento mínimo de contig <0=AUTO>
--min_contig_covinteger2Cobertura mínima de contig <0=AUTO>
--contig_namefmtstringFormato dos IDs FASTA de contig no estilo 'printf'
--shovill_optsstringOpções extras do assembler entre aspas para o Shovill
--shovill_kmersstringK-mers a serem usados <blank=AUTO>
--dragonflye_optsstringOpções extras do assembler entre aspas para o Dragonflye
--trimbooleanAtivar trimagem de adaptadores
--no_stitchbooleanDesativar junção de reads para paired-end
--no_corrbooleanDesativar correção pós-montagem
--unicycler_modestringnormalModo de bridging usado pelo Unicycler (opções: conservative, normal, bold)
--min_component_sizeinteger1000Extremidades mortas do grafo menores que este tamanho (bp) serão removidas do grafo final
--min_dead_end_sizeinteger1000Extremidades mortas do grafo menores que este tamanho (bp) serão removidas do grafo final
--nanohqbooleanfalsePara o Flye, usar '--nano-hq' em vez de --nano-raw
--medaka_modelstringO modelo a ser usado para o polimento com Medaka
--medaka_roundsinteger0O número de rodadas de polimento com Medaka a serem realizadas
--racon_roundsinteger1O número de rodadas de polimento com Racon a serem realizadas
--no_polishbooleanPular a etapa de polimento da montagem
--no_miniasmbooleanPular a bridging com miniasm+Racon
--no_rotatebooleanNão rotacionar replicons concluídos para iniciar em um gene padrão
--reassemblebooleanfalseSe os reads foram simulados, eles serão usados para criar uma nova montagem
--polypolish_roundsinteger1Número de rodadas de polimento com Polypolish para polimento com short reads
--pilon_roundsinteger0Número de rodadas de polimento com Pilon para polimento com short reads

Parâmetros do Gather

ParâmetroTipoPadrãoDescrição
--skip_fastq_checkbooleanPular as verificações de requisitos mínimos para FASTQs de entrada
--min_basepairsinteger2241820A quantidade mínima de pares de bases necessária para continuar as análises downstream
--min_readsinteger7472A quantidade mínima de reads necessária para continuar as análises downstream
--min_coverageinteger10A cobertura mínima necessária para continuar as análises downstream
--min_proportionnumber0.5A proporção mínima de pares de bases para reads paired-end para continuar as análises downstream
--min_genome_sizeinteger100000O tamanho mínimo estimado do genoma permitido para a sequência de entrada continuar as análises downstream
--max_genome_sizeinteger18040666O tamanho máximo estimado do genoma permitido para a sequência de entrada continuar as análises downstream
--attemptsinteger3Número máximo de tentativas de download
--use_enabooleanBaixar FASTQs do ENA
--no_cachebooleanPular o cache do arquivo de resumo de montagem do ncbi-genome-download

Parâmetros do Sketcher

ParâmetroTipoPadrãoDescrição
--sketch_sizeinteger10000Tamanho do sketch. Cada sketch terá no máximo este número de min-hashes não redundantes
--sourmash_scaleinteger10000Escolher o número de hashes como 1 em FRAÇÃO dos k-mers de entrada
--no_winner_take_allbooleanDesativar a estratégia winner-takes-all para estimativas de identidade
--screen_inumber0.8Identidade mínima a ser reportada

Parâmetros do MLST

ParâmetroTipoPadrãoDescrição
--mlst_schemestringNão detectar automaticamente, forçar este esquema em todas as entradas
--mlst_minidinteger95Percentual mínimo de identidade de DNA do alelo completo para considerar 'similar'
--mlst_mincovinteger10Percentual mínimo de cobertura de DNA para reportar alelo parcial
--mlst_minscoreinteger50Pontuação mínima de 100 para corresponder a um esquema
--mlst_nopathbooleanfalseRemover caminhos de arquivo da coluna FILE
--mlst_dbstringUm banco de dados MLST personalizado a ser usado, como tarball ou diretório

Parâmetros de QC

ParâmetroTipoPadrãoDescrição
--use_bbmapbooleanReads Illumina serão processados com controle de qualidade usando BBMap
--use_porechopbooleanfalseUsar Porechop para remover adaptadores de reads ONT
--skip_qcbooleanA etapa de QC será pulada e assumir-se-á que as sequências de entrada já foram submetidas ao QC
--skip_qc_plotsbooleanA criação de gráficos de QC pelo FastQC ou Nanoplot será pulada
--skip_error_correctionbooleanA correção de erros de reads pelo FLASH será pulada
--adaptersstringUm arquivo FASTA contendo adaptadores a serem removidos
--adapter_kinteger23Comprimento de k-mer usado para encontrar adaptadores
--phixstringGenoma de referência phiX174 a ser removido
--phix_kinteger31Comprimento de k-mer usado para encontrar phiX174
--ktrimstringrTrimar reads para remover bases correspondentes a k-mers de referência (opções: f, r, l)
--minkinteger11Procurar k-mers mais curtos nas extremidades das reads até este comprimento ao trimar ou mascarar por k
--hdistinteger1Distância máxima de Hamming para k-mers de referência (apenas substituições)
--tpestringtAo trimar pela direita por k-mer, trimar ambas as reads para o comprimento mínimo de qualquer uma (opções: f, t)
--tbostringtTrimar adaptadores com base em onde as reads pareadas se sobrepõem (opções: f, t)
--qtrimstringrlTrimar extremidades das reads para remover bases com qualidade abaixo de trimq (opções: rl, f, r, l, w)
--trimqinteger6Regiões com qualidade média ABAIXO deste valor serão trimadas se qtrim for definido como algo diferente de f
--maqinteger10Reads com qualidade média (após trimagem) abaixo deste valor serão descartadas
--minlengthinteger35Reads mais curtas que este valor após a trimagem serão descartadas
--ftminteger5Se positivo, trimar pela direita para que o comprimento seja igual a zero módulo este número
--tossjunkstringtDescartar reads com caracteres inválidos como bases (opções: f, t)
--ainstringfAo detectar nomes de pares, permitir nomes idênticos (opções: f, t)
--qoutstring33Offset PHRED a ser usado para FASTQs de saída (opções: 33, 64)
--maxcorinteger1Número máximo de correções dentro de uma janela de 20bp
--sampleseedinteger42Definir como número positivo para usar como semente do gerador de números aleatórios para amostragem
--ont_minlengthinteger1000Reads ONT mais curtas que este valor serão descartadas
--ont_minqualinteger0Filtro de qualidade média mínima de reads ONT
--porechop_optsstringOpções extras do Porechop entre aspas
--nanoplot_optsstringOpções extras do NanoPlot entre aspas
--bbduk_optsstringOpções extras do BBDuk entre aspas
--fastp_optsstringOpções extras do fastp entre aspas

Parâmetros de Download do Bakta

ParâmetroTipoPadrãoDescrição
--bakta_dbstringTarball ou caminho para o banco de dados Bakta
--bakta_db_typestringfullQual banco de dados Bakta baixar: 'full' (~30GB) ou 'light' (~2GB) (opções: full, light)
--bakta_save_as_tarballbooleanfalseSalvar o banco de dados Bakta como tarball
--download_baktabooleanfalseBaixar o banco de dados Bakta para o caminho indicado por --bakta_db

Parâmetros do Bakta

ParâmetroTipoPadrãoDescrição
--bakta_proteinsstringArquivo FASTA de proteínas confiáveis para anotar primeiro
--bakta_prodigal_tfstringArquivo de treinamento a ser usado pelo Prodigal
--bakta_repliconsstringTabela de informações de replicons (tsv/csv)
--bakta_min_contig_lengthinteger1Tamanho mínimo de contig para anotar
--bakta_keep_contig_headersbooleanfalseManter os cabeçalhos originais dos contigs
--bakta_compliantbooleanfalseForçar conformidade com Genbank/ENA/DDJB
--bakta_skip_trnabooleanfalsePular detecção e anotação de tRNA
--bakta_skip_tmrnabooleanfalsePular detecção e anotação de tmRNA
--bakta_skip_rrnabooleanfalsePular detecção e anotação de rRNA
--bakta_skip_ncrnabooleanfalsePular detecção e anotação de ncRNA
--bakta_skip_ncrna_regionbooleanfalsePular detecção e anotação de regiões de ncRNA
--bakta_skip_crisprbooleanfalsePular detecção e anotação de arrays CRISPR
--bakta_skip_cdsbooleanfalsePular detecção e anotação de CDS
--bakta_skip_sorfbooleanfalsePular detecção e anotação de sORF
--bakta_skip_gapbooleanfalsePular detecção e anotação de gaps
--bakta_skip_oribooleanfalsePular detecção e anotação de oriC/oriT
--bakta_optsstringOpções extras do Bakta entre aspas. Exemplo: '--gram +'

Parâmetros do Prokka

ParâmetroTipoPadrãoDescrição
--prokka_proteinsstring${projectDir}/data/proteins.faaArquivo FASTA de proteínas confiáveis para anotar primeiro
--prokka_prodigal_tfstringArquivo de treinamento a ser usado pelo Prodigal
--prokka_compliantbooleanfalseForçar conformidade com Genbank/ENA/DDJB
--prokka_centrestringBactopiaID do centro de sequenciamento
--prokka_coverageinteger80Cobertura mínima na proteína de consulta
--prokka_evaluestring1e-09Limite de e-value para similaridade
--prokka_optsstringOpções extras do Prokka entre aspas
--prokka_debugbooleanfalseAtivar modo de depuração para o Prokka

Parâmetros do AgrVATE

ParâmetroTipoPadrãoDescrição
--agrvate_typing_onlybooleanfalseApenas tipagem agr. Pula a extração do operon agr e detecção de frameshifts

Parâmetros do spaTyper

ParâmetroTipoPadrãoDescrição
--spatyper_repeatsstringLista de repetições spa
--spatyper_repeat_orderstringLista de tipos spa e ordem das repetições
--spatyper_do_enrichbooleanfalseRealizar enriquecimento do produto de PCR

Parâmetros do sccmec

ParâmetroTipoPadrãoDescrição
--sccmec_min_targets_pidentinteger90Percentual mínimo de identidade para contar um hit de alvo
--sccmec_min_targets_coverageinteger80Percentual mínimo de cobertura para contar um hit de alvo
--sccmec_min_regions_pidentinteger85Percentual mínimo de identidade para contar um hit de região
--sccmec_min_regions_coverageinteger93Percentual mínimo de cobertura para contar um hit de região

Parâmetros do StaphSCAN

ParâmetroTipoPadrãoDescrição
--staphscan_modulesstringLista separada por vírgulas de módulos a serem executados
--staphscan_db_mlststringCaminho ou tarball para banco de dados MLST personalizado
Parâmetros de Dataset

Define onde o pipeline deve encontrar os dados de entrada e salvar os dados de saída.

ParâmetroTipoPadrãoDescrição
--speciesstringNome da espécie para usar o dataset específico da espécie
--ask_merlinbooleanPedir ao Merlin para executar ferramentas Bactopia específicas da espécie com base nas distâncias Mash
--coverageinteger100Reduzir amostras a uma cobertura determinada, requer um tamanho de genoma
--genome_sizeinteger0Tamanho esperado do genoma (bp) para todas as amostras, necessário para correção de erros de reads e subamostragem de reads
--use_baktabooleanUsar Bakta para anotação, em vez de Prokka
Parâmetros Opcionais

Esses parâmetros opcionais podem ser úteis em determinadas situações.

ParâmetroTipoPadrãoDescrição
--outdirstringbactopiaDiretório base para gravar os resultados
--skip_compressionbooleanfalseOs arquivos de saída não serão comprimidos
--datasetsstringO caminho para armazenar em cache os datasets
--keep_all_filesbooleanfalseManter todos os arquivos de análise criados
Parâmetros de Requisição Máxima de Recursos

Define o limite máximo de recursos solicitados para qualquer job individual.

ParâmetroTipoPadrãoDescrição
--max_retryinteger3Número máximo de tentativas de um processo antes de permitir que falhe
--max_cpusinteger4Número máximo de CPUs que podem ser solicitadas para qualquer job individual
--max_memorystring128.GBQuantidade máxima de memória que pode ser solicitada para qualquer job individual
--max_timestring240.hQuantidade máxima de tempo que pode ser solicitada para qualquer job individual
--max_downloadsinteger3Número máximo de amostras a serem baixadas ao mesmo tempo
Parâmetros de Configuração do Nextflow

Parâmetros para ajustar sua configuração do Nextflow.

ParâmetroTipoPadrãoDescrição
--nfconfigstringUm arquivo de configuração compatível com Nextflow para perfis personalizados, carregado por último e sobrescreverá variáveis existentes se definido
--publish_dir_modestringcopyMétodo usado para salvar os resultados do pipeline no diretório de saída (opções: symlink, rellink, link, copy, copyNoFollow, move)
--infodirstring${params.outdir}/pipeline_infoDiretório para manter os logs e relatórios do Nextflow do pipeline
--forcebooleanfalseO Nextflow sobrescreverá arquivos de saída existentes
--cleanup_workdirbooleanfalseApós a execução bem-sucedida do Bactopia, o diretório work será excluído
Opções de configuração institucional

Parâmetros usados para descrever perfis de configuração centralizados. Estes não devem ser editados.

ParâmetroTipoPadrãoDescrição
--custom_config_versionstringmasterID de commit Git para configurações institucionais
--custom_config_basestringhttps://raw.githubusercontent.com/nf-core/configs/masterDiretório base para configurações institucionais
--config_profile_namestringNome da configuração institucional
--config_profile_descriptionstringDescrição da configuração institucional
--config_profile_contactstringInformações de contato da configuração institucional
--config_profile_urlstringLink de URL da configuração institucional
Parâmetros de Perfil do Nextflow

Parâmetros para ajustar sua configuração do Nextflow.

ParâmetroTipoPadrãoDescrição
--condadirstringDiretório que o Nextflow deve usar para ambientes Conda
--registrystringquay.ioRegistro para baixar containers Docker
--datasets_cachestring<HOME>/.bactopia/datasetsDiretório onde os datasets baixados devem ser armazenados
--singularity_cachestringDiretório onde as imagens Singularity remotas são armazenadas
--singularity_pull_docker_containerbooleanEm vez de baixar imagens Singularity diretamente, forçar o fluxo de trabalho a baixar e converter containers Docker
--force_rebuildbooleanfalseForçar a sobrescrita de ambientes pré-construídos existentes
--queuestringgeneral,high-memoryNome(s) de fila separados por vírgula a serem usados por um agendador de jobs (ex.: AWS Batch ou SLURM)
--cluster_optsstringOpções adicionais a serem passadas ao executor (ex.: SLURM: '--account=my_acct_name')
--container_optsstringOpções adicionais a serem passadas para Apptainer, Docker ou Singularity (ex.: Singularity: '-D pwd')
--disable_scratchbooleanfalseTodos os arquivos intermediários criados nos nós de trabalho serão transferidos para o nó principal
Parâmetros Úteis

Parâmetros raramente usados que podem ser úteis.

ParâmetroTipoPadrãoDescrição
--monochrome_logsbooleanNão usar saídas de log coloridas
--nfdirbooleanExibir o diretório para o qual o Nextflow baixou o Bactopia
--sleep_timeinteger5A quantidade de tempo (segundos) que o Nextflow aguardará após configurar os datasets antes da execução
--validate_paramsbooleantrueSe os parâmetros devem ser validados em relação ao esquema em tempo de execução
--helpbooleanExibir texto de ajuda
--wfstringbactopiaEspecificar qual fluxo de trabalho ou ferramenta Bactopia executar
--list_wfsbooleanListar os fluxos de trabalho e ferramentas Bactopia disponíveis para usar com '--wf'
--show_hidden_paramsbooleanMostrar todos os parâmetros ao usar --help
--help_allbooleanUm alias para --help --show_hidden_params
--versionbooleanExibir texto de versão

Composição

Este fluxo de trabalho utiliza os seguintes subworkflows:

  • amrfinderplus - Encontrar genes de resistência antimicrobiana e mutações pontuais.
  • bactopia_assembler - Montar genomas bacterianos usando seleção automatizada de assembler.
  • bactopia_datasets - Baixar e fornecer datasets pré-compilados requeridos pelo Bactopia.
  • bactopia_gather - Buscar, validar, reunir e padronizar amostras de entrada.
  • bactopia_qc - Realizar controle de qualidade abrangente em reads de sequenciamento.
  • bactopia_sketcher - Criar sketches genômicos e realizar classificação taxonômica rápida.
  • bakta - Anotação rápida de genomas bacterianos.
  • mlst - Determinar tipos de sequência multilocus (MLST) a partir de montagens bacterianas.
  • prokka - Anotar genomas bacterianos com informações funcionais.
  • staphtyper - Determinar os tipos agr, spa, SCCmec e realizar vigilância baseada em genoma para genomas de Staphylococcus aureus.

Citações

Se você usar este pipeline em sua análise, por favor cite o seguinte.

Fonte

Ver código-fonte no GitHub