Pular para o conteúdo principal

tbprofiler

Tags: mycobacterium-tuberculosis resistance lineage typing tb bactopia-tool

Detecção de resistência antimicrobiana e tipagem de linhagem de Mycobacterium tuberculosis.

Esta Bactopia Tool utiliza o TBProfiler para analisar genomas de Mycobacterium tuberculosis em busca de mutações de resistência e tipagem de linhagem. O fluxo de trabalho processa reads de sequenciamento para identificar variantes associadas à resistência e determinar a linhagem de cada isolado de TB.

Uso

Bactopia CLI:

bactopia --wf tbprofiler \
--bactopia /path/to/your/bactopia/results

Nextflow:

nextflow run bactopia/bactopia/workflows/bactopia-tools/tbprofiler/main.nf \
--bactopia /path/to/your/bactopia/results

Saídas

Arquivos de Saída Esperados

<BACTOPIA_DIR>
├── <SAMPLE_NAME>
│ └── tools
│ └── tbprofiler-<TIMESTAMP>
│ ├── <SAMPLE_NAME>.csv
│ ├── <SAMPLE_NAME>.results.json.gz
│ ├── <SAMPLE_NAME>.txt
│ ├── logs
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ └── supplemental
│ ├── <SAMPLE_NAME>.bam
│ ├── <SAMPLE_NAME>.bam.bai
│ └── <SAMPLE_NAME>.targets.vcf.gz
└── bactopia-runs
└── tbprofiler-<TIMESTAMP>
├── merged-results
│ ├── logs
│ │ └── tbprofiler-collate
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ ├── tbprofiler.csv
│ ├── tbprofiler.variants.csv
│ └── tbprofiler.variants.txt
└── nf-reports
├── tbprofiler-dag.dot
├── tbprofiler-report.html
└── tbprofiler-timeline.html

Resultados por Amostra

ArquivoDescrição
*.results.txtArquivo de texto com os resultados de resistência e tipagem de linhagem do TBProfiler
*.results.jsonArquivo JSON com os resultados detalhados da análise do TBProfiler
*.results.csvArquivo CSV com os resultados do TBProfiler em formato tabular
bam/*.bamArquivo BAM com os detalhes de alinhamento dos reads contra os genomas de referência
vcf/*.targets.csq.vcf.gzArquivo VCF com anotações de variantes e consequências funcionais

Resultados Consolidados

ArquivoDescrição
tbprofiler.tsvArquivo TSV consolidado com os resultados do TBProfiler de todas as amostras

Trilha de Auditoria

Abaixo estão os arquivos que podem ajudar a entender quais parâmetros e versões de programas foram utilizados.

Logs

Cada processo executado terá uma pasta chamada logs. Nessa pasta estão arquivos úteis para revisão caso necessário.

ExtensãoDescrição
.beginArquivo vazio usado para indicar que o processo foi iniciado
.errContém as saídas STDERR do processo
.logContém as saídas STDERR e STDOUT do processo
.outContém as saídas STDOUT do processo
.runO script que o Nextflow usa para preparar/remover arquivos e enfileirar processos com base no perfil fornecido
.shO script executado pelo bash para o processo
.traceO relatório de rastreamento do Nextflow para o processo
versions.ymlArquivo no formato YAML com as versões dos programas

Relatórios do Nextflow

Esses relatórios do Nextflow fornecem um excelente resumo da sua execução. Podem ser usados para otimizar o uso de recursos e estimar custos esperados ao utilizar plataformas em nuvem.

ArquivoDescrição
tbprofiler-dag.dotA visualização DAG do Nextflow
tbprofiler-report.htmlO Relatório de Execução do Nextflow
tbprofiler-timeline.htmlO Relatório de Linha do Tempo do Nextflow
tbprofiler-trace.txtO relatório de Rastreamento do Nextflow

Parâmetros

Parâmetros Obrigatórios

Define onde o pipeline deve encontrar os dados de entrada e salvar os dados de saída.

ParâmetroTipoPadrãoDescrição
--bactopiastringO caminho para os resultados do Bactopia a serem usados como entradas

Parâmetros de Perfil do TB-Profiler

ParâmetroTipoPadrãoDescrição
--tbprofiler_call_whole_genomebooleanfalseChamar o genoma inteiro
--tbprofiler_mapperstringbwaFerramenta de mapeamento a usar. Se estiver usando dados Nanopore, o padrão será minimap2 (opções: bwa, minimap2, bowtie2, bwa-mem2)
--tbprofiler_callerstringfreebayesFerramenta de chamada de variantes a usar (opções: bcftools, gatk, freebayes)
--tbprofiler_calling_paramsstringOpções extras para o chamador de variantes entre aspas
--tbprofiler_suspectbooleanfalseUsar o conjunto de ferramentas suspect para adicionar predições de ML
--tbprofiler_no_flagstatbooleanfalseNão coletar flagstats
--tbprofiler_no_dellybooleanfalseNão executar delly
--tbprofiler_optsstringOpções extras entre aspas para o TBProfiler

Parâmetros de Consolidação do TB-Profiler

ParâmetroTipoPadrãoDescrição
--tbprofiler_itolbooleanfalseGerar arquivos de configuração itol
--tbprofiler_fullbooleanfalseIncluir mutações no arquivo de resultado principal
--tbprofiler_all_variantsbooleanfalseIncluir todas as variantes na matriz de variantes
--tbprofiler_mark_missingbooleanfalseUm asterisco será usado para marcar predições afetadas por dados ausentes em uma posição de resistência a drogas
Parâmetros de Filtragem

Use esses parâmetros para especificar quais amostras incluir ou excluir.

ParâmetroTipoPadrãoDescrição
--includestringUm arquivo de texto contendo nomes de amostras (um por linha) a incluir na análise
--excludestringUm arquivo de texto contendo nomes de amostras (um por linha) a excluir da análise
Parâmetros Opcionais

Esses parâmetros opcionais podem ser úteis em determinadas situações.

ParâmetroTipoPadrãoDescrição
--outdirstringbactopiaDiretório base para salvar os resultados
--skip_compressionbooleanfalseOs arquivos de saída não serão comprimidos
--datasetsstringO caminho para armazenar os datasets em cache
--keep_all_filesbooleanfalseMantém todos os arquivos de análise criados
Parâmetros de Requisição Máxima de Recursos

Define o limite máximo de recursos solicitados para qualquer job individual.

ParâmetroTipoPadrãoDescrição
--max_retryinteger3Número máximo de tentativas de um processo antes de permitir que ele falhe.
--max_cpusinteger4Número máximo de CPUs que podem ser solicitadas para qualquer job individual.
--max_memorystring128.GBQuantidade máxima de memória que pode ser solicitada para qualquer job individual.
--max_timestring240.hTempo máximo que pode ser solicitado para qualquer job individual.
--max_downloadsinteger3Número máximo de amostras a serem baixadas por vez
Parâmetros de Configuração do Nextflow

Parâmetros para ajustar a configuração do Nextflow.

ParâmetroTipoPadrãoDescrição
--nfconfigstringUm arquivo de configuração compatível com Nextflow para perfis personalizados, carregado por último e que sobrescreverá variáveis existentes se definido.
--publish_dir_modestringcopyMétodo usado para salvar os resultados do pipeline no diretório de saída. (opções: symlink, rellink, link, copy, copyNoFollow, move)
--infodirstring${params.outdir}/pipeline_infoDiretório para armazenar logs e relatórios do Nextflow do pipeline.
--forcebooleanfalseO Nextflow sobrescreverá arquivos de saída existentes.
--cleanup_workdirbooleanfalseApós a execução bem-sucedida do Bactopia, o diretório work será excluído.
Opções de configuração institucional

Parâmetros usados para descrever perfis de configuração centralizados. Estes não devem ser editados.

ParâmetroTipoPadrãoDescrição
--custom_config_versionstringmasterID do commit Git para configurações institucionais.
--custom_config_basestringhttps://raw.githubusercontent.com/nf-core/configs/masterDiretório base para configurações institucionais.
--config_profile_namestringNome do perfil de configuração institucional.
--config_profile_descriptionstringDescrição do perfil de configuração institucional.
--config_profile_contactstringInformações de contato do perfil de configuração institucional.
--config_profile_urlstringURL do perfil de configuração institucional.
Parâmetros de Perfil do Nextflow

Parâmetros para ajustar a configuração do Nextflow.

ParâmetroTipoPadrãoDescrição
--condadirstringDiretório que o Nextflow deve usar para os ambientes Conda
--registrystringquay.ioRegistro a partir do qual os contêineres Docker serão baixados.
--datasets_cachestring<HOME>/.bactopia/datasetsDiretório onde os datasets baixados devem ser armazenados.
--singularity_cachestringDiretório onde as imagens Singularity remotas são armazenadas.
--singularity_pull_docker_containerbooleanEm vez de baixar diretamente imagens Singularity, força o fluxo de trabalho a baixar e converter contêineres Docker.
--force_rebuildbooleanfalseForça a sobrescrita de ambientes pré-construídos existentes.
--queuestringgeneral,high-memoryNome(s) da(s) fila(s) separados por vírgula a serem usados por um agendador de jobs (ex.: AWS Batch ou SLURM)
--cluster_optsstringOpções adicionais para passar ao executor. (ex.: SLURM: '--account=my_acct_name'
--container_optsstringOpções adicionais para passar ao Apptainer, Docker ou Singularity. (ex.: Singularity: '-D pwd'
--disable_scratchbooleanfalseTodos os arquivos intermediários criados nos nós de trabalho serão transferidos para o nó principal.
Parâmetros Auxiliares

Parâmetros raramente usados que podem ser úteis.

ParâmetroTipoPadrãoDescrição
--monochrome_logsbooleanNão usar saídas de log coloridas.
--nfdirbooleanExibir o diretório para o qual o Nextflow baixou o Bactopia
--sleep_timeinteger5O tempo (em segundos) que o Nextflow aguardará após configurar os datasets antes da execução.
--validate_paramsbooleantrueDefine se os parâmetros devem ser validados contra o esquema em tempo de execução
--helpbooleanExibir texto de ajuda.
--wfstringbactopiaEspecifica qual fluxo de trabalho ou Bactopia Tool executar
--list_wfsbooleanListar os fluxos de trabalho e Bactopia Tools disponíveis para usar com '--wf'
--show_hidden_paramsbooleanMostrar todos os parâmetros ao usar --help
--help_allbooleanUm atalho para --help --show_hidden_params
--versionbooleanExibir texto da versão.

Composição

Este fluxo de trabalho utiliza os seguintes subworkflows:

  • tbprofiler - Ferramenta de análise de Mycobacterium tuberculosis para detectar resistência e tipagem de linhagem.

Citações

Se você usar este fluxo de trabalho em sua análise, por favor cite os seguintes trabalhos.

Código-fonte

Ver código-fonte no GitHub