genotyphi
Tags: salmonella-typhi genotyping lineage amr mykrobe bactopia-tool
Genotipagem de Salmonella Typhi com atribuição de linhagem.
Esta Bactopia Tool utiliza o GenoTyphi para
identificar linhagens de Typhi, determinantes de resistência antimicrobiana e marcadores plasmidiais em amostras de Salmonella Typhi.
As amostras são processadas primeiro pelo Mykrobe usando mykrobe predict
com typhi especificado como espécie. Em seguida, os resultados do Mykrobe são processados pelo
script parse_typhi_mykrobe.py do GenoTyphi.
Uso
Bactopia CLI:
bactopia --wf genotyphi \
--bactopia /path/to/your/bactopia/results
Nextflow:
nextflow run bactopia/bactopia/workflows/bactopia-tools/genotyphi/main.nf \
--bactopia /path/to/your/bactopia/results
Saídas
Arquivos de Saída Esperados
<BACTOPIA_DIR>
├── <SAMPLE_NAME>
│ └── tools
│ └── genotyphi-<TIMESTAMP>
│ ├── <SAMPLE_NAME>.csv
│ ├── <SAMPLE_NAME>.json
│ ├── <SAMPLE_NAME>.tsv
│ └── logs
│ ├── genotyphi-<TIMESTAMP>
│ │ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ │ └── versions.yml
│ └── mykrobe
│ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ └── versions.yml
└── bactopia-runs
└── genotyphi-<TIMESTAMP>
├── merged-results
│ ├── genotyphi.tsv
│ └── logs
│ └── genotyphi-concat
│ ├── nf.command.{begin,err,log,out,run,sh,trace}
│ └── versions.yml
└── nf-reports
├── genotyphi-dag.dot
├── genotyphi-report.html
└── genotyphi-timeline.html
Resultados por Amostra
| Arquivo | Descrição |
|---|---|
*.json | Resultados da predição do Mykrobe |
*.tsv | Resultados processados pelo GenoTyphi |
Resultados Consolidados
| Arquivo | Descrição |
|---|---|
genotyphi.tsv | Arquivo TSV consolidado contendo os resultados do GenoTyphi de todas as amostras |
Trilha de Auditoria
Abaixo estão os arquivos que podem ajudar a entender quais parâmetros e versões de programas foram utilizados.
Logs
Cada processo executado terá uma pasta chamada logs. Nesta pasta estão arquivos úteis
para revisar caso necessário.
| Extensão | Descrição |
|---|---|
| .begin | Um arquivo vazio usado para indicar que o processo foi iniciado |
| .err | Contém as saídas STDERR do processo |
| .log | Contém as saídas STDERR e STDOUT do processo |
| .out | Contém as saídas STDOUT do processo |
| .run | O script que o Nextflow usa para preparar/remover arquivos e enfileirar processos com base no perfil configurado |
| .sh | O script executado pelo bash para o processo |
| .trace | O relatório de rastreamento do Nextflow para o processo |
| versions.yml | Um arquivo no formato YAML com as versões dos programas |
Relatórios do Nextflow
Esses relatórios do Nextflow fornecem um ótimo resumo da sua execução. Eles podem ser usados para otimizar o uso de recursos e estimar custos esperados ao utilizar plataformas em nuvem.
| Arquivo | Descrição |
|---|---|
| genotyphi-dag.dot | A visualização DAG do Nextflow |
| genotyphi-report.html | O Relatório de Execução do Nextflow |
| genotyphi-timeline.html | O Relatório de Linha do Tempo do Nextflow |
| genotyphi-trace.txt | O relatório de Rastreamento do Nextflow |
Parâmetros
Parâmetros Obrigatórios
Defina onde o pipeline deve encontrar os dados de entrada e salvar os dados de saída.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--bactopia | string | O caminho para os resultados do Bactopia a serem usados como entrada |
Parâmetros do Mykrobe
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--mykrobe_species | string | Painel de espécie a utilizar (opções: sonnei, staph, tb, typhi) | |
--mykrobe_kmer | integer | 21 | Comprimento do K-mer |
--mykrobe_min_depth | integer | 1 | Profundidade mínima |
--mykrobe_model | string | kmer_count | Modelo de genotipagem utilizado. (opções: kmer_count, median_depth) |
--mykrobe_report_all_calls | boolean | false | Reportar todas as chamadas |
--mykrobe_opts | string | Opções extras do Mykrobe entre aspas |
Parâmetros do GenoTyphi
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--genotyphi_kmer | integer | 21 | Comprimento do K-mer |
--genotyphi_min_depth | integer | 1 | Profundidade mínima |
--genotyphi_model | string | kmer_count | Modelo de genotipagem utilizado. (opções: kmer_count, median_depth) |
--genotyphi_report_all_calls | boolean | false | Reportar todas as chamadas |
--genotyphi_mykrobe_opts | string | Opções extras do Mykrobe entre aspas |
Parâmetros do csvtk concat
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--csvtk_concat_opts | string | Opções extras do csvtk concat entre aspas |
Parâmetros de Filtragem
Use estes parâmetros para especificar quais amostras incluir ou excluir.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--include | string | Um arquivo de texto contendo nomes de amostras (um por linha) a incluir na análise | |
--exclude | string | Um arquivo de texto contendo nomes de amostras (um por linha) a excluir da análise |
Parâmetros Opcionais
Estes parâmetros opcionais podem ser úteis em determinadas situações.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--outdir | string | bactopia | Diretório base para gravar os resultados |
--skip_compression | boolean | false | Os arquivos de saída não serão comprimidos |
--datasets | string | O caminho para armazenar em cache os conjuntos de dados | |
--keep_all_files | boolean | false | Mantém todos os arquivos de análise criados |
Parâmetros de Requisição Máxima de Jobs
Defina o limite máximo de recursos solicitados para qualquer job individual.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--max_retry | integer | 3 | Número máximo de tentativas de um processo antes de permitir que ele falhe. |
--max_cpus | integer | 4 | Número máximo de CPUs que podem ser solicitadas para qualquer job individual. |
--max_memory | string | 128.GB | Quantidade máxima de memória que pode ser solicitada para qualquer job individual. |
--max_time | string | 240.h | Tempo máximo que pode ser solicitado para qualquer job individual. |
--max_downloads | integer | 3 | Número máximo de amostras para baixar simultaneamente |
Parâmetros de Configuração do Nextflow
Parâmetros para ajustar a configuração do Nextflow.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--nfconfig | string | Um arquivo de configuração compatível com Nextflow para perfis personalizados, carregado por último e que sobrescreverá variáveis existentes se definido. | |
--publish_dir_mode | string | copy | Método usado para salvar os resultados do pipeline no diretório de saída. (opções: symlink, rellink, link, copy, copyNoFollow, move) |
--infodir | string | ${params.outdir}/pipeline_info | Diretório para manter os logs e relatórios do Nextflow do pipeline. |
--force | boolean | false | O Nextflow sobrescreverá arquivos de saída existentes. |
--cleanup_workdir | boolean | false | Após a execução bem-sucedida do Bactopia, o diretório work será excluído. |
Opções de configuração institucional
Parâmetros usados para descrever perfis de configuração centralizados. Estes não devem ser editados.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--custom_config_version | string | master | ID do commit Git para configurações institucionais. |
--custom_config_base | string | https://raw.githubusercontent.com/nf-core/configs/master | Diretório base para configurações institucionais. |
--config_profile_name | string | Nome do perfil de configuração institucional. | |
--config_profile_description | string | Descrição do perfil de configuração institucional. | |
--config_profile_contact | string | Informações de contato do perfil de configuração institucional. | |
--config_profile_url | string | URL do perfil de configuração institucional. |
Parâmetros de Perfil do Nextflow
Parâmetros para ajustar a configuração do Nextflow.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--condadir | string | Diretório que o Nextflow deve usar para os ambientes Conda | |
--registry | string | quay.io | Registro do qual os contêineres Docker serão baixados. |
--datasets_cache | string | <HOME>/.bactopia/datasets | Diretório onde os conjuntos de dados baixados devem ser armazenados. |
--singularity_cache | string | Diretório onde as imagens remotas do Singularity são armazenadas. | |
--singularity_pull_docker_container | boolean | Em vez de baixar diretamente imagens Singularity, força o fluxo de trabalho a baixar e converter contêineres Docker. | |
--force_rebuild | boolean | false | Força a sobrescrita de ambientes pré-construídos existentes. |
--queue | string | general,high-memory | Nome(s) de fila(s) separados por vírgula a serem usados por um agendador de jobs (ex.: AWS Batch ou SLURM) |
--cluster_opts | string | Opções adicionais para passar ao executor. (ex.: SLURM: '--account=my_acct_name' | |
--container_opts | string | Opções adicionais para passar ao Apptainer, Docker ou Singularity. (ex.: Singularity: '-D pwd' | |
--disable_scratch | boolean | false | Todos os arquivos intermediários criados nos nós de trabalho serão transferidos para o nó principal. |
Parâmetros Úteis
Parâmetros raramente usados que podem ser úteis.
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--monochrome_logs | boolean | Não usar saídas de log coloridas. | |
--nfdir | boolean | Exibir o diretório para o qual o Nextflow baixou o Bactopia | |
--sleep_time | integer | 5 | O tempo (em segundos) que o Nextflow aguardará após configurar os conjuntos de dados antes da execução. |
--validate_params | boolean | true | Indica se os parâmetros devem ser validados em relação ao esquema em tempo de execução |
--help | boolean | Exibir texto de ajuda. | |
--wf | string | bactopia | Especificar qual fluxo de trabalho ou Bactopia Tool executar |
--list_wfs | boolean | Listar os fluxos de trabalho e Bactopia Tools disponíveis para uso com '--wf' | |
--show_hidden_params | boolean | Mostrar todos os parâmetros ao usar --help | |
--help_all | boolean | Um alias para --help --show_hidden_params | |
--version | boolean | Exibir texto de versão. |
Composição
Este fluxo de trabalho utiliza os seguintes subworkflows:
- genotyphi - Atribuir genótipos a genomas de Salmonella Typhi.
Citações
Se você usar esta ferramenta em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
GenoTyphi
Wong VK, Baker S, Connor TR, Pickard D, Page AJ, Dave J, Murphy N, Holliman R, Sefton A, Millar M, Dyson ZA, Dougan G, Holt KE, & International Typhoid Consortium. An extended genotyping framework for Salmonella enterica serovar Typhi, the cause of human typhoid Nature Communications 7, 12827. (2016) -
Mykrobe
Hunt M, Bradley P, Lapierre SG, Heys S, Thomsit M, Hall MB, Malone KM, Wintringer P, Walker TM, Cirillo DM, Comas I, Farhat MR, Fowler P, Gardy J, Ismail N, Kohl TA, Mathys V, Merker M, Niemann S, Omar SV, Sintchenko V, Smith G, Supply P, Tahseen S, Wilcox M, Arandjelovic I, Peto TEA, Crook, DW, Iqbal Z Antibiotic resistance prediction for Mycobacterium tuberculosis from genome sequence data with Mykrobe Wellcome Open Research 4, 191. (2019)