panaroo_run
Tags: pan-genoma orthologs core-genome gene-presence-absence graph-based annotation run-scope
Análise rápida e escalável de pangenoma bacteriano usando uma abordagem baseada em grafos.
Utiliza o Panaroo para agrupar genes de múltiplos genomas bacterianos anotados em grupos ortólogos, corrigindo divisões e fusões de genes. As saídas principais são a matriz de presença/ausência de genes (o pan-genoma) e um alinhamento do genoma central (para filogenética).
Entradas
record (
meta: Record,
gff: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro Groovy contendo informações da amostra |
gff | Set<Path> | Lista de arquivos de genoma anotado no formato GFF3 (entrada obrigatória) |
Saídas
record (
meta: Record,
aln: Path?,
filtered_aln: Path?,
csv: Path?,
panaroo_csv: Path?,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro com informações da amostra |
aln | Path? | O alinhamento do genoma central (*core-genome.aln.gz), adequado para construção de árvore filogenética |
filtered_aln | Path? | O alinhamento do genoma central com regiões altamente recombinantes filtradas |
csv | Path? | Matriz de presença/ausência de genes no formato CSV compatível com Roary |
panaroo_csv | Path? | Matriz de presença/ausência de genes no formato CSV nativo do Panaroo |
results | Set<Path> | Todos os arquivos de saída a serem publicados |
logs | Set<Path?> | Arquivos de log opcionais específicos do programa |
nf_logs | Set<Path> | Arquivos de log específicos do Nextflow (ex.: .command.{begin |
versions | Set<Path> | Arquivo no formato YAML com as versões dos programas |
Parâmetros
Parâmetros do Panaroo Run
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--panaroo_mode | string | strict | O modo de rigor para executar o panaroo (opções: strict, moderate, sensitive) |
--panaroo_alignment | string | core | Gera alinhamentos de genes centrais ou de todos os genes (opções: core, pan) |
--panaroo_aligner | string | mafft | Alinhador a ser usado para o alinhamento do genoma central/pan (opções: mafft, prank, clustal) |
--panaroo_core_threshold | number | 0.95 | Limiar de amostras do genoma central |
--panaroo_threshold | number | 0.98 | Limiar de identidade de sequência |
--panaroo_family_threshold | number | 0.7 | Limiar de identidade de sequência da família proteica |
--panaroo_len_dif_percent | number | 0.98 | Corte de diferença de comprimento |
--panaroo_merge_paralogs | boolean | false | Não dividir parálogos |
--panaroo_opts | string | Opções adicionais para passar ao panaroo |
Usado Por
Subworkflows
- panaroo - Constrói um pan-genoma a partir de anotações GFF3 usando Panaroo.
Citações
Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
Panaroo
Tonkin-Hill G, MacAlasdair N, Ruis C, Weimann A, Horesh G, Lees JA, Gladstone RA, Lo S, Beaudoin C, Floto RA, Frost SDW, Corander J, Bentley SD, Parkhill J Producing polished prokaryotic pangenomes with the Panaroo pipeline. Genome Biology 21(1), 180. (2020) -
MAFFT
Katoh K, Standley DM MAFFT multiple sequence alignment software version 7: improvements in performance and usability. Mol. Biol. Evol. 30, 772-780 (2013)
Fonte
Versão
PANAROO_RUN:
- panaroo: 1.6.0