pangenome
Tags: alignment core-genome pan-genoma phylogeny comparative-genomics run-scope
Realize análise de pan-genoma com filogenia de core-genome opcional.
Este subworkflow cria um pan-genoma a partir de arquivos de anotação GFF3 usando uma de três ferramentas: Panaroo (padrão), PIRATE ou Roary. Ele gera alinhamentos de core-genome e matrizes de presença/ausência de genes, seguidos de cálculos de distância SNP usando snp-dists. O fluxo de trabalho executa condicionalmente a ferramenta de pan-genoma selecionada com base em parâmetros booleanos.
Take
gff: Channel<Record>
| Campo | Descrição |
|---|---|
meta | Groovy Record contendo informações da amostra |
gff | Conjunto de arquivos de anotação GFF3 provenientes de genomas montados |
use_pirate: Boolean
use_roary: Boolean
| Nome | Tipo | Descrição |
|---|---|---|
use_pirate | Boolean | Flag booleana para usar PIRATE na análise de pan-genoma |
use_roary | Boolean | Flag booleana para usar Roary na análise de pan-genoma |
Emit
Publicados
As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.
sample_outputs
Nenhuma saída no escopo de amostra.
run_outputs
| Saída | Descrição |
|---|---|
aln | Alinhamento de core-genome no formato FASTA |
csv | Matriz de presença/ausência de genes |
supplemental | Arquivos intermediários e saídas detalhadas |
tsv | Matriz de distância SNP pareada a partir do alinhamento de core-genome |
Entradas para Subworkflows Downstream
As emissões a seguir são destinadas ao uso como entradas para subworkflows downstream.
alignment
| Saída | Descrição |
|---|---|
aln | Alinhamento de core-genome para análise downstream (ex.: detecção de recombinação) |
phylogeny_input
| Saída | Descrição |
|---|---|
aln | Alinhamento de core-genome com metadados prontos para iqtree para construção filogenética |
csv
| Saída | Descrição |
|---|---|
csv | Matriz de presença/ausência de genes para análise downstream (ex.: pan-GWAS) |
Composição do Subworkflow
Este subworkflow chama os seguintes subworkflows:
- pirate - Constrói um pan-genoma a partir de anotações GFF3 usando PIRATE.
- roary - Constrói um pan-genoma a partir de anotações GFF3 usando Roary.
- panaroo - Constrói um pan-genoma a partir de anotações GFF3 usando Panaroo.
- snpdists - Calcula distâncias SNP pareadas a partir de alinhamentos de sequências.
Usado Por
Este subworkflow é usado pelos seguintes fluxos de trabalho:
- pangenome - Análise de pan-genoma com filogenia de core-genome opcional.
Citations
If you use this in your analysis, please cite the following.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
PIRATE
Bayliss SC, Thorpe HA, Coyle NM, Sheppard SK, Feil EJ PIRATE: A fast and scalable pangenomics toolbox for clustering diverged orthologues in bacteria. Gigascience 8 (2019) -
Panaroo
Tonkin-Hill G, MacAlasdair N, Ruis C, Weimann A, Horesh G, Lees JA, Gladstone RA, Lo S, Beaudoin C, Floto RA, Frost SDW, Corander J, Bentley SD, Parkhill J Producing polished prokaryotic pangenomes with the Panaroo pipeline. Genome Biology 21(1), 180. (2020) -
Roary
Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MTG, Fookes M, Falush D, Keane JA, Parkhill J Roary: rapid large-scale prokaryote pan genome analysis. Bioinformatics 31, 3691-3693 (2015) -
snp-dists
Seemann T snp-dists - Pairwise SNP distance matrix from a FASTA sequence alignment. (GitHub)