gubbins
Tags: recombination phylogeny filter snp core-genome run-scope
Detectar e filtrar regiões de recombinação em alinhamentos bacterianos.
Este subworkflow utiliza o Gubbins (Globally Optimised Bacterial Phylogenomic analysis) para identificar regiões de recombinação em alinhamentos de genoma central bacteriano. Ele filtra iterativamente a recombinação para produzir uma filogenia livre de recombinação e, em seguida, calcula distâncias de SNP a partir do alinhamento mascarado. O Gubbins é essencial para a reconstrução filogenética precisa de espécies bacterianas recombinantes.
Take
alignment: Channel<Record>
| Campo | Descrição |
|---|---|
meta | Groovy Record contendo informações da amostra |
aln | Alinhamento de múltiplas sequências no formato FASTA |
Emit
Publicados
As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.
sample_outputs
Nenhuma saída no escopo de amostra.
run_outputs
| Saída | Descrição |
|---|---|
masked_aln | Alinhamento mascarado para recombinação no formato FASTA |
fasta | Alinhamento concatenado antes do mascaramento no formato FASTA |
gff | Arquivo GFF contendo coordenadas das regiões de recombinação |
vcf | Arquivo VCF contendo SNPs filtrados pelo Gubbins |
stats | Estatísticas resumidas da análise do Gubbins |
phylip | Alinhamento mascarado para recombinação no formato PHYLIP |
embl_predicted | Predições de recombinação no formato EMBL |
embl_branch | Recombinação específica de ramo no formato EMBL |
tree | Árvore de máxima verossimilhança a partir dos SNPs filtrados no formato Newick |
tree_labelled | Árvore anotada com rótulos de nós no formato Newick |
bootstrap_tree | Árvore filogenética com bootstrap no formato Newick |
tsv | Distâncias de SNP pareadas a partir do alinhamento mascarado no formato TSV |
Entradas para Subworkflows Posteriores
As emissões a seguir são destinadas a serem utilizadas como entradas para subworkflows posteriores.
alignment
| Saída | Descrição |
|---|---|
aln | Alinhamento mascarado para recombinação para análise filogenética posterior |
Composição do Subworkflow
Este subworkflow chama os seguintes subworkflows:
- snpdists - Calcular distâncias de SNP pareadas a partir de alinhamentos de sequências.
Composição de Módulos
Este subworkflow chama os seguintes módulos:
- gubbins - Detectar recombinação e construir uma filogenia livre de recombinação.
Usado Por
Este subworkflow é utilizado pelos seguintes fluxos de trabalho:
- snippy - Chamada rápida de variantes de haplótipos e alinhamento de genoma central.
Citações
Se você usar isso em sua análise, por favor cite o seguinte.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
Gubbins
Croucher NJ, Page AJ, Connor TR, Delaney AJ, Keane JA, Bentley SD, Parkhill J, Harris SR Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins. Nucleic Acids Research 43(3), e15. (2015) -
snp-dists
Seemann T snp-dists - Pairwise SNP distance matrix from a FASTA sequence alignment. (GitHub)