prokka
Tags: bacteria annotation genome prokaryote functional-annotation genes sample-scope
Anote genomas bacterianos com informações funcionais.
Este subworkflow anota montagens bacterianas utilizando o Prokka. Ele identifica genes rapidamente, os traduz e os pesquisa em múltiplos bancos de dados de proteínas para produzir uma anotação abrangente em diversos formatos padrão. Sequências de proteínas opcionais e arquivos de treinamento do Prodigal podem ser fornecidos para melhorar a precisão da anotação.
Take
assembly: Channel<Record>
| Campo | Descrição |
|---|---|
meta | Groovy Record contendo informações da amostra |
assembly | Arquivos de montagem bacteriana no formato FASTA a serem anotados |
proteins: Path?
prodigal_tf: Path?
| Nome | Tipo | Descrição |
|---|---|---|
proteins | Path? | Sequências de proteínas opcionais para busca por homologia, com o objetivo de melhorar a precisão da anotação |
prodigal_tf | Path? | Arquivo de treinamento opcional do Prodigal para maior precisão na predição de genes |
Emit
Publicados
As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.
sample_outputs
| Saída | Descrição |
|---|---|
gff | Anotação no formato GFF3, contendo sequências e anotações |
gbff | Anotação no formato GenBank, contendo sequências e anotações |
fna | Arquivo FASTA nucleotídico das sequências de contigs de entrada |
faa | Arquivo FASTA de proteínas das sequências CDS traduzidas |
ffn | Arquivo FASTA nucleotídico de todos os transcritos preditos (CDS, rRNA, tRNA, tmRNA, misc_RNA) |
sqn | Arquivo no formato ASN1 "Sequin" para submissão ao GenBank |
fsa | Arquivo FASTA nucleotídico das sequências de contigs de entrada, utilizado pelo tbl2asn |
tbl | Arquivo de Tabela de Recursos para submissão ao NCBI |
txt | Estatísticas resumidas relacionadas às características anotadas encontradas |
tsv | Arquivo separado por tabulações com todas as características |
blastdb | Um arquivo compactado tar.gz com os bancos de dados do BLAST+ |
run_outputs
Nenhuma saída com escopo de execução.
Entradas para Etapas Seguintes
As emissões a seguir são destinadas a serem usadas como entradas para subworkflows subsequentes.
annotations
| Saída | Descrição |
|---|---|
fna | Sequências nucleotídicas anotadas no formato FASTA |
faa | Sequências de proteínas no formato FASTA |
gff | Anotações no formato GFF3 |
gffs
| Saída | Descrição |
|---|---|
gff | Arquivo de anotação GFF3 para análise de pan-genoma |
Composição do Módulo
Este subworkflow chama os seguintes módulos:
- prokka - Anota genomas procarióticos.
Usado Por
Este subworkflow é utilizado pelos seguintes fluxos de trabalho:
- bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
- pangenome - Análise de pan-genoma com filogenia opcional do genoma core.
- prokka - Anotação rápida de genomas completos de bactérias, archaeas e vírus.
- staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.
Citações
Se você utilizar este recurso em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
Prokka
Seemann T Prokka: rapid prokaryotic genome annotation Bioinformatics 30, 2068-2069 (2014)