Pular para o conteúdo principal

prokka

Tags: bacteria annotation genome prokaryote functional-annotation genes sample-scope

Anote genomas bacterianos com informações funcionais.

Este subworkflow anota montagens bacterianas utilizando o Prokka. Ele identifica genes rapidamente, os traduz e os pesquisa em múltiplos bancos de dados de proteínas para produzir uma anotação abrangente em diversos formatos padrão. Sequências de proteínas opcionais e arquivos de treinamento do Prodigal podem ser fornecidos para melhorar a precisão da anotação.

Take

assembly: Channel<Record>
CampoDescrição
metaGroovy Record contendo informações da amostra
assemblyArquivos de montagem bacteriana no formato FASTA a serem anotados
proteins: Path?
prodigal_tf: Path?
NomeTipoDescrição
proteinsPath?Sequências de proteínas opcionais para busca por homologia, com o objetivo de melhorar a precisão da anotação
prodigal_tfPath?Arquivo de treinamento opcional do Prodigal para maior precisão na predição de genes

Emit

Publicados

As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.

sample_outputs

SaídaDescrição
gffAnotação no formato GFF3, contendo sequências e anotações
gbffAnotação no formato GenBank, contendo sequências e anotações
fnaArquivo FASTA nucleotídico das sequências de contigs de entrada
faaArquivo FASTA de proteínas das sequências CDS traduzidas
ffnArquivo FASTA nucleotídico de todos os transcritos preditos (CDS, rRNA, tRNA, tmRNA, misc_RNA)
sqnArquivo no formato ASN1 "Sequin" para submissão ao GenBank
fsaArquivo FASTA nucleotídico das sequências de contigs de entrada, utilizado pelo tbl2asn
tblArquivo de Tabela de Recursos para submissão ao NCBI
txtEstatísticas resumidas relacionadas às características anotadas encontradas
tsvArquivo separado por tabulações com todas as características
blastdbUm arquivo compactado tar.gz com os bancos de dados do BLAST+

run_outputs

Nenhuma saída com escopo de execução.

Entradas para Etapas Seguintes

As emissões a seguir são destinadas a serem usadas como entradas para subworkflows subsequentes.

annotations

SaídaDescrição
fnaSequências nucleotídicas anotadas no formato FASTA
faaSequências de proteínas no formato FASTA
gffAnotações no formato GFF3

gffs

SaídaDescrição
gffArquivo de anotação GFF3 para análise de pan-genoma

Composição do Módulo

Este subworkflow chama os seguintes módulos:

  • prokka - Anota genomas procarióticos.

Usado Por

Este subworkflow é utilizado pelos seguintes fluxos de trabalho:

  • bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
  • pangenome - Análise de pan-genoma com filogenia opcional do genoma core.
  • prokka - Anotação rápida de genomas completos de bactérias, archaeas e vírus.
  • staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.

Citações

Se você utilizar este recurso em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub