Pular para o conteúdo principal

prokka

Tags: prokka annotation prokaryotic bacteria genbank gff sample-scope

Anotar genomas procarióticos.

Utiliza o Prokka para anotar rapidamente genomas bacterianos, archaeais e virais, produzindo arquivos de saída compatíveis com padrões, incluindo GFF3, GenBank e Sequin.

Entradas

record (
meta: Record,
fna: Path
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
fnaPathContigs montados no formato FASTA
proteins: Path?
prodigal_tf: Path?
NomeTipoDescrição
proteinsPath?Arquivo FASTA de proteínas confiáveis para anotar primeiramente
prodigal_tfPath?Arquivo de treinamento a ser usado para predição de genes

Saídas

record (
meta: Record,
gff: Path,
gbff: Path,
fna: Path,
faa: Path,
ffn: Path,
sqn: Path,
fsa: Path,
tbl: Path,
txt: Path,
tsv: Path,
blastdb: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro com informações da amostra
gffPathAnotação no formato GFF3, contendo tanto sequências quanto anotações
gbffPathAnotação no formato GenBank, contendo tanto sequências quanto anotações
fnaPathArquivo FASTA de nucleotídeos das sequências de contigs de entrada
faaPathArquivo FASTA de proteínas das sequências CDS traduzidas
ffnPathArquivo FASTA de nucleotídeos de todos os transcritos preditos (CDS, rRNA, tRNA, tmRNA, misc_RNA)
sqnPathArquivo no formato ASN1 "Sequin" para submissão ao GenBank
fsaPathArquivo FASTA de nucleotídeos das sequências de contigs de entrada, utilizado pelo tbl2asn
tblPathArquivo de Tabela de Features para submissão ao NCBI
txtPathEstatísticas resumidas relacionadas às features anotadas encontradas
tsvPathArquivo separado por tabulação de todas as features (locus_tag, ftype, len_bp, gene, EC_number, COG, product)
blastdbPathUm arquivo tar.gz comprimido de bancos de dados BLAST+ dos contigs, genes e proteínas
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log específicos do programa (opcionais)
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo formatado em YAML com versões dos programas

Parâmetros

Parâmetros do Prokka

ParâmetroTipoPadrãoDescrição
--prokka_proteinsstring${projectDir}/data/proteins.faaArquivo FASTA de proteínas confiáveis para anotar primeiramente
--prokka_prodigal_tfstringArquivo de treinamento a ser usado pelo Prodigal
--prokka_compliantbooleanfalseForçar conformidade com Genbank/ENA/DDJB
--prokka_centrestringBactopiaID do centro de sequenciamento
--prokka_coverageinteger80Cobertura mínima na proteína de consulta
--prokka_evaluestring1e-09Limite de e-value para similaridade
--prokka_optsstringOpções extras do Prokka entre aspas.
--prokka_debugbooleanfalseAtivar modo de depuração para o Prokka

Usado Por

Subworkflows

  • prokka - Anotar genomas bacterianos com informações funcionais.

Workflows

  • bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
  • pangenome - Análise de pan-genoma com filogenia opcional do genoma central.
  • prokka - Anotação rápida de genoma completo de genomas bacterianos, archaeais e virais.
  • staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.

Citações

Se você usar isso em sua análise, por favor cite o seguinte.

Fonte

Ver fonte no GitHub

Versão

PROKKA:
- prokka: 1.15.6