Pular para o conteúdo principal

ncbigenomedownload

Tags: download ncbi refseq genome assembly database sample-scope

Baixe genomas bacterianos do banco de dados RefSeq do NCBI.

Este subworkflow faz o download de genomas bacterianos completos e em rascunho utilizando a ferramenta ncbi-genome-download. Ele busca montagens de genomas em vários formatos, incluindo arquivos GenBank, GFF e FASTA, juntamente com arquivos de anotação e estatísticas associados.

Take

accessions: Path?
NomeTipoDescrição
accessionsPath?Um arquivo contendo números de acesso do NCBI, um por linha. Se vazio, fará o download de todos os genomas que correspondam aos critérios especificados.

Emit

Publicados

As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.

sample_outputs

SaídaDescrição
gbffSequências de genoma no formato GenBank
fnaSequências nucleotídicas genômicas no formato FASTA
gffAnotações de genoma no formato GFF3
faaSequências de proteínas no formato FASTA
gpffSequências de proteínas no formato GenPept
wgs_gbkRegistros mestre WGS no formato GenBank
cdsSequências nucleotídicas de CDS no formato FASTA
rnaSequências de produtos de RNA no formato FASTA
rna_fnaSequências nucleotídicas de features de RNA no formato FASTA
featuresTabela de features com localizações e atributos
rmSaída do RepeatMasker (opcional)
reportRelatório de montagem com relações entre unidades e sequências
statsEstatísticas de montagem
accessionsArquivos de lista de acessos gerados

run_outputs

Nenhuma saída de escopo de execução.

Entradas para Etapas Seguintes

As emissões a seguir são destinadas a serem utilizadas como entradas para subworkflows seguintes.

bactopia_tools

Arquivos baixados formatados para fluxos de trabalho do Bactopia Tools

assemblies

SaídaDescrição
fnaMontagem individual baixada no formato FASTA

reference

Primeiro arquivo de montagem baixado para uso como genoma de referência

Composição do Módulo

Este subworkflow chama os seguintes módulos:

  • ncbigenomedownload - Faz o download de montagens e arquivos de anotação do banco de dados Assembly do NCBI.

Utilizado Por

Este subworkflow é utilizado pelos seguintes fluxos de trabalho:

  • fastani - Cálculo rápido sem alinhamento da Identidade Nucleotídica Média em escala genômica.
  • mashtree - Construção rápida de árvores filogenéticas usando distâncias Mash.
  • pangenome - Análise de pan-genoma com filogenia do genoma central opcional.
  • snippy - Chamada rápida de variantes de haplótipos e alinhamento do genoma central.

Citações

Se você utilizar este subworkflow em sua análise, por favor cite o seguinte.

Fonte

Ver fonte no GitHub