Pular para o conteúdo principal

ncbigenomedownload

Tags: ncbi download genome assembly fasta genbank utility run-scope

Baixe arquivos de montagem e anotação do banco de dados Assembly do NCBI.

Utiliza o ncbi-genome-download para buscar eficientemente uma ou mais montagens completas de genomas e seus arquivos associados de anotação e relatório no servidor FTP do NCBI, com base em números de acesso, nome de espécie ou ID de montagem.

Entradas

accessions: Path?
NomeTipoDescrição
accessionsPath?Caminho para um arquivo de texto contendo uma lista de números de acesso do NCBI Assembly (um por linha)

Saídas

record (
meta: Record,
gbff: Set<Path?>,
fna: Set<Path?>,
rm: Set<Path?>,
features: Set<Path?>,
gff: Set<Path?>,
faa: Set<Path?>,
gpff: Set<Path?>,
wgs_gbk: Set<Path?>,
cds: Set<Path?>,
rna: Set<Path?>,
rna_fna: Set<Path?>,
report: Set<Path?>,
stats: Set<Path?>,
accessions: Set<Path?>,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro de informações da amostra
gbffSet<Path?>Formato GenBank da(s) sequência(s) genômica(s) (*_genomic.gbff.gz)
fnaSet<Path?>Formato FASTA da(s) sequência(s) nucleotídica(s) genômica(s) (*_genomic.fna.gz)
rmSet<Path?>Saída do RepeatMasker para eucariotos
featuresSet<Path?>Arquivo de texto delimitado por tabulação com localizações e atributos de um subconjunto de features
gffSet<Path?>Anotação da(s) sequência(s) genômica(s) no formato GFF3 (*_genomic.gff.gz)
faaSet<Path?>Formato FASTA dos produtos proteicos acessados (*_protein.faa.gz)
gpffSet<Path?>Formato GenPept dos produtos proteicos acessados
wgs_gbkSet<Path?>Formato de arquivo flat GenBank do master WGS
cdsSet<Path?>Formato FASTA das sequências nucleotídicas correspondentes a todas as features CDS
rnaSet<Path?>Formato FASTA dos produtos de RNA acessados
rna_fnaSet<Path?>Formato FASTA das sequências nucleotídicas correspondentes a todas as features de RNA
reportSet<Path?>Arquivo de texto delimitado por tabulação com nomes, funções e relações das unidades de montagem
statsSet<Path?>Arquivo de texto delimitado por tabulação com estatísticas de montagem
accessionsSet<Path?>Arquivos de lista de acesso gerados
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log específicos do programa (opcionais)
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros do NCBI Genome Download

ParâmetroTipoPadrãoDescrição
--speciesstringNome da espécie para baixar as montagens
--accessionstringUm número de acesso do NCBI Assembly a ser baixado
--accessionsstringUm arquivo de números de acesso do NCBI Assembly (um por linha) a serem baixados
--formatstringfastaLista de formatos a baixar, separados por vírgula
--sectionstringrefseqSeção do NCBI para download
--assembly_levelstringcompleteLista de níveis de montagem a baixar, separados por vírgula
--kingdomstringbacteriaLista de reinos para download, separados por vírgula
--limitstringLimitar o número de montagens a serem baixadas
--keep_downloadsbooleanfalseSalvar os arquivos baixados na pasta bactopia-runs

Usado Por

Subworkflows

Workflows

  • fastani - Cálculo rápido sem alinhamento da Identidade Nucleotídica Média (ANI) de genomas completos.
  • mashtree - Construção rápida de árvores filogenéticas usando distâncias Mash.
  • pangenome - Análise de pan-genoma com filogenia opcional do genoma core.
  • snippy - Chamada rápida de variantes haplóides e alinhamento do genoma core.

Citações

Se você utilizar esta ferramenta em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

NCBIGENOMEDOWNLOAD:
- ncbi-genome-download: 0.3.3