blast_tblastn
Tags: blast tblastn alignment translation protein dna search fasta sample-scope
Pesquise um banco de dados de nucleotídeos traduzido usando uma consulta de proteína.
Utiliza o TBLASTN para alinhar sequências de consulta de aminoácidos (FASTA) contra um banco de dados BLAST de nucleotídeos que foi traduzido dinamicamente nos seis quadros de leitura. Isso é útil para encontrar homólogos de genes em DNA genômico não anotado.
Entradas
record (
meta: Record,
blastdb: Path
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro Groovy contendo informações da amostra |
blastdb | Path | Um tarball comprimido contendo o banco de dados BLAST de nucleotídeos |
query: Path
| Nome | Tipo | Descrição |
|---|---|---|
query | Path | Arquivo FASTA contendo sequências de consulta de aminoácidos |
Saídas
record (
meta: Record,
tsv: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro com informações da amostra |
tsv | Path | Resultados de alinhamento proteína-para-nucleotídeo traduzido delimitados por tabulação (BLAST outfmt 6) |
results | Set<Path> | Todos os arquivos de saída a serem publicados |
logs | Set<Path?> | Arquivos de log opcionais específicos do programa |
nf_logs | Set<Path> | Arquivos de log específicos do Nextflow (ex.: .command.{begin |
versions | Set<Path> | Um arquivo formatado em YAML com as versões dos programas |
Parâmetros
Parâmetros do TBLASTN
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--tblastn_query | string | Um arquivo FASTA contendo as sequências de consulta para o BLAST contra o banco de dados | |
--tblastn_outfmt | string | sseqid qseqid pident qlen slen length nident positive mismatch gapopen gaps qstart qend sstart send evalue bitscore | As colunas a incluir com -outfmt 6 |
--tblastn_opts | string | Opções adicionais a passar para o BLASTN | |
--tblastn_qcov_hsp_perc | integer | 50 | Percentual de cobertura da consulta por hsp |
--tblastn_max_target_seqs | integer | 2000 | Número máximo de sequências alinhadas a manter |
--tblastn_use_genes | boolean | false | Realizar BLAST contra sequências de genes em vez de contigs |
Usado Por
Subworkflows
- tblastn - Pesquisa sequências de consulta de proteínas contra banco de dados de nucleotídeos.
Workflows
- tblastn - Pesquisa contra bancos de dados de nucleotídeos traduzidos usando consultas de proteínas.
Citações
Se você usar isso em sua análise, por favor cite o seguinte.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
BLAST
Camacho C, Coulouris G, Avagyan V, Ma N, Papadopoulos J, Bealer K, Madden TL BLAST+: architecture and applications. BMC Bioinformatics 10, 421 (2009)
Fonte
Versão
BLAST_TBLASTN:
- blast: 2.17.0