blastp
Tags: blast protein alignment database sample-scope
Busca sequências de proteínas em banco de dados de proteínas.
Este subworkflow utiliza o BLASTP do pacote NCBI BLAST+ para buscar sequências de proteínas em um banco de dados de proteínas. Ele processa cada montagem individualmente e agrega os resultados em um único relatório consolidado.
Take
blastdb: Channel<Record>
| Campo | Descrição |
|---|---|
meta | Registro Groovy contendo informações da amostra |
blastdb | Um tarball comprimido contendo o banco de dados BLAST |
query: Path
| Nome | Tipo | Descrição |
|---|---|---|
query | Path | Caminho para o banco de dados de proteínas para busca contra sequências traduzidas |
Emit
Publicados
As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.
sample_outputs
| Saída | Descrição |
|---|---|
tsv | Um resumo delimitado por tabulação dos alinhamentos (BLAST outfmt 6 padrão) |
run_outputs
| Saída | Descrição |
|---|---|
csv | Resultados agregados em formato CSV |
Composição de Módulos
Este subworkflow chama os seguintes módulos:
- blast_blastp - Busca em um banco de dados de proteínas usando uma consulta de proteína.
- csvtk_concat - Concatena múltiplos arquivos CSV ou TSV em uma única tabela.
Usado Por
Este subworkflow é utilizado pelos seguintes fluxos de trabalho:
- blastp - Busca em bancos de dados BLAST de proteínas usando consultas de proteínas.
Citações
Se você utilizar este módulo em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
BLAST
Camacho C, Coulouris G, Avagyan V, Ma N, Papadopoulos J, Bealer K, Madden TL BLAST+: architecture and applications. BMC Bioinformatics 10, 421 (2009)