Pular para o conteúdo principal

snippy_run

Tags: variant-calling snp reference-mapping phylogenetics outbreak sample-scope

Chamar variantes contra um genoma de referência usando Snippy.

Este subworkflow realiza chamada de variantes haploides de forma rápida a partir de reads de sequências bacterianas usando Snippy. Ele mapeia reads para um genoma de referência, identifica SNPs e indels, e gera sequências consenso. A ferramenta produz múltiplos formatos de saída, incluindo VCF, FASTA alinhado e variantes anotadas para análise filogenética downstream com snippy-core.

Usa campos de registro posicionais explícitos para reads:

  • Entrada: record(meta, r1, r2, se, lr) onde cada slot de read é Path?

Take

reads: Channel<Record>
CampoDescrição
metaRegistro Groovy contendo informações da amostra
r1Reads Illumina R1 (paired-end)
r2Reads Illumina R2 (paired-end)
seReads Illumina single-end
lrReads longos (ONT/PacBio)
reference: Path
NomeTipoDescrição
referencePathGenoma de referência no formato GenBank (preferido, para anotação) ou formato FASTA

Emit

Publicados

As emissões sample_outputs e run_outputs são agregados de arquivos de saída que serão publicados no fluxo de trabalho de entrada.

sample_outputs

SaídaDescrição
aligned_faUma versão da referência com - nas posições de cobertura zero
vcfAs variantes anotadas finais em formato VCF
aligned_fa_errorArquivo FASTA alinhado gerado durante estado de erro
vcf_errorArquivo VCF gerado durante estado de erro
errorArquivo de texto com log de erro
annotated_vcfArquivo VCF anotado
bamOs alinhamentos em formato BAM (inclui não mapeados/multimapeados)
baiÍndice para o arquivo BAM
bedAs variantes em formato BED
consensus_faGenoma de referência com todas as variantes instanciadas
consensus_subs_faGenoma de referência com apenas variantes de substituição instanciadas
consensus_subs_masked_faGenoma de referência com substituições instanciadas e baixa cobertura mascarada
coverageInformações de profundidade de cobertura por base
csvUm resumo das variantes separado por vírgulas
filt_vcfAs chamadas de variantes filtradas do Freebayes
gffAs variantes em formato GFF3
htmlUm resumo HTML das variantes
raw_vcfAs chamadas de variantes não filtradas do Freebayes
subs_vcfVCF contendo apenas variantes de substituição
tabUm resumo simples de todas as variantes separado por tabulação
txtLista colunar separada por tabulação com estatísticas de alinhamento

run_outputs

Sem saídas no escopo de execução.

Entradas Downstream

As emissões a seguir são destinadas a serem usadas como entradas para subworkflows downstream.

variants

VCFs por amostra e FAs alinhados filtrados para incluir apenas amostras com dados de variantes

Composição de Módulos

Este subworkflow chama os seguintes módulos:

  • snippy_run - Chamada de variantes haploides rápida e alinhamento do genoma core.

Usado Por

Este subworkflow é usado pelos seguintes fluxos de trabalho:

  • snippy - Chamada de variantes haplóides rápida e alinhamento do genoma core.

Citações

Se você usar isso em sua análise, por favor cite o seguinte.

Fonte

Ver fonte no GitHub