Pular para o conteúdo principal

panaroo_run

Tags: pan-genoma orthologs core-genome gene-presence-absence graph-based annotation run-scope

Análise rápida e escalável de pangenoma bacteriano usando uma abordagem baseada em grafos.

Utiliza o Panaroo para agrupar genes de múltiplos genomas bacterianos anotados em grupos ortólogos, corrigindo divisões e fusões de genes. As saídas principais são a matriz de presença/ausência de genes (o pan-genoma) e um alinhamento do genoma central (para filogenética).

Entradas

record (
meta: Record,
gff: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
gffSet<Path>Lista de arquivos de genoma anotado no formato GFF3 (entrada obrigatória)

Saídas

record (
meta: Record,
aln: Path?,
filtered_aln: Path?,
csv: Path?,
panaroo_csv: Path?,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro com informações da amostra
alnPath?O alinhamento do genoma central (*core-genome.aln.gz), adequado para construção de árvore filogenética
filtered_alnPath?O alinhamento do genoma central com regiões altamente recombinantes filtradas
csvPath?Matriz de presença/ausência de genes no formato CSV compatível com Roary
panaroo_csvPath?Matriz de presença/ausência de genes no formato CSV nativo do Panaroo
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Arquivo no formato YAML com as versões dos programas

Parâmetros

Parâmetros do Panaroo Run

ParâmetroTipoPadrãoDescrição
--panaroo_modestringstrictO modo de rigor para executar o panaroo (opções: strict, moderate, sensitive)
--panaroo_alignmentstringcoreGera alinhamentos de genes centrais ou de todos os genes (opções: core, pan)
--panaroo_alignerstringmafftAlinhador a ser usado para o alinhamento do genoma central/pan (opções: mafft, prank, clustal)
--panaroo_core_thresholdnumber0.95Limiar de amostras do genoma central
--panaroo_thresholdnumber0.98Limiar de identidade de sequência
--panaroo_family_thresholdnumber0.7Limiar de identidade de sequência da família proteica
--panaroo_len_dif_percentnumber0.98Corte de diferença de comprimento
--panaroo_merge_paralogsbooleanfalseNão dividir parálogos
--panaroo_optsstringOpções adicionais para passar ao panaroo

Usado Por

Subworkflows

  • panaroo - Constrói um pan-genoma a partir de anotações GFF3 usando Panaroo.

Citações

Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

PANAROO_RUN:
- panaroo: 1.6.0