bactopia_assembler
Tags: bacteria assembly hybrid shovill dragonflye unicycler illumina nanopore sample-scope
Monte genomas bacterianos usando estratégias de reads curtos, reads longos ou híbridos.
Seleciona automaticamente o montador apropriado com base nos tipos de reads de entrada:
- Reads Paired-End Curtos: Usa Shovill (wrapper SKESA/SPAdes).
- Reads Single-End Curtos: Usa Shovill (wrapper SKESA/SPAdes).
- Reads Longos: Usa Dragonflye (wrapper Flye/Miniasm).
- Híbrido: Usa Unicycler ou Dragonflye (com polimento).
Estatísticas resumidas de cada montagem são geradas usando assembly-scan.
Usa entrada de registro nomeado com slots de reads explícitos (r1, r2, se, lr, assembly) como Path?.
a montagem original é usada sem remontagem.
Entradas
record (
meta: Record,
r1: Path?,
r2: Path?,
se: Path?,
lr: Path?,
fna: Path?
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro Groovy contendo informações da amostra |
r1 | Path? | Reads Illumina R1 (paired-end) |
r2 | Path? | Reads Illumina R2 (paired-end) |
se | Path? | Reads Illumina single-end |
lr | Path? | Reads longos (ONT/PacBio) para montagem de reads longos ou híbrida |
fna | Path? | Arquivo de montagem (FASTA) para runtypes baseados em montagem |
Saídas
record (
meta: Record,
fna: Path?,
r1: Path?,
r2: Path?,
se: Path?,
lr: Path?,
tsv: Path?,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro de informações da amostra |
fna | Path? | Contigs montados em formato FASTA |
r1 | Path? | Reads Illumina R1 passados adiante |
r2 | Path? | Reads Illumina R2 passados adiante |
se | Path? | Reads single-end passados adiante |
lr | Path? | Reads longos passados adiante |
tsv | Path? | Relatório delimitado por tabulação das estatísticas de montagem (N50, comprimento, cobertura) |
results | Set<Path> | Todos os arquivos de saída a serem publicados |
logs | Set<Path?> | Arquivos de log opcionais específicos do programa |
nf_logs | Set<Path> | Arquivos de log específicos do Nextflow (ex.: .command.{begin |
versions | Set<Path> | Arquivo formatado em YAML com as versões dos programas |
Parâmetros
Parâmetros do Montador
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--shovill_assembler | string | skesa | Montador a ser usado pelo Shovill (opções: skesa, megahit, spades, velvet) |
--dragonflye_assembler | string | flye | Montador a ser usado pelo Dragonflye (opções: flye, miniasm, raven) |
--use_unicycler | boolean | Usar Unicycler para montagem paired-end | |
--min_contig_len | integer | 500 | Comprimento mínimo do contig <0=AUTO> |
--min_contig_cov | integer | 2 | Cobertura mínima do contig <0=AUTO> |
--contig_namefmt | string | Formato dos IDs FASTA dos contigs no estilo 'printf' | |
--shovill_opts | string | Opções extras do montador entre aspas para Shovill | |
--shovill_kmers | string | K-mers a utilizar <em branco=AUTO> | |
--dragonflye_opts | string | Opções extras do montador entre aspas para Dragonflye | |
--trim | boolean | Habilitar trimagem de adaptadores | |
--no_stitch | boolean | Desabilitar costura de reads para reads paired-end | |
--no_corr | boolean | Desabilitar correção pós-montagem | |
--unicycler_mode | string | normal | Modo de bridging usado pelo Unicycler (opções: conservative, normal, bold) |
--min_component_size | integer | 1000 | Extremidades mortas do grafo menores que este tamanho (bp) serão removidas do grafo final |
--min_dead_end_size | integer | 1000 | Extremidades mortas do grafo menores que este tamanho (bp) serão removidas do grafo final |
--nanohq | boolean | false | Para Flye, usar '--nano-hq' em vez de --nano-raw |
--medaka_model | string | O modelo a ser usado para polimento com Medaka | |
--medaka_rounds | integer | 0 | O número de rodadas de polimento com Medaka a realizar |
--racon_rounds | integer | 1 | O número de rodadas de polimento com Racon a realizar |
--no_polish | boolean | Pular a etapa de polimento da montagem | |
--no_miniasm | boolean | Pular o bridging miniasm+Racon | |
--no_rotate | boolean | Não rotacionar replicons completos para iniciar em um gene padrão | |
--reassemble | boolean | false | Se os reads foram simulados, eles serão usados para criar uma nova montagem. |
--polypolish_rounds | integer | 1 | Número de rodadas de polimento com Polypolish para polimento com reads curtos |
--pilon_rounds | integer | 0 | Número de rodadas de polimento com Pilon para polimento com reads curtos |
Usado Por
Subworkflows
- bactopia_assembler - Monte genomas bacterianos usando seleção automatizada de montador.
Workflows
- bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
- staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.
Citações
Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
any2fasta
Seemann T any2fasta: Convert various sequence formats to FASTA (GitHub) -
assembly-scan
Petit III RA assembly-scan: generate basic stats for an assembly (GitHub) -
BWA
Li H Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv [q-bio.GN] (2013) -
Dragonflye
Petit III RA Dragonflye: Assemble bacterial isolate genomes from Nanopore reads. (GitHub) -
FLASH
Magoč T, Salzberg SL FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinformatics 27.21 2957-2963 (2011) -
Flye
Kolmogorov M, Yuan J, Lin Y, Pevzner P Assembly of Long Error-Prone Reads Using Repeat Graphs Nature Biotechnology (2019) -
Medaka
ONT Research Medaka: Sequence correction provided by ONT Research (GitHub) -
MEGAHIT
Li D, Liu C-M, Luo R, Sadakane K, Lam T-W MEGAHIT: an ultra-fast single-node solution for large and complex metagenomics assembly via succinct de Bruijn graph. Bioinformatics 31.10 1674-1676 (2015) -
Miniasm
Li H Miniasm: Ultrafast de novo assembly for long noisy reads (GitHub) -
Minimap2
Li H Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics 34:3094-3100 (2018) -
Nanoq
Steinig E Nanoq: Minimal but speedy controle de qualidade for nanopore reads in Rust (GitHub) -
Pigz
Adler M. pigz: A parallel implementation of gzip for modern multi-processor, multi-core machines. Jet Propulsion Laboratory (2015) -
Pilon
Walker BJ, Abeel T, Shea T, Priest M, Abouelliel A, Sakthikumar S, Cuomo CA, Zeng Q, Wortman J, Young SK, Earl AM Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement. PloS one 9.11 e112963 (2014) -
Racon
Vaser R, Sović I, Nagarajan N, Šikić M Fast and accurate de novo genome assembly from long uncorrected reads. Genome Res 27, 737-746 (2017) -
Rasusa
Hall MB Rasusa: Randomly subsample sequencing reads to a specified coverage. (2019). -
Raven
Vaser R, Šikić M Time- and memory-efficient genome assembly with Raven. Nat Comput Sci 1, 332-336 (2021) -
samclip
Seemann T Samclip: Filter SAM file for soft and hard clipped alignments (GitHub) -
Samtools
Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R The Sequence Alignment/Map format and SAMtools. Bioinformatics 25, 2078-2079 (2009) -
Shovill
Seemann T Shovill: De novo assembly pipeline for Illumina paired reads (GitHub) -
Shovill-SE
Petit III RA Shovill-SE: A fork of Shovill that includes support for single end reads. (GitHub) -
SKESA
Souvorov A, Agarwala R, Lipman DJ SKESA: strategic k-mer extension for scrupulous assemblies. Genome Biology 19:153 (2018) -
SPAdes
Bankevich A, Nurk S, Antipov D, Gurevich AA, Dvorkin M, Kulikov AS, Lesin VM, Nikolenko SI, Pham S, Prjibelski AD, Pyshkin AV, Sirotkin AV, Vyahhi N, Tesler G, Alekseyev MA, Pevzner PA SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of computational biology 19.5 455-477 (2012) -
Unicycler
Wick RR, Judd LM, Gorrie CL, Holt KE Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads. PLoS Comput. Biol. 13, e1005595 (2017) -
Velvet
Zerbino DR, Birney E Velvet: algorithms for de novo short read assembly using de Bruijn graphs. Genome research 18.5 821-829 (2008)
Fonte
Versão
BACTOPIA_ASSEMBLER:
- bactopia-assembler: 1.0.5