checkm2
Tags: metagenome bin completeness contamination mag quality machine-learning sample-scope
Avalie a completude de bins de metagenoma usando CheckM2.
Este subworkflow avalia a qualidade e completude de genomas montados a partir de metagenomas (MAGs) usando o CheckM2. Ele fornece uma avaliação aprimorada por meio de modelos de aprendizado de máquina treinados em genomas de referência de alta qualidade, oferecendo estimativas mais precisas de completude e contaminação. O fluxo de trabalho pode baixar automaticamente o banco de dados necessário ou utilizar um caminho fornecido pelo usuário.
Take
assembly: Channel<Record>
| Campo | Descrição |
|---|---|
meta | Registro Groovy contendo informações da amostra |
assembly | Bins de genomas montados a partir de metagenomas para avaliação. Cada registro contém metadados |
database: Path
download_checkm2: Boolean
| Nome | Tipo | Descrição |
|---|---|---|
database | Path | Caminho para o diretório do banco de dados do CheckM2. Se download_checkm2 for verdadeiro, este pode ser um valor temporário, pois o banco de dados será baixado automaticamente. |
download_checkm2 | Boolean | Flag booleano para baixar automaticamente o banco de dados do CheckM2 se não estiver disponível. Quando verdadeiro, baixa o banco de dados de referência necessário antes da predição. |
Emit
Publicados
As emissões sample_outputs e run_outputs são agregações de arquivos de saída que serão publicados no fluxo de trabalho principal.
sample_outputs
| Saída | Descrição |
|---|---|
tsv | Relatório delimitado por tabulação com métricas de qualidade (Completude, Contaminação) |
supplemental | Diretório contendo arquivos intermediários de proteínas e alinhamentos Diamond |
run_outputs
| Saída | Descrição |
|---|---|
csv | Resultados agregados em formato CSV |
Composição do Módulo
Este subworkflow chama os seguintes módulos:
- csvtk_concat - Concatena múltiplos arquivos CSV ou TSV em uma única tabela.
- checkm2_predict - Avalia a qualidade do genoma usando aprendizado de máquina.
- checkm2_download - Baixa o banco de dados pré-treinado do CheckM2.
Usado Por
Este subworkflow é utilizado pelos seguintes fluxos de trabalho:
- checkm2 - Avaliação baseada em aprendizado de máquina da qualidade de montagem de genomas microbianos.
Citações
Se você usar este fluxo de trabalho em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
CheckM2
Chklovksi A Rapid assessment of genome bin quality using machine learning (GitHub)