csvtk_concat
Tags: utility table merge concat csv tsv csvtk run-scope
Concatenar múltiplos arquivos CSV ou TSV em uma única tabela.
Utiliza o csvtk concat para mesclar uma lista de arquivos delimitados por linha. Ele gerencia o processamento de cabeçalhos (mantendo apenas um cabeçalho) e suporta conversão de formato (por exemplo, mesclando CSVs mas gerando um TSV como saída).
Entradas
record (
meta: Record,
csv: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro Groovy contendo informações da amostra |
csv | Set<Path> | Uma lista de arquivos CSV/TSV a serem concatenados |
in_format: String
out_format: String
| Nome | Tipo | Descrição |
|---|---|---|
in_format | String | String de formato de entrada ('csv', 'tsv', ou um caractere delimitador específico) |
out_format | String | String de formato de saída ('csv', 'tsv', ou um caractere delimitador específico) |
Saídas
record (
meta: Record,
csv: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Registro de informações da amostra |
csv | Path | Resultados concatenados de todas as amostras no formato de saída especificado |
results | Set<Path> | Todos os arquivos de saída a serem publicados |
logs | Set<Path?> | Arquivos de log opcionais específicos do programa |
nf_logs | Set<Path> | Arquivos de log específicos do Nextflow (ex.: .command.{begin |
versions | Set<Path> | Um arquivo formatado em YAML com as versões dos programas |
Parâmetros
Parâmetros do csvtk concat
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--csvtk_concat_opts | string | Opções extras do csvtk concat entre aspas |
Usado Por
Subworkflows
- abritamr - Identificar genes de resistência antimicrobiana usando AMRFinderPlus.
- agrvate - Identificar o tipo de locus agr e variantes do operon em Staphylococcus aureus.
- amrfinderplus - Encontrar genes de resistência antimicrobiana e mutações pontuais.
- ariba - Identificar genes rapidamente criando montagens locais a partir de reads pareados.
- bactopia_assembler - Montar genomas bacterianos usando seleção automatizada de montador.
- bactopia_gather - Pesquisar, validar, reunir e padronizar amostras de entrada.
- blastn - Pesquisar em um banco de dados de nucleotídeos usando sequências de consulta de nucleotídeos.
- blastp - Pesquisar sequências de proteínas em banco de dados de proteínas.
- blastx - Traduzir sequências de nucleotídeos e pesquisar em banco de dados de proteínas.
- bracken - Estimar a abundância de espécies a partir de reads metagenômicos.
- btyper3 - Classificação taxonômica in silico de genomas do grupo Bacillus cereus.
- busco - Avaliar a completude da montagem de genoma usando BUSCO.
- checkm - Avaliar a completude de bins metagenômicos usando CheckM.
- checkm2 - Avaliar a completude de bins metagenômicos usando CheckM2.
- clermontyping - Prever filogrupos de Escherichia coli a partir de montagens de genoma.
- defensefinder - Pesquisar sistematicamente sistemas de defesa anti-fago.
- ectyper - Predição in silico do sorotipo de Escherichia coli.
- emmtyper - Prever tipos emm de Streptococcus pyogenes a partir de montagens de genoma.
- fastani - Calcular a Identidade Nucleotídica Média (ANI) entre genomas.
- gamma - Avaliação Microbiana de Alelos e Mutações Gênicas.
- genotyphi - Atribuir genótipos a genomas de Salmonella Typhi.
- gigatyper - Executar todos os esquemas MLST disponíveis para uma espécie contra uma montagem.
- gtdb - Classificação taxonômica com o Genome Taxonomy Database.
- hicap - Sorotipagem in silico do locus capsular de Haemophilus influenzae.
- hpsuissero - Sorotipagem rápida de Haemophilus parasuis.
- kleborate - Ferramenta de genotipagem para Klebsiella pneumoniae e seu complexo de espécies relacionadas.
- legsta - Tipagem baseada em sequência de Legionella pneumophila in silico.
- lissero - Predição in silico de sorotipo para Listeria monocytogenes.
- mashdist - Calcular distâncias Mash entre sequências e uma referência.
- mcroni - Scripts para encontrar e processar variantes de promotor a montante de mcr-1.
- meningotype - Prever sorotipos de Neisseria meningitidis a partir de montagens de genoma.
- midas - Perfil de espécies a partir de dados metagenômicos.
- mlst - Determinar tipos de sequência multilocus (MLST) a partir de montagens bacterianas.
- mobsuite - Reconstruir e tipar plasmídeos a partir de montagens de genoma bacteriano.
- mykrobe - Prever resistência a antibióticos a partir de reads de sequenciamento.
- ngmaster - Realizar tipagem de sequência multi-antígeno de Neisseria gonorrhoeae a partir de montagens de genoma.
- pasty - Prever sorogrupos de Pseudomonas aeruginosa a partir de montagens.
- pbptyper - Prever tipos de proteína de ligação à penicilina (PBP) de Streptococcus pneumoniae a partir de montagens de genoma.
- phispy - Predição de profagos em genomas bacterianos.
- plasmidfinder - Identificar replicons de plasmídeos em montagens de genoma bacteriano.
- quast - Avaliar a qualidade da montagem usando QUAST.
- rgi - Prever resistência antimicrobiana a partir de dados de proteína ou nucleotídeo.
- sccmec - Identificar elementos SCCmec em genomas de Staphylococcus aureus.
- scrubber - Remover sequências contaminantes de dados metagenômicos.
- seqsero2 - Prever sorotipos de Salmonella a partir de montagens de genoma.
- seroba - Pipeline baseado em k-mer para identificar o sorotipo de Streptococcus pneumoniae.
- shigapass - Prever sorotipos de Shigella a partir de montagens.
- shigatyper - Prever sorotipos de Shigella a partir de reads ou montagens.
- shigeifinder - Prever sorotipos de Shigella e EIEC a partir de montagens.
- sistr - Ferramenta de linha de comando do Salmonella In Silico Typing Resource.
- spatyper - Prever tipos spa de Staphylococcus aureus a partir de montagens de genoma.
- ssuissero - Prever sorotipos de Streptococcus suis a partir de montagens de genoma.
- staphopiasccmec - Identificar elementos SCCmec em genomas de Staphylococcus aureus usando o método Staphopia.
- staphscan - Análise de vigilância baseada em genoma de Staphylococcus aureus.
- stecfinder - Identificar e sorotipificar E. coli produtora de toxina Shiga (STEC) a partir de montagens.
- sylph - Perfil da composição microbiana usando Sylph.
- tblastn - Pesquisar sequências de consulta de proteína em banco de dados de nucleotídeos.
- tblastx - Traduzir sequências de consulta de nucleotídeos e pesquisar em banco de dados de nucleotídeos.
- teton - Realizar classificação taxonômica e estimar tamanhos de genoma bacteriano.
- traitar - Prever características fenotípicas a partir de genomas microbianos.
Workflows
- abritamr - Uma ferramenta acreditada pela NATA para reportar a presença de genes de resistência antimicrobiana.
- agrvate - Identificação rápida do tipo de locus agr e variantes do operon agr em Staphylococcus aureus.
- amrfinderplus - Bactopia Tool: Amrfinderplus.
- ariba - Identificação de genes por meio de montagens locais.
- bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
- blastn - Pesquisar em bancos de dados BLAST de nucleotídeos usando consultas de nucleotídeos.
- blastp - Pesquisar em bancos de dados BLAST de proteínas usando consultas de proteínas.
- blastx - Pesquisar em bancos de dados BLAST de proteínas usando consultas de nucleotídeos traduzidos.
- bracken - Estimar a abundância taxonômica de amostras metagenômicas.
- btyper3 - Classificação taxonômica de isolados do grupo Bacillus cereus.
- busco - Avaliação da completude da montagem de genoma usando expectativas evolutivamente informadas.
- checkm - Avaliação da qualidade da montagem de genoma microbiano.
- checkm2 - Avaliação baseada em aprendizado de máquina da qualidade da montagem de genoma microbiano.
- cleanyerreads - Controle de qualidade e remoção opcional de reads do hospedeiro a partir de reads de sequenciamento brutos.
- clermontyping - Filogerotipagem in silico do gênero Escherichia.
- defensefinder - Identificação sistemática de sistemas de defesa anti-fago.
- ectyper - Predição in silico do sorotipo de Escherichia coli.
- emmtyper - Tipagem emm de montagens de Streptococcus pyogenes.
- fastani - Cálculo rápido sem alinhamento da Identidade Nucleotídica Média de genoma completo.
- gamma - Identificação, classificação e anotação de correspondências de genes traduzidos.
- genotyphi - Genotipagem de Salmonella Typhi com atribuição de linhagem.
- gigatyper - Executar todos os esquemas MLST disponíveis para uma espécie contra uma montagem.
- gtdb - Identificar genes marcadores e atribuir classificações taxonômicas usando GTDB.
- hicap - Identificar sorotipo e estrutura do locus cap em montagens de Haemophilus influenzae.
- hpsuissero - Predição de sorotipo de montagens de Haemophilus parasuis.
- kleborate - Triagem abrangente de genomas de Klebsiella para determinantes de virulência e resistência.
- legsta - Tipagem Baseada em Sequência (SBT) de Legionella pneumophila.
- lissero - Predição de tipagem de sorogrupo para Listeria monocytogenes.
- mashdist - Calcular distâncias Mash entre sequências e genomas de referência.
- mcroni - Análise de variação de sequência de genes mcr-1 (resistência a colistina mobilizada).
- meningotype - Tipagem abrangente de Neisseria meningitidis.
- midas - Estimar abundâncias de espécies a partir de amostras metagenômicas.
- mlst - Chamada automática de Tipo de Sequência Multi-Locus (MLST) a partir de contigs montados.
- mobsuite - Reconstrução e anotação de plasmídeos a partir de montagens de genoma bacteriano.
- mykrobe - Detecção de resistência antimicrobiana para espécies bacterianas específicas.
- ngmaster - Tipagem de sequência multi-antígeno de Neisseria gonorrhoeae.
- pasty - Soroagrupamento in silico de isolados de Pseudomonas aeruginosa.
- pbptyper - Tipagem de Proteína de Ligação à Penicilina (PBP) para Streptococcus pneumoniae.
- phispy - Predição de profagos em genomas bacterianos e arqueais.
- plasmidfinder - Bactopia Tool: Plasmidfinder.
- quast - Avaliação da qualidade de contigs montados usando QUAST.
- rgi - Predição de genes de resistência a antibióticos usando RGI.
- sccmec - Tipagem de cassetes SCCmec em montagens de Staphylococcus aureus.
- scrubber - Remoção de sequências humanas e contaminantes de reads metagenômicos.
- seqsero2 - Predição de sorotipo de Salmonella a partir de reads de sequenciamento ou montagens.
- seroba - Sorotipagem de Streptococcus pneumoniae a partir de reads Illumina pareados.
- shigapass - Predição de sorotipos de Shigella e diferenciação de EIEC.
- shigatyper - Determinação rápida de sorotipos de Shigella a partir de reads de sequenciamento.
- shigeifinder - Predição in silico de sorotipo para Shigella e E. coli Enteroinvasiva (EIEC).
- sistr - Predição de serovar de Salmonella enterica a partir de montagens.
- spatyper - Tipagem spa de montagens de Staphylococcus aureus.
- ssuissero - Predição de sorotipo de montagens de Streptococcus suis.
- staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.
- staphscan - Análise de vigilância baseada em genoma de Staphylococcus aureus.
- stecfinder - Identificação de sorotipo de E. coli produtora de toxina Shiga.
- sylph - Perfil taxonômico por MinHash com correção de abundância.
- tblastn - Pesquisar em bancos de dados de nucleotídeos traduzidos usando consultas de proteínas.
- tblastx - Pesquisar em bancos de dados de nucleotídeos traduzidos usando consultas de nucleotídeos traduzidos.
- teton - Classificação taxonômica e perfil de abundância de reads metagenômicos.
- traitar - Prever características fenotípicas a partir de genomas microbianos.
Citações
Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
csvtk
Shen, W csvtk: A cross-platform, efficient and practical CSV/TSV toolkit in Golang. (GitHub)
Fonte
Versão
CSVTK_CONCAT:
- csvtk: 0.31.0