Pular para o conteúdo principal

csvtk_concat

Tags: utility table merge concat csv tsv csvtk run-scope

Concatenar múltiplos arquivos CSV ou TSV em uma única tabela.

Utiliza o csvtk concat para mesclar uma lista de arquivos delimitados por linha. Ele gerencia o processamento de cabeçalhos (mantendo apenas um cabeçalho) e suporta conversão de formato (por exemplo, mesclando CSVs mas gerando um TSV como saída).

Entradas

record (
meta: Record,
csv: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro Groovy contendo informações da amostra
csvSet<Path>Uma lista de arquivos CSV/TSV a serem concatenados
in_format: String
out_format: String
NomeTipoDescrição
in_formatStringString de formato de entrada ('csv', 'tsv', ou um caractere delimitador específico)
out_formatStringString de formato de saída ('csv', 'tsv', ou um caractere delimitador específico)

Saídas

record (
meta: Record,
csv: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
CampoTipoDescrição
metaRecordRegistro de informações da amostra
csvPathResultados concatenados de todas as amostras no formato de saída especificado
resultsSet<Path>Todos os arquivos de saída a serem publicados
logsSet<Path?>Arquivos de log opcionais específicos do programa
nf_logsSet<Path>Arquivos de log específicos do Nextflow (ex.: .command.{begin
versionsSet<Path>Um arquivo formatado em YAML com as versões dos programas

Parâmetros

Parâmetros do csvtk concat

ParâmetroTipoPadrãoDescrição
--csvtk_concat_optsstringOpções extras do csvtk concat entre aspas

Usado Por

Subworkflows

  • abritamr - Identificar genes de resistência antimicrobiana usando AMRFinderPlus.
  • agrvate - Identificar o tipo de locus agr e variantes do operon em Staphylococcus aureus.
  • amrfinderplus - Encontrar genes de resistência antimicrobiana e mutações pontuais.
  • ariba - Identificar genes rapidamente criando montagens locais a partir de reads pareados.
  • bactopia_assembler - Montar genomas bacterianos usando seleção automatizada de montador.
  • bactopia_gather - Pesquisar, validar, reunir e padronizar amostras de entrada.
  • blastn - Pesquisar em um banco de dados de nucleotídeos usando sequências de consulta de nucleotídeos.
  • blastp - Pesquisar sequências de proteínas em banco de dados de proteínas.
  • blastx - Traduzir sequências de nucleotídeos e pesquisar em banco de dados de proteínas.
  • bracken - Estimar a abundância de espécies a partir de reads metagenômicos.
  • btyper3 - Classificação taxonômica in silico de genomas do grupo Bacillus cereus.
  • busco - Avaliar a completude da montagem de genoma usando BUSCO.
  • checkm - Avaliar a completude de bins metagenômicos usando CheckM.
  • checkm2 - Avaliar a completude de bins metagenômicos usando CheckM2.
  • clermontyping - Prever filogrupos de Escherichia coli a partir de montagens de genoma.
  • defensefinder - Pesquisar sistematicamente sistemas de defesa anti-fago.
  • ectyper - Predição in silico do sorotipo de Escherichia coli.
  • emmtyper - Prever tipos emm de Streptococcus pyogenes a partir de montagens de genoma.
  • fastani - Calcular a Identidade Nucleotídica Média (ANI) entre genomas.
  • gamma - Avaliação Microbiana de Alelos e Mutações Gênicas.
  • genotyphi - Atribuir genótipos a genomas de Salmonella Typhi.
  • gigatyper - Executar todos os esquemas MLST disponíveis para uma espécie contra uma montagem.
  • gtdb - Classificação taxonômica com o Genome Taxonomy Database.
  • hicap - Sorotipagem in silico do locus capsular de Haemophilus influenzae.
  • hpsuissero - Sorotipagem rápida de Haemophilus parasuis.
  • kleborate - Ferramenta de genotipagem para Klebsiella pneumoniae e seu complexo de espécies relacionadas.
  • legsta - Tipagem baseada em sequência de Legionella pneumophila in silico.
  • lissero - Predição in silico de sorotipo para Listeria monocytogenes.
  • mashdist - Calcular distâncias Mash entre sequências e uma referência.
  • mcroni - Scripts para encontrar e processar variantes de promotor a montante de mcr-1.
  • meningotype - Prever sorotipos de Neisseria meningitidis a partir de montagens de genoma.
  • midas - Perfil de espécies a partir de dados metagenômicos.
  • mlst - Determinar tipos de sequência multilocus (MLST) a partir de montagens bacterianas.
  • mobsuite - Reconstruir e tipar plasmídeos a partir de montagens de genoma bacteriano.
  • mykrobe - Prever resistência a antibióticos a partir de reads de sequenciamento.
  • ngmaster - Realizar tipagem de sequência multi-antígeno de Neisseria gonorrhoeae a partir de montagens de genoma.
  • pasty - Prever sorogrupos de Pseudomonas aeruginosa a partir de montagens.
  • pbptyper - Prever tipos de proteína de ligação à penicilina (PBP) de Streptococcus pneumoniae a partir de montagens de genoma.
  • phispy - Predição de profagos em genomas bacterianos.
  • plasmidfinder - Identificar replicons de plasmídeos em montagens de genoma bacteriano.
  • quast - Avaliar a qualidade da montagem usando QUAST.
  • rgi - Prever resistência antimicrobiana a partir de dados de proteína ou nucleotídeo.
  • sccmec - Identificar elementos SCCmec em genomas de Staphylococcus aureus.
  • scrubber - Remover sequências contaminantes de dados metagenômicos.
  • seqsero2 - Prever sorotipos de Salmonella a partir de montagens de genoma.
  • seroba - Pipeline baseado em k-mer para identificar o sorotipo de Streptococcus pneumoniae.
  • shigapass - Prever sorotipos de Shigella a partir de montagens.
  • shigatyper - Prever sorotipos de Shigella a partir de reads ou montagens.
  • shigeifinder - Prever sorotipos de Shigella e EIEC a partir de montagens.
  • sistr - Ferramenta de linha de comando do Salmonella In Silico Typing Resource.
  • spatyper - Prever tipos spa de Staphylococcus aureus a partir de montagens de genoma.
  • ssuissero - Prever sorotipos de Streptococcus suis a partir de montagens de genoma.
  • staphopiasccmec - Identificar elementos SCCmec em genomas de Staphylococcus aureus usando o método Staphopia.
  • staphscan - Análise de vigilância baseada em genoma de Staphylococcus aureus.
  • stecfinder - Identificar e sorotipificar E. coli produtora de toxina Shiga (STEC) a partir de montagens.
  • sylph - Perfil da composição microbiana usando Sylph.
  • tblastn - Pesquisar sequências de consulta de proteína em banco de dados de nucleotídeos.
  • tblastx - Traduzir sequências de consulta de nucleotídeos e pesquisar em banco de dados de nucleotídeos.
  • teton - Realizar classificação taxonômica e estimar tamanhos de genoma bacteriano.
  • traitar - Prever características fenotípicas a partir de genomas microbianos.

Workflows

  • abritamr - Uma ferramenta acreditada pela NATA para reportar a presença de genes de resistência antimicrobiana.
  • agrvate - Identificação rápida do tipo de locus agr e variantes do operon agr em Staphylococcus aureus.
  • amrfinderplus - Bactopia Tool: Amrfinderplus.
  • ariba - Identificação de genes por meio de montagens locais.
  • bactopia - Pipeline abrangente de análise bacteriana para caracterização genômica completa.
  • blastn - Pesquisar em bancos de dados BLAST de nucleotídeos usando consultas de nucleotídeos.
  • blastp - Pesquisar em bancos de dados BLAST de proteínas usando consultas de proteínas.
  • blastx - Pesquisar em bancos de dados BLAST de proteínas usando consultas de nucleotídeos traduzidos.
  • bracken - Estimar a abundância taxonômica de amostras metagenômicas.
  • btyper3 - Classificação taxonômica de isolados do grupo Bacillus cereus.
  • busco - Avaliação da completude da montagem de genoma usando expectativas evolutivamente informadas.
  • checkm - Avaliação da qualidade da montagem de genoma microbiano.
  • checkm2 - Avaliação baseada em aprendizado de máquina da qualidade da montagem de genoma microbiano.
  • cleanyerreads - Controle de qualidade e remoção opcional de reads do hospedeiro a partir de reads de sequenciamento brutos.
  • clermontyping - Filogerotipagem in silico do gênero Escherichia.
  • defensefinder - Identificação sistemática de sistemas de defesa anti-fago.
  • ectyper - Predição in silico do sorotipo de Escherichia coli.
  • emmtyper - Tipagem emm de montagens de Streptococcus pyogenes.
  • fastani - Cálculo rápido sem alinhamento da Identidade Nucleotídica Média de genoma completo.
  • gamma - Identificação, classificação e anotação de correspondências de genes traduzidos.
  • genotyphi - Genotipagem de Salmonella Typhi com atribuição de linhagem.
  • gigatyper - Executar todos os esquemas MLST disponíveis para uma espécie contra uma montagem.
  • gtdb - Identificar genes marcadores e atribuir classificações taxonômicas usando GTDB.
  • hicap - Identificar sorotipo e estrutura do locus cap em montagens de Haemophilus influenzae.
  • hpsuissero - Predição de sorotipo de montagens de Haemophilus parasuis.
  • kleborate - Triagem abrangente de genomas de Klebsiella para determinantes de virulência e resistência.
  • legsta - Tipagem Baseada em Sequência (SBT) de Legionella pneumophila.
  • lissero - Predição de tipagem de sorogrupo para Listeria monocytogenes.
  • mashdist - Calcular distâncias Mash entre sequências e genomas de referência.
  • mcroni - Análise de variação de sequência de genes mcr-1 (resistência a colistina mobilizada).
  • meningotype - Tipagem abrangente de Neisseria meningitidis.
  • midas - Estimar abundâncias de espécies a partir de amostras metagenômicas.
  • mlst - Chamada automática de Tipo de Sequência Multi-Locus (MLST) a partir de contigs montados.
  • mobsuite - Reconstrução e anotação de plasmídeos a partir de montagens de genoma bacteriano.
  • mykrobe - Detecção de resistência antimicrobiana para espécies bacterianas específicas.
  • ngmaster - Tipagem de sequência multi-antígeno de Neisseria gonorrhoeae.
  • pasty - Soroagrupamento in silico de isolados de Pseudomonas aeruginosa.
  • pbptyper - Tipagem de Proteína de Ligação à Penicilina (PBP) para Streptococcus pneumoniae.
  • phispy - Predição de profagos em genomas bacterianos e arqueais.
  • plasmidfinder - Bactopia Tool: Plasmidfinder.
  • quast - Avaliação da qualidade de contigs montados usando QUAST.
  • rgi - Predição de genes de resistência a antibióticos usando RGI.
  • sccmec - Tipagem de cassetes SCCmec em montagens de Staphylococcus aureus.
  • scrubber - Remoção de sequências humanas e contaminantes de reads metagenômicos.
  • seqsero2 - Predição de sorotipo de Salmonella a partir de reads de sequenciamento ou montagens.
  • seroba - Sorotipagem de Streptococcus pneumoniae a partir de reads Illumina pareados.
  • shigapass - Predição de sorotipos de Shigella e diferenciação de EIEC.
  • shigatyper - Determinação rápida de sorotipos de Shigella a partir de reads de sequenciamento.
  • shigeifinder - Predição in silico de sorotipo para Shigella e E. coli Enteroinvasiva (EIEC).
  • sistr - Predição de serovar de Salmonella enterica a partir de montagens.
  • spatyper - Tipagem spa de montagens de Staphylococcus aureus.
  • ssuissero - Predição de sorotipo de montagens de Streptococcus suis.
  • staphopia - Pipeline de análise abrangente para isolados de Staphylococcus aureus.
  • staphscan - Análise de vigilância baseada em genoma de Staphylococcus aureus.
  • stecfinder - Identificação de sorotipo de E. coli produtora de toxina Shiga.
  • sylph - Perfil taxonômico por MinHash com correção de abundância.
  • tblastn - Pesquisar em bancos de dados de nucleotídeos traduzidos usando consultas de proteínas.
  • tblastx - Pesquisar em bancos de dados de nucleotídeos traduzidos usando consultas de nucleotídeos traduzidos.
  • teton - Classificação taxonômica e perfil de abundância de reads metagenômicos.
  • traitar - Prever características fenotípicas a partir de genomas microbianos.

Citações

Se você usar este módulo em sua análise, por favor cite os seguintes trabalhos.

Fonte

Ver fonte no GitHub

Versão

CSVTK_CONCAT:
- csvtk: 0.31.0