csvtk_join
Tags: utility table join merge csv tsv csvtk relational run-scope
Une dois arquivos CSV ou TSV com base em campos comuns.
Utiliza o csvtk join para mesclar dois arquivos tabulares horizontalmente, combinando valores em uma coluna-chave especificada (semelhante a um JOIN do SQL). Suporta joins do tipo inner, left, right e outer por meio de argumentos opcionais.
Entradas
record (
meta: Record,
csv1: Path,
csv2: Path
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Record Groovy contendo informações da amostra |
csv1 | Path | O primeiro arquivo CSV/TSV (tabela da esquerda) |
csv2 | Path | O segundo arquivo CSV/TSV (tabela da direita) |
in_format: String
out_format: String
key: String
| Nome | Tipo | Descrição |
|---|---|---|
in_format | String | String de formato de entrada ('csv', 'tsv' ou um caractere delimitador específico) |
out_format | String | String de formato de saída ('csv', 'tsv' ou um caractere delimitador específico) |
key | String | Nome(s) ou índice(s) da coluna a ser usada como chave de junção (ex.: "sample_id" ou "1") |
Saídas
record (
meta: Record,
csv: Path,
results: Set<Path>,
logs: Set<Path?>,
nf_logs: Set<Path>,
versions: Set<Path>
)
| Campo | Tipo | Descrição |
|---|---|---|
meta | Record | Record com informações da amostra |
csv | Path | O arquivo tabular resultante da junção (*.csv ou *.tsv) |
results | Set<Path> | Todos os arquivos de saída a serem publicados |
logs | Set<Path?> | Arquivos de log específicos do programa (opcionais) |
nf_logs | Set<Path> | Arquivos de log específicos do Nextflow (ex.: .command.{begin |
versions | Set<Path> | Arquivo no formato YAML com as versões dos programas |
Parâmetros
Parâmetros do csvtk join
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
--csvtk_join_opts | string | Opções extras do csvtk join entre aspas |
Usado Por
Subworkflows
- teton - Realiza classificação taxonômica e estima tamanhos de genomas bacterianos.
Workflows
- teton - Classificação taxonômica e perfil de abundância de reads metagenômicos.
Citações
Se você usar isso em sua análise, por favor cite o seguinte.
-
Bactopia
Petit III RA, Read TD Bactopia - a flexible pipeline for complete analysis of bacterial genomes. mSystems 5 (2020) -
csvtk
Shen, W csvtk: A cross-platform, efficient and practical CSV/TSV toolkit in Golang. (GitHub)
Fonte
Versão
CSVTK_JOIN:
- csvtk: 0.31.0