4

我有一个列数未知的表,我需要在某个点之后合并所有列。考虑以下:

| A  | B  | C | D | E |
|----|----|---|---|---|
| 24 | 25 | 7 |   |   |
| 12 | 3  | 4 |   |   |
| 5  | 5  | 5 | 5 |   |

AC 列是已知的,并且其中的信息是正确的。但是 D 到 N 列(以 D 开头的未知数量的列)需要合并,因为它们都是同一字符串的一部分。如何在 OpenRefine 中组合未知数量的列?

由于某些列可能有空单元格(字符串可能有各种长度),我还需要忽略空单元格。

4

1 回答 1

4

有一个适合您的两步方法。

从要合并的第一列(在本例中为 Col D)选择 Transpose->Transpose cells across columns into rows

您将被要求设置一些选项。您需要选择“从列”D 和“到列”N。然后选择转置为一列,为该列分配一个名称,确保选中“忽略空白单元格”选项(应通过默认。然后单击转置。

您将获得以前在 cols DN 中出现在行中的值。例如

| A  | B  | C | D | E | F |
|----|----|---|---|---|---|
| 1  | 2  | 3 | 4 | 5 | 6 |

转置为:

| A  | B  | C | new |
|----|----|---|-----|
| 1  | 2  | 3 | 4   |
|    |    |   | 5   |
|    |    |   | 6   |

然后,您可以使用“新”列顶部的下拉菜单选择编辑单元格->加入多值单元格

系统将询问您要使用什么字符来分隔连接单元格中的字符。可能在您的用例中,您可以删除连接字符并在没有任何连接字符的情况下组合单元格。这会给你:

| A  | B  | C | new |
|----|----|---|-----|
| 1  | 2  | 3 | 456 |
于 2015-08-02T11:19:43.590 回答