0

我有一个 xlsx 文件,其中包含 4 列:

Thingie1
Thingie1
Thingie2
Thingie2

(我知道这很愚蠢......这是因为我正在组合来自 2 个不同数据库的数据,并且12表示调查 1 和调查 2 之间的差异,并选择转储到 xlsx 文件中。

当我使用 xlsx 包将其导入 R 时,它会将列标题更改为:

Thingie1
Thingie3
Thingie2
Thingie4

显然,我在现实世界中的示例要复杂得多,因此很难确定什么是什么。我想要类似的东西:

Thingie1
Thingie11
Thingie2
Thingie21

现在,我可以通过在 excel 中打开文件并更改其中的列来解决这个问题......这样我就可以解决我眼前的问题,但我讨厌破坏我的工作流程......有没有办法以更好的方式导入这些数据进入R本身?

4

1 回答 1

1

我认为您应该单独阅读文件的第一行(包含列名),header=FALSE以便正确命名列。然后make.unique对它使用函数。稍后使用函数读取整个文件header=TRUE并设置列名。colnames

x <- c("Thingie1", "Thingie1", "Thingie2", "Thingie2")
x
#[1] "Thingie1" "Thingie1" "Thingie2" "Thingie2"
make.unique(x)
#[1] "Thingie1"   "Thingie1.1" "Thingie2"   "Thingie2.1"
于 2016-08-02T16:02:41.303 回答