1

我在 Windows 7 上使用 Rstudio 和 R 3.3.1 并且我已经安装了CITAN包。我正在尝试从我从 Scopus 导出的 CSV 文件中导入书目条目(因为它是原样的),选择导出所有可用信息。

这是我得到的错误:

example <- Scopus_ReadCSV("scopus.csv")

Scopus_ReadCSV("scopus.csv") 中的错误:未找到列:`Source'。另外:警告信息:

1: 在 read.table(file = file, header = header, sep = sep, quote = quote, : 在输入连接 'scopus.csv' 上发现无效输入

2:在 read.table(file = file, header = header, sep = sep, quote = quote, : readTableHeader 在 'scopus.csv' 上找到的不完整的最后一行

当我打开文件时,列“来源”就在那里,所以我不知道为什么它说“找不到”。

4

2 回答 2

2

最终我得出以下结论:

  1. 从 Scopus 导出的 CSV 文件的编码是 UTF-8-BOM,在使用 Scopus_readCSV("file.csv") 或 read.table("file.csv", header = TRUE 时,R 似乎无法识别该编码, sep = ",", fileEncoding = "UTF-8")。

  2. 虽然它使用了 Scopus 文件的编码类型,但可以找到一些“奇怪”的非英文字符,这些字符在 R 中的 read 函数中无法读取。(主要在带有特殊字符的名称中发现此问题)

这些问题的解决方案:

  1. 使用 Notepad++ 之类的记事本应用程序打开 CSV 文件,并使用 UTF-8 编码保存文件,以使 R 可以读取为 UTF-8。

  2. 在 R 中运行读取函数时,您会注意到它停止读取(例如,在 200 个注册表中的第 40 个)。查看它停止的确切位置,这样您可以通过使用记事本打开 CSV 找到特殊字符,然后您可以根据需要擦除/更改它,以免在 R 中再次出现相同的问题。

于 2016-09-27T13:54:23.313 回答
0

另一个对我有用的解决方案:

在 Google 表格中打开该文件,然后再次从那里下载为 *.csv 文件。R 之后正确打开它。

于 2021-02-17T12:54:49.670 回答