r - 读取带有井号 (#) 分隔符的 txt 文件

Question

我正在尝试读取大量以 R 分隔的哈希标记的 txt 文件。

例如：

Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#
Dora#58529#26/04/2012#

当我尝试以下仅加载第一列时，可能是因为第一个哈希标记之后的所有内容都被解释为注释。

(df <- read.table("https://dl.dropboxusercontent.com/u/64191100/hashtagdel.txt",sep="#"))

输出：

#     V1
# 1 Dora
# 2 Dora
# 3 Dora
# 4 Dora
# 5 Dora
# 6 Dora
# 7 Dora
# 8 Dora
# 9 Dora

我不想用另一个字符更改每个文件中的哈希标记（我没有创建文件）。有人知道解决方法吗？

score 7 · Accepted Answer

来自?read.table：

comment.char character：长度为 1 的字符向量，包含单个字符或空字符串。使用“”完全关闭注释的解释。

所以你想要类似的东西read.table(*, sep="#", comment.char="")

score 5 · Accepted Answer

改为使用read.delim...

df <- read.delim("https://dl.dropboxusercontent.com/u/64191100/hashtagdel.txt" , header = FALSE , sep="#")
df
#   V1    V2         V3 V4
#1 Dora 58529 26/04/2012 NA
#2 Dora 58529 26/04/2012 NA
#3 Dora 58529 26/04/2012 NA
#4 Dora 58529 26/04/2012 NA
#5 Dora 58529 26/04/2012 NA
#6 Dora 58529 26/04/2012 NA
#7 Dora 58529 26/04/2012 NA
#8 Dora 58529 26/04/2012 NA
#9 Dora 58529 26/04/2012 NA

r - 读取带有井号 (#) 分隔符的 txt 文件

2 回答 2

Related

Reference