1

我试图读入 R 数据框的数据示例

亲爱的朋友们: 我正在尝试将包含多行的单个 Excel 单元格中的数据读入 R 数据框。理想情况下,我希望将这些多行保留在数据框中的一个位置,并在这些行之间使用一些分隔符,例如 |、; 等。

我怎么能那样做?

生成的文件应该是这样的:

患者部分_ __ _ __ _ __ _ __ _赞助商__主要药物 _其他药物

“合并症……|糖尿病……|高血压……” __ NIDDK __塞来昔布__ .....

非常感谢!

4

1 回答 1

1

这可能取决于您如何访问这些数据。如果您将其导出为 CSV 文件,则单元格中的 CR-LF 可能会中断行,因此需要使用 读取它们,readLines()然后使用paste(). 另一方面,如果您使用旨在读取单个单元格的包,则换行符可能会合并到单个元素中。您应该显示 CSV 输出...或说明您计划如何访问 hte XLS 文件并将其中的一部分发布到人们可以到达的地方。

在 Mac 上,它需要 ctl-opt-enter 才能将 cr-lf 放入单元格中。如果存在,则导出会在文本编辑器中生成如下所示的结果

"there is 
a test of 
alt-ctl-enter
"

然后用 read.table 看起来像这样:

read.table("~/test.csv", header=FALSE)
                                      V1
1 there is \na test of \nalt-ctl-enter\n
#plus a harmless warning about an incomplete line.

所以它作为向量中的单个字符元素。用 "|" 替换 R 字符串中的 <"cr-lf"> 的 "\n" (管道)使用 gsub:

 dat <- read.table("~/test.csv", header=FALSE)
 gsub("\n", "|", dat$V1)
#  [1] "there is |a test of |alt-ctl-enter|"
于 2012-11-18T03:35:14.957 回答