0

我需要使用 R 将文本数据(例如段落)转换为数据框(保存为 csv 文件)。具体需要是将每个段落中的每个单词放在列中的单独单元格中。以下代码将文本转换为表格,但它将每行中的单词放在一个单元格中。你能帮助创建一个单列数据集,每个单词都在一个单独的单元格中吗?

    merchant <- read.delim("merchant.txt")
    write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)
4

1 回答 1

0

这是我基于 tidyverse 的尝试。与其以表格的形式读入,不如以字符串的形式读入,然后分成单个单词的向量:

library(tidyverse)

## Read in text file as string
merchant <- read_file("merchant.txt") %>% 
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]

要将其转换为数据框:

para <- as.data.frame(para)
于 2018-12-06T12:58:47.957 回答