0

首先,我是一个编码新手,刚刚开始编码,目的是在我的大学写我的硕士论文。我使用 R 中的 tuber 包提取了 youtube 评论,以便对这些评论进行情绪分析。一切正常,我收到了一个包含所有评论的数据框(11314 个观察值和 13 个变量)。但是,当我尝试编写该数据框的 .csv 文件以查看 Excel 中的注释时,我遇到了一个特定问题。对于包含新段落的注释,write.table 函数创建了一个新行。我使用了以下功能:

write.table(testneuohneduplikate, file = "Testneuohnedulikate.csv",sep = ";", row.names = FALSE, col.names = TRUE, quote = TRUE)

是否有可能每条评论都写在一行中,而不是有时两三行,因为评论包含段落?

我希望我能够正确解释我的问题。

提前谢谢你们,以及来自德国的问候,无论你来自哪里:)

4

1 回答 1

0

是的,write.table 在遇到换行符时正在创建一个新行。这是从注释字符串中去除换行符的示例:

> comment<-"I think this video \n is great"
> cat(comment)
I think this video 
 is great

> fixedcomment<-gsub("[\r\n]", "", comment)
> cat(fixedcomment)
I think this video  is great
> 

您可以使用“应用”将其应用于表中的每一列,或者如果您只想执行行或列,则可以修改 MARGIN 参数。

> ID<-1:4
> Names<-c('name1','name2','name3','name4')
> Comments<-c("I think this video \n is great", "No it stinks \n I mean it", "Use the Force", "It's time \n to get to work")
> table<-cbind(ID, Names, Comments)

> fixed_table<-apply(X=table,MARGIN=c(1,2),FUN = function(y) gsub("[\r\n]","",y))
于 2017-12-06T17:16:28.357 回答