9

我的数据框的一列包含单词和短语。我正在尝试为此列中的那些字段创建一个虚拟变量,这些字段在其中的任何位置都有特定的文本字符串。

例如:

  • 风筝
  • 汽车
  • 箱式风筝
  • 模型车
  • 我喜欢放飞的风筝
  • 世界汽车

     myvector<-c("kite","cars","box kites","model cars","i like kites that fly",
     "cars of the world")
    

我想用字符串“kite”识别所有字段

我已经尝试了一些东西,例如any(),但到目前为止没有任何效果。which()%in%

非常感谢任何帮助

4

1 回答 1

30

您没有提供任何可重现的示例。但你的答案将是 grepl。

grepl("kite", df$words)

如果单词在行中,它将返回一个逻辑向量。

如果要匹配多个单词,请使用逻辑或|字符串内部进行匹配

grepl("kite|cars|box kites", df$words)
于 2012-09-13T15:11:10.877 回答