我正在使用该rtweet
包来检索包含特定关键字的推文。我知道如何进行“and”/“or”匹配,但是如何将它们链接到一个具有多个 OR/and 条件的关键字查询中。例如,我可能希望放入search_twitter
函数的搜索查询是:
(“现金”或“货币”或“钞票”或“接受现金”或“无现金”)和(“covid”或“病毒”或“冠状病毒”)
所以推文可以包含第一个括号中的任何一个词,也可以包含第二个括号中的任何一个词。
使用dplyr
:
假设您有一个包含推文字符字段的列的 df:
样本数据:
df <- structure(list(Column = c("coronavirus cash", "covid", "currency covid",
"currency coronavirus", "coronavirus virus", "trees", "plants",
"moneys")), row.names = c(NA, -8L), class = c("tbl_df", "tbl",
"data.frame"))
您可以使用以下内容:
library(dplyr)
match <- df %>%
dplyr::filter(str_detect(Column, "cash|currency|banknote|accepting cash|cashless")) %>%
dplyr::filter(str_detect(Column, "covid|virus|coronavirus"))