0

如何在 Mac ver. 上更改单词的定义。出租车?我正在分析 R 上的文本数据,但某些字母(例如,“,()等)没有定义为符号,而是定义为名词。所以我不能排除这些字母,因为有些字母不被视为字符。例如我想执行如下代码

df <- df %>%
 dplyr::filter(! TERM %in% c("\", """)) # TERM is the variable name.

但这不起作用,因为我不能申请""这些信件。

所以我需要在 MeCab 字典中更改这些符号字母的定义。但我不知道该怎么做。这个问题一定是很初级的,但恐怕我不明白用Mac终端打开和编辑文件的方法。

PS 复制数据

# code
dput(pilot_data[1:10, "IMAGE_total"])

# output
structure(list(IMAGE_total = c("遠い 難しい 不安", 
"国民を動かす討論 世の中を平和に維持する大切なもの 選挙するもの", 
"苛立ちの対象だ。 不快なものだ。 悲しいものだ。&quot;, 
"身近ではない 必要ない 茶番劇である", "難しい物 遠い存在 高みの見物的な物", 
"汚いもの 興味深いもの 信用できないもの", 
"ダーティーな行為だ うさんくさい世界だ できればかかわりたくないことだ&quot;, 
"意味がない 敵である 興味がないもの&quot;, 
"生活に影響してくるもの。 きまりごとをつくるところ 縁のない世界", 
"国会議員のもの。 くだらない世界。 金にまみれた世界。&quot;
)), row.names = c(NA, -10L), class = c("tbl_df", "tbl", "data.frame"
))

pilot_data是数据框,IMAGE_total是开放式调查问题的答案。这些日文字符可能难以处理,我深表歉意。

4

1 回答 1

0

使用下面的代码,我可以运行分析。

df <- df %>%
 dplyr::filter(!str_detect(TERM, '[\\\\"()]')) 

谢谢您的帮助。

于 2021-08-22T12:19:22.127 回答