当我尝试使用 读取 txt 文件时read.table(),在 Rstudio 中查看数据集时遇到了问题。原始txt.file由三列数据组成,包括ID、内容(粤语)和时间,格式如下:
100008251304976 你又知喎 2019-10-04 16:52:15
100027970365477 甘你买多几包花生,小心热气 2019-10-04 16:23:43
我编写了将其读入 Rstudio 的代码
x = read.table('comment.txt', encoding = 'utf-8', quote = "",fill = T,sep = '\t')
但结果是混乱的数据。
ç”∼ä½ è²·å¤šå¹¾åŒ…èŠ±ç”Ÿï¼Œå°å¿ƒç†±æ°£ 2019å¹´10æ
然后我检查了我的env,locale如下
sessionInfo()
#R version 3.6.1 (2019-07-05)
#Platform: x86_64-w64-mingw32/x64 (64-bit)
#Running under: Windows 10 x64 (build 18362)
#Matrix products: default
#locale:
#[1] LC_COLLATE=English_Hong Kong SAR.1252 LC_CTYPE=English_Hong Kong SAR.1252
#[3] LC_MONETARY=English_Hong Kong SAR.1252 LC_NUMERIC=C
#[5] LC_TIME=English_Hong Kong SAR.1252
#attached base packages:
#[1] stats graphics grDevices utils datasets methods base
#loaded via a namespace (and not attached):
#[1] compiler_3.6.1 rsconnect_0.8.16 tools_3.6.1 tinytex_0.16 xfun_0.10
#[6] packrat_0.5.0
Sys.getlocale()
# "LC_COLLATE=English_Hong Kong SAR.1252;LC_CTYPE=English_Hong Kong SAR.1252;LC_MONETARY=English_Hong Kong SAR.1252;LC_NUMERIC=C;LC_TIME=English_Hong Kong SAR.1252"
Sys.getenv("LANG")
# "C.UTF-8"
任何想法为什么我无法正确加载 txt 文件?顺便说一句,我可以print在 Rstudio 中输入或繁体中文。
print("試試")
# [1] "試試"