0

让我们有一个包含以下波兰语句子的 .doc 文件(DOC 不是 DOCX !!!):

" Na każde 40 mg% powyżej 100 mg% dodać 1j NovoRapidu, przy glikemii poniżej 100 mg% odjąć 1j NovoRapidu od dawki wyliczonej na WW w posiłku głównym. Przekąski liczyć 1j/ 1WW. W przypadku hiperglikem.ii, 22.00, proszę liczyć na zbicie 1j NovoRapidu na każde 50 mg% powyżej 150 mg%。”

您也可以从这里下载 doc 文件 (my_doc.doc)

我想通过代码将此字符向量上传到 R 中:

library(readtext)
path <- "path of the my_doc.doc"
Sys.setlocale("LC_CTYPE", "polish")
i <- readtext(path,encoding = "UTF-8")
#or
i <- readtext(path)
i$text

#[1] "Na ka?de 40 mg% powy?ej 100 mg% doda? 1j NovoRapidu, przy  glikemii  #poni?ej\r\n100 mg% odj?? 1j NovoRapidu od dawki wyliczonej na  WW  w  posi?#ku  g?ównym.\r\nPrzek?ski liczy? 1j/ 1WW. W przypadku  hiperglikemii  przed  #snem,  tj.  ok.\r\ngodz. 22.00, prosz? liczy? na zbicie 1j NovoRapidu na ka?#de 50  mg%  powy?ej\r\n150 mg%."

该代码独立于使用的编码提供相同的输出。我想在 .doc 文件和 R 中获取相同的文本。我使用 Windows。我该如何编辑我的代码?

4

0 回答 0