我现在使用 Rstudio 3.4.3 版,并尝试使用包tm分析法语 PDF 文档。
我的问题是,即使我用这个命令指定了文档的语言my_pdf <- readPDF (control = list (text = "- layout")) (elem = list (uri = "C: /Users/lo/Desktop/Eau/Catalogs.pdf", language = "fr"))
。有些词写得不好,例如,我发现“nourric”一词不是“nourrice”,而是“description”这个词。
你知道我该如何解决吗?