1

我想使用genericSummarypackage 中的函数LSAfun。这是德语示例文本。

library("LSAfun")
text = " Gegen die Firma wurde während der letzten Woche ein Zwangsvollstreckungsverfahren eingeleitet. Darüber witzeln die Konkurrenten."

我的文本编码是“UTF-8”。实际上,这个示例文本的编码是“latin1”。因此我转换为 utf8

text = enc2utf8(text)

当我打电话

genericSummary(text, k=2)

我收到以下错误:

Error in FUN(X[[i]], ...) : 
  [lsa] - could not open file C:\Users\MA\AppData\Local\Temp\RtmpcRnDPw\file16c81a35d06/sentence1.txt due to encoding problems of the file.

有谁知道如何解决这个问题?

4

1 回答 1

1

有同样的问题。似乎像'ü'和'ä'这样的特殊字符是这里的原因。通过用“ue”和“ae”替换它们,编码将起作用。

试试这个:genericSummary(text,k=2, language="german",breakdown=T)

分解选项将完成这项工作,另请参阅此功能的 R 帮助。

亲切的问候,迈克尔。

于 2018-02-26T08:54:20.063 回答