1

我将所有搜索结果都格式化为 XML 格式,并尝试在 Carrot2 工作台中运行 lingo 算法,并且不断遇到 Java 堆空间错误。

XML 以 Carrot2 使用的方式格式化。我在 MAC 机器上运行 Carrot2 工作台。

有没有办法:

  1. 要增加应用程序的 Java 堆空间,比如一些设置?
  2. 我可以传递给集群应用程序的文档是否有限制?(我有大约 1 万份文件)**

An internal error occurred during: "Searching for 'gene therapy'...". Java heap space

4

1 回答 1

1
  1. 要设置最大 Java 堆空间,您可以在启动期间传递合适的 -Xmx JVM 参数值: carrot2-workbench -vmargs -Xmx256m

  2. Carrot2 专为中小型文档集合(几百个)而设计。这完全取决于算法。有关更多详细信息,请参阅“尝试通过 carrot2workbench 对 15980 个文档进行集群时出现 java 堆大小错误”。

于 2020-03-10T18:25:03.360 回答