1

我正在尝试在 Endeca 中索引 csv 文件。在行长度小于 65536 的情况下,索引工作正常。对于大数据,它会抛出异常。

FATAL 02/18/14 15:45:53.122 UTC (1392738353122) FORGE {baseline}:TextObjectInputStream:在读取“/opt/soft/endeca/apps/MyApp/data/processing/TestRecord.csv”时,未找到分隔符“”在 65536 个字符的允许距离内。.................................................................. ......................... 错误 2014 年 2 月 17 日 16:10 :58.060 UTC (1392653458060) FORGE {baseline}:I/O 异常:从 Java 读取数据时出错:抛出 EdfException:edf/src/format/Shared/TextObjectInputStream.cpp:76。消息是:退出调用

如何增加此限制以在 Endeca 中索引大数据(单行超过 65537 个字符)?

4

1 回答 1

1

我想你已经解决了这个问题。如果不是,则您的错误是在记录适配器中未正确设置行分隔符。

如果您的记录在 CSV 文件中的长度合理,请切换到 XML 或其他格式。

于 2014-03-07T04:20:45.167 回答