0

我知道如何使用 TextDirectoryLoader 将一组文本或网页文件转换为 arff 文件。

我想知道如何将单个文本文件转换为 Arff 文件。

任何帮助将不胜感激。

4

1 回答 1

3

请更具体。反正:

  • 如果文件中的文本对应于单个文档(即它,单个实例),那么您只需用转义码替换所有“新行”\n以使全文在一行中,然后手动格式化作为具有单个文本属性和单个实例的 arff。

    如果文本对应多个实例(例如文档),那么我建议制作一个脚本将其分解为多个文件并应用 TextDirectoryLoader. 如果有任何特定的格式(例如,实例包含在 XML 标记中),您可以这样做(通过利用 XML 格式),或者在 WEKA 中编写自定义 Loader 类来识别您的格式并构建一个 Instances 对象.

如果您发布示例,则更容易获得更准确的建议。

于 2013-10-31T08:40:56.590 回答