我知道如何使用 TextDirectoryLoader 将一组文本或网页文件转换为 arff 文件。
我想知道如何将单个文本文件转换为 Arff 文件。
任何帮助将不胜感激。
我知道如何使用 TextDirectoryLoader 将一组文本或网页文件转换为 arff 文件。
我想知道如何将单个文本文件转换为 Arff 文件。
任何帮助将不胜感激。
请更具体。反正:
如果文件中的文本对应于单个文档(即它,单个实例),那么您只需用转义码替换所有“新行”\n
以使全文在一行中,然后手动格式化作为具有单个文本属性和单个实例的 arff。
如果文本对应多个实例(例如文档),那么我建议制作一个脚本将其分解为多个文件并应用
TextDirectoryLoader
. 如果有任何特定的格式(例如,实例包含在 XML 标记中),您可以这样做(通过利用 XML 格式),或者在 WEKA 中编写自定义 Loader 类来识别您的格式并构建一个 Instances 对象.
如果您发布示例,则更容易获得更准确的建议。