3

我想合并 2 个 arff 文件。它们具有相同的属性,但属性下的值发生了变化。

例如:

1.arff: weather(sunny, rainy). 50 instances
2.arff: weather(warm, cold, freezing). 30 instances

我想创建一个新的 arff:

3.arff: weather(sunny,rainy,warm,cold,freezing). 80 instances

我在示例 CLI (weka) 中尝试过:

java weka.core.Instances 1.arff 2.arff > 3.arff
java weka.core.Instances append 1.arff 2.arff > 3.arff
java weka.core.Instances merge 1.arff 2.arff > 3.arff

他们都没有工作。

如果有任何帮助,我将不胜感激。

非常感谢。

4

2 回答 2

0

您是否尝试过使用 MergeSets 类来合并文件。您可以从这里尝试:http: //bioweka.sourceforge.net/docs/api/bioweka/filters/universal/MergeSets.html

您也可以编写一个小代码来合并两个 arff 文件:

import weka.core.converters.ArffLoader
import java.io.{File,FileWriter}

def combineAllArffs() {
  var arffLoader = new ArffLoader
  val arffDir: File = new File(s"Arff/")

  val arffList = arffDir.listFiles;
  var instances: Instances = null
  var structure: Instances = null

  if (arffList == null) {
    print(s"Warning: Arff list for '$mode' is empty.")
    return
  }

  for (arffFile <- arffList) {
    arffLoader.setFile(arffFile)
    if (instances == null) {
      instances = arffLoader.getDataSet
      structure = arffLoader.getStructure
    } else {
      var newInstances = arffLoader.getDataSet
      var i = 0
      while (i < newInstances.numInstances) {
        val instance = newInstances.instance(i)
        instances.add(instance)
        i += 1
      }
    }
    arffLoader.reset
  }

  val combinedFile = new File(s"Arff/Combined.arff")
  val fw = new FileWriter(combinedFile)
  fw.write(instances.toString)
  fw.close
}

这应该适用于您的情况。

于 2014-07-15T15:54:45.040 回答
0

几天前,同样的问题出现了,我用python写了一个小脚本。 在这里你可以找到它。

于 2016-05-23T14:02:49.697 回答