0

这里得到提示!我正在通过 RJB 使用来自 Ruby 的 weka 的分类器库。

我希望能够从 .arff 文件创建一个分类器,并对其进行 10 倍交叉验证以生成混淆矩阵,如Weka wiki 中所述

以下是涉及的基本代码。

# creating the classifier
Rjb::load("./weka.jar", jvmargs=["-Xmx2000M"])
classifier = Rjb::import("weka.classifiers.bayes.NaiveBayes").new

# importing the data
data_src = Rjb::import("java.io.FileReader").new("./the_data.arff")
data = Rjb::import("weka.core.Instances").new(data_src)

evaluation = Rjb::import("weka.classifiers.Evaluation").new(data)

folds = Rjb::import('java.lang.Integer').new(10)
rand = Rjb::import("java.util.Random").new(1)

evaluation.crossValidateModel(classifier, 
                              data, 
                              folds, 
                              rand )

print evaluation.toMatrixString()

从上面的 weka wiki 链接我可以看出:这应该可以。但...

Fail: unknown method name `crossValidateModel' (RuntimeError)

据我了解,这通常意味着没有为所讨论的方法提供正确的参数,但我看不出情况会如何。

evaluation.java_methods的输出包括crossValidateModel([Ljava.lang.String;Lweka.core.Instances;I[Ljava.lang.String;Ljava.util.Random;, Lweka.classifiers.Classifier;Lweka.core.Instances;ILjava.util.Random;[Ljava.lang.Object;])

我不确定如何解释。

有没有人知道我需要做什么?


编辑:虽然我无法解决这里提出的问题,但事实证明,我可以通过这里描述的 JRuby 重新开始来实现我想要的。感谢 michaeltwofish 的提示 :)

4

1 回答 1

1

而不是使用 Rjb::import('java.lang.Integer').new(10) 尝试使用普通 10。

您正在从评估类调用方法 crossValidateModel。其中有一个过载。见下文。请注意,第三个参数是 int。您正在使用 java.lang.Integer。在 java 中,int 和 Integer 不是一回事。如果您有兴趣,请在 java 中查找原始类型和 Wrapper 类型。通常,自 java 5 以来,java 能够在 int 和 Integer 之间进行更改。但是您是从 Rjb 调用的,我认为 java Integer 被包装在某个对象中以用于 ruby​​ 目的,这令人困惑。

来自 weka javadocs。

 crossValidateModel(Classifier, Instances, int)

对一组实例上的分类器执行(如果类是名义上的,则分层)交叉验证。

crossValidateModel(String, Instances, int, String[])

对一组实例上的分类器执行(如果类是名义上的,则分层)交叉验证。

于 2011-11-13T10:27:54.193 回答