0

目前我正在尝试使用 encog 3 扩展我的数据文件(train.nn),我的数据文件如下所示(这是一个简化的示例,在我的真实文件中,每个示例 SP 最多有 249 个特征):

1,0,1,2,SP
4,5,6,1,SP

这是我的缩放代码:

File rawFile = new File(MYDIR, "train.nn");
File scaledFile = new File(MYDIR, "scaledTrain.nn");
EncogAnalyst analyst = new EncogAnalyst();

AnalystNormalizeCSV norm = new AnalystNormalizeCSV();
norm.analyze(rawFile, true, CSVFormat.ENGLISH, analyst);
norm.setProduceOutputHeaders(false);
norm.normalize(scaledFile);

但我得到了这个错误:

Exception in thread "main" org.encog.app.analyst.AnalystError: Multiple fields named: 1
    at org.encog.app.analyst.util.CSVHeaders.validateSameName(CSVHeaders.java:292)
    at org.encog.app.analyst.util.CSVHeaders.init(CSVHeaders.java:270)
    at org.encog.app.analyst.util.CSVHeaders.<init>(CSVHeaders.java:146)
    at org.encog.app.analyst.csv.normalize.AnalystNormalizeCSV.analyze(AnalystNormalizeCSV.java:147)

我真的不知道它为什么抱怨这个......有人可以告诉我我在这里做错了什么吗?
非常感谢。
P/S:我已经看过这个教程了。这对我来说并不方便,因为它手动定义了每个字段(特征),这很糟糕,因为在我的例子中,每个样本最多有 249 个特征。

4

1 回答 1

1

您可以像这样设置循环:

int fieldCount = 249;
InputFieldCSV[] inFields = new InputFieldCSV[fieldCount];

int i = 0;
while (i < fieldCount) {

    norm.addInputField(inFields[i] = new InputFieldCSV(true, rawFile, i));
    i++;
}

然后为其余代码设置进一步的循环,您会看到重复的同一行。(代码未测试...)

于 2014-03-10T13:25:21.470 回答