这是我的情况。我已经获得了测试和训练数据。现在,我应该运行 weka 来运行各种机器学习算法。问题是我还需要生成图表(确切的说明是:“至少你应该包括显示训练和测试数据的性能作为训练规模函数的图表”)。因此,为了缩小我的问题范围,假设我正在研究决策树(特别是 J48 算法),并且我需要生成图表。我该怎么做呢?
我该怎么做呢?我发现使用 Google 的帮助绝对为零。我希望在使用 weka 时不必放弃 gui。
这是我的情况。我已经获得了测试和训练数据。现在,我应该运行 weka 来运行各种机器学习算法。问题是我还需要生成图表(确切的说明是:“至少你应该包括显示训练和测试数据的性能作为训练规模函数的图表”)。因此,为了缩小我的问题范围,假设我正在研究决策树(特别是 J48 算法),并且我需要生成图表。我该怎么做呢?
我该怎么做呢?我发现使用 Google 的帮助绝对为零。我希望在使用 weka 时不必放弃 gui。
您不需要任何 weka 函数来执行此操作。为此,您可以使用任何图形/图表实用程序,例如 matlab、excel、R。你需要做的是跟随。假设您有 10.000 个实例的训练数据集和 2000 个实例的测试集。
TrainingDataSetSizePercent TrainingDataSetSizePercent TestDataSetSize Accuracy Accuracy
OnTraining OnTest
%5 500 2000 %80 %60
%10 1000 2000 %82 %70
%20 2000 2000 %84 %71
%50 5000 2000 %85 %72
%100 10000 2000 %87 %81
将此数字作为以下代码提供给 matlab。
accuracy_scores = [ 500 80 60;1000 82 70; 2000 84 71; 5000 85 72; 10000 87 81];
plot(accuracy_scores(:,1),accuracy_scores(:,2),accuracy_scores(:,1),accuracy_scores(:,3))
此代码将为您提供以下图表