1

我试图了解从数据库而不是文件加载数据时如何在 Weka 中表达以下 .arff 文件。.arff 文件具有以下形式:

@relation sample
@attribute expression string
@attribute tone {postive,negative}

@data
'this is a happy message', positive
'this is an unhappy message', negative

在从数据库加载数据的情况下,由一个包含两个字段(表达式和音调)的表组成,我怎样才能让 weka 知道字段音调只有两个可能的值,正值或负值?

这两个字段都是字符串。我想在表达式上应用 NominalToString 过滤器以将其转换为 String 并应用 StringToWord 过滤器。但是由于色调属性,它无法完成......有什么解决方案吗?

4

2 回答 2

0

“但是由于音调属性,它不能完成......” - 我不明白为什么。您只能处理“表达式”字段。您可以有选择地将 NominalToString 应用于您想要的任何属性。检查setAttributeIndexes函数。

于 2012-09-13T20:27:28.560 回答
0

我之前问过同样的问题。您可能会在该问题中看到详细的答案和必要的代码。

简短的回答:您来自外部文件的正确 arff 标头与来自数据库的数据合并。

于 2012-09-14T08:02:47.030 回答