0

我有一个 Excel 电子表格,其中每一列都是一个特定的变量。在我的专栏末尾,我有一个特殊的最后一列,称为“类型”,可以是 A、B、C 或 D。

每一行都是一个具有不同变量的数据点,这些变量最终出现在最后一列中记录的某个“类型”桶 (A/B/C/D) 中。

我需要一种方法来检查某种类型的所有条目(例如,“C”或“C”|“D”)并找出哪些变量是最后一列的良好预测器,哪些更好预测器比其他人。

一些变量是数字,另一些是固定字符串(来自一组字符串),因此它不仅仅是数字/数字相关。

Excel 2003 是一个很好的工具,还是有更好的统计程序可以让这更容易?我是否为每个类别创建数据透视图/直方图,还是有更好的方法来运行这些查询?谢谢

4

1 回答 1

0

您可以使用 microsoft excel 进行一些过滤,尤其是清理数据(我的意思是,将数据值更改为一种类型、字符串或数字)。Execl 还进行一些数据挖掘。但是,对于您遇到的这类问题,我推荐您使用的一个好工具是 WEKA。使用该工具,您可以对所有数据实例(行)进行关联分类预测(即类关联规则挖掘),从而确定哪些项目属于A/B/C/D。您的特殊属性将是您的类属性。

于 2013-12-17T11:34:59.840 回答