我对 R 很陌生,并且试图分析这个示例数据集以开始使用朴素贝叶斯分类。
Day Outlook Temperature Humidity Wind Play
1 Sunny Hot High Weak No
2 Sunny Hot High Strong No
3 Overcast Hot High Weak Yes
4 Rain Mild High Weak Yes
5 Rain Cool Normal Weak Yes
6 Rain Cool Normal Strong No
7 Overcast Cool Normal Strong Yes
8 Sunny Mild High Weak No
9 Sunny Cool Normal Weak Yes
10 Rain Mild Normal Weak Yes
11 Sunny Mild Normal Strong Yes
12 Overcast Mild High Strong Yes
13 Overcast Hot Normal Weak Yes
14 Rain Mild High Strong No
我已经能够使用该table()
函数来获取类别变量(如 Outlook、温度、湿度、风和播放)的每个值的出现次数。现在要进入下一阶段,我需要计算特定目标类值 Yes 和 No 的每个分类变量值的相应出现次数。例如,要知道 X(outlook=Sunny,play=否)对于上述数据集,它是 2,我应该使用什么命令来获得所需的结果?
注意:我知道朴素贝叶斯计算概率,但我更感兴趣的是在这种情况下获得频率。