我正在尝试对一些实时数据实施朴素贝叶斯算法。我知道贝叶斯的规则,但我不确定如何在我的数据上实施。我的数据如下所示。我的数据中共有 2 个标签可以,欺诈和测试数据标记为 unkn。我需要通过应用朴素贝叶斯算法将所有 unkn 记录分类为正常或欺诈。我该如何实现?请有人帮助我。
1,v1,p1,182,1665,unkn
2,v2,p1,3072,8780,ok
3,v3,p1,20393,76990,ok
4,v4,p1,112,1100,fraud
5,v3,p1,6164,20260,unkn
6,v5,p2,104,1155,ok
7,v6,p2,350,5680,unkn
8,v7,p2,200,4010,ok
9,v8,p2,233,2855,unkn
10,v9,p2,118,1175,unkn
贝叶斯规则:-
unkn ok 的后验概率 = ok 的先验概率 * 给定 unkn 的可能性 ok。
未知欺诈的后验概率 = 欺诈的先验概率 * 给定欺诈的未知概率。