3

我正在尝试了解贝叶斯网络。我有一个有10个属性的数据文件,我想获取这个数据表的混淆表,我想我需要计算所有字段的tp,fp,fn,tn。是真的吗?如果是这样,那么我需要为贝叶斯网络做些什么。

真的需要一些指导,我迷路了。

4

3 回答 3

4

这个过程通常是这样的:

  • 您有一些标记数据实例,您想用它们来训练分类器,以便它可以预测新的未标记实例的类别。
  • 使用您选择的分类器(神经网络、贝叶斯网络、SVM 等),我们以您的训练数据作为输入来构建模型。
  • 此时,您通常希望在部署模型之前评估它的性能。因此,使用以前未使用的数据子集(测试集),我们将这些实例的模型分类与实际类的分类进行比较。总结这些结果的一个好方法是使用混淆矩阵,它显示了如何预测每类实例。

对于二元分类任务,惯例是将一个类指定为正类,将另一个类指定为负类。因此,从混淆矩阵中,被正确分类为正例的正例的百分比被称为真正例(TP)率。其他定义遵循相同的约定......

于 2010-06-04T20:26:57.813 回答
3

混淆矩阵用于评估分类器的性能,任何分类器

于 2010-06-03T16:56:34.567 回答
0

您要问的是一个具有两个以上类别的混淆矩阵。以下是您的操作步骤:

  • 为每个类构建一个分类器,其中训练集由类中的文档集(正标签)及其补集(负标签)组成。
  • 给定测试文档,分别应用每个分类器。
  • 将文档分配给具有最大分数、最大置信度值或最大概率的类

以下是该论文的参考资料,您可以了解更多信息:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.
于 2016-02-03T15:11:22.960 回答