我最近一直在学习使用 R RecordLinkage 包。在链接 2 个数据集的一个非常小的示例中,一个有 8 行,另一个有 11 行,我得到了结果:
Linkage Data Set
8 records in data set 1
11 records in data set 2
8 record pairs
4 matches
4 non-matches
0 pairs with unknown status
Weight distribution:
[0.4,0.5] (0.5,0.6] (0.6,0.7] (0.7,0.8] (0.8,0.9] (0.9,1]
2 0 2 0 1 3
3 links detected
0 possible links detected
5 non-links detected
alpha error: 0.250000
beta error: 0.000000
accuracy: 0.875000
Classification table:
classification
true status N P L
FALSE 4 0 0
TRUE 1 0 3
无法理解的是 alpha 误差、beta 误差和分类表的准确性之间的关系。下面的数字究竟来自哪里,它们是如何计算的:
alpha error: 0.250000
beta error: 0.000000
accuracy: 0.875000
非常感谢任何帮助