2

我一直在研究拼写校正模型,并试图找到一些评估指标。如果您认为假阴性试图修复一个已经正确的单词,而假阳性则缺少错误,那么您可以计算精度、召回率和准确性。然而,这些指标并没有说明更正模型的质量(无论它是否成功地将错误的单词更正成用户想要输入的内容),并且只评估拼写检查能力而不是更正能力。

4

1 回答 1

0

在许多语言中,最难的部分是在众多候选人中选择正确的替代品。例如,应该lcklack, lick, lock, ick, 还是luck? (断章取义,当然,你不能说!)

因此,您正在寻找的指标是准确更正的数量。您没有尝试修复的错误,以及您错误替换的正确单词将被您发现但未准确纠正的错误所淹没,尽管您可能仍想分别计算这些情况。

如果您的校正候选排名算法是独立的,您可以通过单独评估它来显着简化该过程。

于 2016-06-29T02:57:02.880 回答