我正在尝试做类似“VSUMM”文章中提到的事情。
有 5 种方法我想将它们的结果与我的进行比较。我确实通过计算 CUS(a) 即平均准确率和 CUS(e) 即平均错误率来比较所有这些数据。(这是一个视频摘要问题,每种方法都有 50 个视频的摘要.这个总结已经与五个用户总结进行了比较,然后通过这些结果计算CUS(a)和CUS(e))
现在我应该用我的方法计算每种方法的置信区间(置信度为98%)
我在网上冲浪并找到有关置信区间的长篇文章,但我真的什么都不懂!?
我应该怎么办?
问问题
46 次