我已经实现了一个简单的贝叶斯分类器,但是在处理大量数据时遇到了一些溢出问题。
为了使数字保持小但仍然准确,我尝试的一种策略是不断减少分子和分母,并为方程的每个部分使用最大公约数。但是,这仅在它们具有公约数时才有效...
请注意,问题是双向的,当我在大多数计算中将分母和分子分开时,我会遇到整数溢出问题,当我使用双算术即时进行大多数计算时,我遇到了各种问题/限制非常小的双精度值(由 IEEE 754 定义)。
我相信你们中的一些人之前已经实现过这个算法,你们是如何处理这些问题的?我不想引入任意精度类型,因为它们成本太高,而且我确信存在不需要它们的解决方案。
谢谢。