我正在尝试使用先验算法推断客户帐户上发生的错误。所以我有一个像这样的错误表:
error_id error_code cust_id 1 M015 100 2 M020 101 3 M016 100 4 M019 100 5 M015 102
...
我想确定给定 M015 会出现什么错误。
(例如 M015 -> ??)
问题是错误表包含数十万行项目,并且有数百个可能的错误代码。那么我是否以非常低的信心运行我的算法以获取尽可能多的规则?或者我是否将错误数据库缩小到仅包含包含我感兴趣的错误的“事务”?
(例如,在这个例子中,如果我正在寻找规则 M015,我是否应该将事务表限制为只有 cust_id 100 和 102 的行项目?)