想象一下,一组变量 V 的值与一组标签名称 T(分类标签)之间的所有已知映射的宇宙是已知的。此外,假设唯一变量值组合的总空间很大(> 100B 个点),标签集的大小相对较小(数千个元素)并且变量的数量非常少(4-10)。
什么是构建分类器函数的算法,它提供了从变量值到具有以下空间和时间复杂度目标的标签的完美映射(匹配没有误报或误报的先验知识):
- 时间复杂度低于 O(|V|*log|T|)
- 空间复杂度小于 O(|V| k ), k ≤ e
或者,改写为决策树问题:
- 如何调整决策树算法以创建完美映射?
- 如何有效地表示训练数据以保证这一点?