0

正如我从这里的文档中了解到的那样,我可以进行类似的调用tft.compute_and_apply_vocabulary(s),以便将分类列转换为数值特征。

作为 tensorflow 的初学者,我想知道是否存在原始特征列到数值列的自定义映射?我已经看到这里描述的 hash_bucket 方法几乎可以完成我想要的工作。但是,我需要调用一个自定义映射函数,而不是条目的哈希,以便将分类列中的“m”个唯一元素映射到数字或字符串的“n”个唯一元素,其中 n < m。

用例。我在使用 KDD CUP 99 数据集进行实验时遇到了这个问题,其中训练集的目标类包含 23 种不同的攻击类型,需要将它们识别并分为四类攻击。如果有一个我可以使用的转换函数,那么目标类中的所有 23 个唯一元素都可以映射到编号为 [1,2,3,4] 的 4 类攻击。包括可以映射到 [0] 的正常连接,目标类将包含 5 个类,因此我可以直接训练多类分类模型。更多关于 KDD CUP 99 数据集的信息在这里

任何人都可以帮忙吗?

更新在这个线程 的帮助下解决了这个问题

4

0 回答 0