如何在 TensorFlow 中进行原生转换(例如 one-hot 编码、索引、分桶、嵌入等)标签?tf.feature_column
是特征的首选方式,但标签(即目标)呢?这些也可能经常需要进行转换,并将其视为整个 Keras 管道中的一个层。问题是tf.feature_column
它只作用于特征,而不是标签。
例如考虑一个 CSV
F1 F2 T
3.7 2.0 A
1.7 3.5 B
6.0 6.6 A
0.7 3.2 A
其中F1
和F2
是特征和T
目标。然后我自然会打电话make_csv_dataset(..., label_name='T')
来生成我的数据集。但是,我如何转换目标,以便所有数据处理都整齐地包裹在一个Dense
层中?
TensorFlow的团队是否tf.data
忽略了标签通常是分类的,因此需要转换的事实?
编辑:我想避免使用熊猫,因为它不可扩展,因此我强调tf.data
(例如,make_csv_dataset()
或其他)的“本机”工具。