我有一个数据集如下:
小路 | 类标签 |
---|---|
4,3 | 0 |
4,5,3,7 | 1 |
5,3,2,1,8 | 0 |
3,4,5 | 1 |
- “路径”列是一系列具有不同长度 (>=2) 的序列号。
- 数字范围从 1 到 9。
- 每个数字可以在任何位置的“路径”中多次出现。
- “路径”中的每个数字都代表现实世界中的一个状态。
- 目的是根据“路径”数据预测类标签。
在将“路径”用作训练数据之前,我应该如何对其进行预处理?
谢谢,
我有一个数据集如下:
小路 | 类标签 |
---|---|
4,3 | 0 |
4,5,3,7 | 1 |
5,3,2,1,8 | 0 |
3,4,5 | 1 |
在将“路径”用作训练数据之前,我应该如何对其进行预处理?
谢谢,
您可以使用循环网络的多对一架构。使用 LSTM 或 GRU 来实现它。
path
您在LSTM/GRU 的每次展开时传入您的单个数字,时间步长是path
该样本的数字。您获取最后一个展开的输出并在其上堆叠一个完全连接的层,最后一层是一个 Dense 层,其大小等于您要预测的类数。
这个关于 pytorch 表单的讨论在 pytroch 中有实现细节。