0

我有一个数据集如下:

小路 类标签
4,3 0
4,5,3,7 1
5,3,2,1,8 0
3,4,5 1
  • “路径”列是一系列具有不同长度 (>=2) 的序列号。
  • 数字范围从 1 到 9。
  • 每个数字可以在任何位置的“路径”中多次出现。
  • “路径”中的每个数字都代表现实世界中的一个状态。
  • 目的是根据“路径”数据预测类标签。

在将“路径”用作训练数据之前,我应该如何对其进行预处理?

谢谢,

4

1 回答 1

0

您可以使用循环网络的多对一架构。使用 LSTM 或 GRU 来实现它。

path您在LSTM/GRU 的每次展开时传入您的单个数字,时间步长是path该样本的数字。您获取最后一个展开的输出并在其上堆叠一个完全连接的层,最后一层是一个 Dense 层,其大小等于您要预测的类数。

在此处输入图像描述

这个关于 pytorch 表单的讨论在 pytroch 中有实现细节。

于 2021-03-02T11:44:41.893 回答