0

我有一个包含一些(35 列)变量和数百万(行)时间步长的数据框。我想用 timeseriesgenerator ( https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/sequence/TimeseriesGenerator ) 切割数据。我以前为一些神经网络做过。我想坚持使用生成器,因为我需要跳过一些样本,但目前还不清楚有多少。

是否可以使用生成器来提供 sktime 的示例?我有一个分类问题。数据以长模式提供。生成器不提供时间戳。或者有什么解决方法吗?我想使用 sktime,但未能获得数据。数据包含时间变量,但记录时出现问题。所以有很大的差距,但这只是一个储蓄问题。

加载日期(减少到 10 行):

变量 1 变量2 变量3 1级 2 级 3 级
0.000565 0.97515 0.000052 1 0 0
0.000558 0.97514 0.000044 1 0 0
0.000553 0.97513 0.000036 1 0 0
0.000547 0.97512 0.000028 1 0 0
0.000541 0.97511 0.000018 1 0 0
0.000536 0.97510 0.000010 1 0 0
0.000531 0.97509 0.000006 1 0 0
0.000525 0.97508 0.000013 1 0 0
0.000520 0.97507 0.000021 1 0 0
0.000515 0.97506 0.000030 1 0 0

生成器的形状,samplelen 为 6,采样率为 1。它是第一个样本。

Shape of the generator data and label: (1, 3, 3) (1, 3)
[[[5.6456e-04 9.7515e-01 5.2059e-05]
  [5.5257e-04 9.7513e-01 3.6473e-05]
  [5.4131e-04 9.7511e-01 1.8311e-05]]]
[[1 0 0]]

第二个示例如下所示:

Shape of the generator data1 and label1: (1, 3, 3) (1, 3)
[[[5.5834e-04 9.7514e-01 4.4129e-05]
  [5.4748e-04 9.7512e-01 2.8435e-05]
  [5.3617e-04 9.7510e-01 1.0407e-05]]]
[[1 0 0]]
4

0 回答 0