我有一个包含一些(35 列)变量和数百万(行)时间步长的数据框。我想用 timeseriesgenerator ( https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/sequence/TimeseriesGenerator ) 切割数据。我以前为一些神经网络做过。我想坚持使用生成器,因为我需要跳过一些样本,但目前还不清楚有多少。
是否可以使用生成器来提供 sktime 的示例?我有一个分类问题。数据以长模式提供。生成器不提供时间戳。或者有什么解决方法吗?我想使用 sktime,但未能获得数据。数据包含时间变量,但记录时出现问题。所以有很大的差距,但这只是一个储蓄问题。
加载日期(减少到 10 行):
变量 1 | 变量2 | 变量3 | 1级 | 2 级 | 3 级 |
---|---|---|---|---|---|
0.000565 | 0.97515 | 0.000052 | 1 | 0 | 0 |
0.000558 | 0.97514 | 0.000044 | 1 | 0 | 0 |
0.000553 | 0.97513 | 0.000036 | 1 | 0 | 0 |
0.000547 | 0.97512 | 0.000028 | 1 | 0 | 0 |
0.000541 | 0.97511 | 0.000018 | 1 | 0 | 0 |
0.000536 | 0.97510 | 0.000010 | 1 | 0 | 0 |
0.000531 | 0.97509 | 0.000006 | 1 | 0 | 0 |
0.000525 | 0.97508 | 0.000013 | 1 | 0 | 0 |
0.000520 | 0.97507 | 0.000021 | 1 | 0 | 0 |
0.000515 | 0.97506 | 0.000030 | 1 | 0 | 0 |
生成器的形状,samplelen 为 6,采样率为 1。它是第一个样本。
Shape of the generator data and label: (1, 3, 3) (1, 3)
[[[5.6456e-04 9.7515e-01 5.2059e-05]
[5.5257e-04 9.7513e-01 3.6473e-05]
[5.4131e-04 9.7511e-01 1.8311e-05]]]
[[1 0 0]]
第二个示例如下所示:
Shape of the generator data1 and label1: (1, 3, 3) (1, 3)
[[[5.5834e-04 9.7514e-01 4.4129e-05]
[5.4748e-04 9.7512e-01 2.8435e-05]
[5.3617e-04 9.7510e-01 1.0407e-05]]]
[[1 0 0]]