问题标签 [sktime]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 用于使用 scikit 训练 ML 的 JSON 列表的数据框行
我正在尝试使用Sktime对一组作为实验组织的 JSON 文件进行多变量分类。
输入是以下结构:
分类标签设置为形状为 (len(files), 1) 的 DataFrame。以下是我的六个文件的实现。X 的结果形状是 (9528, 5) 并且应该是六行,每行包含文件的 JSON:
我很难找到如何构建数据帧的信息,其中每一行表示编码或未编码的 JSON 或 CSV 或其他表示没有时间戳的时间序列的对象的列表。我看到了 JSON 被编码为数字键的例子,而其他的则有字符串。到目前为止,我找不到任何可以帮助我在一系列文件上使用这些列表构建数据框的东西。
python - Python 中每个即将到来的样本的时间序列分类
我目前正在研究 Python 中的时间序列分类,到目前为止我已经尝试过 sktime 库。据我了解,大多数进行预测的方法都需要一个时间序列:
我的问题是:如何搜索和应用算法,这些算法在进行预测时需要时间 t0 的单个数据点,而不是完整的时间序列?喜欢:
python - sktime ARIMA 无效频率
我尝试从 sktime 包中拟合 ARIMA 模型。我导入一些数据集并将其转换为熊猫系列。然后我将模型拟合到火车样本上,当我尝试预测错误时。
错误消息如下:
我在读取数据集时尝试使用.asfreq("M")
,但是,该系列中的所有值都变为NaN
.
有趣的是,这段代码适用于来自 github 的默认load_airline
数据集,sktime.datasets
但不适用于我来自 github 的数据集。
time-series - 如何在 sktime 中使用 SlidingWindowSplitter
我需要从sktime
包中拟合 ARIMA 模型。我想使用SlidingWindowSplitter
fromsktime.forecasting.model_selection
但我真的不明白它是如何工作的。如果我想安装一个简单的 ARIMA,我会这样做
但是这如何与 SlidingWindowSplitter 一起工作?
python - 使用 cleanlab 和 sktime 进行带噪声标签的时间序列分类
所以我想使用 cleanlab 改进可能的 sktime 分类器。以下是一些示例数据
True
这将为带有 label 的 sin 函数和带有 label 的tan 函数创建时间序列数据集False
。为了创建一些标签错误,我们将前 20 个目标设置为 True
现在我正在使用sktime
分类器来查找每个时间序列的标签,效果很好
但是,我想用来cleanlab
通知分类器他的一些训练标签可能不正确
但这会导致 KeyError
由于LearningWithNoisyLabels
与其他分类器一起为我工作,我猜 sktime 分类器有问题,但我不确定
版本信息:
进口:
python - 使用 keras timeseriesgenerator 进行 sktime?时间戳有必要吗?
我有一个包含一些(35 列)变量和数百万(行)时间步长的数据框。我想用 timeseriesgenerator ( https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/sequence/TimeseriesGenerator ) 切割数据。我以前为一些神经网络做过。我想坚持使用生成器,因为我需要跳过一些样本,但目前还不清楚有多少。
是否可以使用生成器来提供 sktime 的示例?我有一个分类问题。数据以长模式提供。生成器不提供时间戳。或者有什么解决方法吗?我想使用 sktime,但未能获得数据。数据包含时间变量,但记录时出现问题。所以有很大的差距,但这只是一个储蓄问题。
加载日期(减少到 10 行):
变量 1 | 变量2 | 变量3 | 1级 | 2 级 | 3 级 |
---|---|---|---|---|---|
0.000565 | 0.97515 | 0.000052 | 1 | 0 | 0 |
0.000558 | 0.97514 | 0.000044 | 1 | 0 | 0 |
0.000553 | 0.97513 | 0.000036 | 1 | 0 | 0 |
0.000547 | 0.97512 | 0.000028 | 1 | 0 | 0 |
0.000541 | 0.97511 | 0.000018 | 1 | 0 | 0 |
0.000536 | 0.97510 | 0.000010 | 1 | 0 | 0 |
0.000531 | 0.97509 | 0.000006 | 1 | 0 | 0 |
0.000525 | 0.97508 | 0.000013 | 1 | 0 | 0 |
0.000520 | 0.97507 | 0.000021 | 1 | 0 | 0 |
0.000515 | 0.97506 | 0.000030 | 1 | 0 | 0 |
生成器的形状,samplelen 为 6,采样率为 1。它是第一个样本。
第二个示例如下所示:
python - 如何解释 sktime 的数据格式?
我只见过以二维表格格式显示的时间序列数据。但是,sktime 是一个新的但流行的 python 包,它使用嵌套的 pandas 数据框,我无法理解他们对它所代表的含义的解释。
它看起来像这样。
这打破了我对数据的理解。什么东西在这里代表什么?这有什么意义?我一直在试图找到某种解释,解释为什么这种格式有意义或为什么有用,但是所有的 sktime 文档都只是跳过了这一点,就像它是微不足道的一样。
假设我有一些看起来像我通常使用的时间序列数据:
这里的第三维在哪里?第三维度甚至来自哪里?这在 sktime 使用的嵌套数据框中会是什么样子?此外,sktime 似乎将其称为单变量时间序列,但这打破了我对单变量一词的理解,因为它显然具有多个变量。
python - sktime 导入:“sktime.classification.interval_based”问题
任何人都可以帮助解决这个问题吗?
上下文是导入用于多元时间序列分类的模块TimeSeriesForestClassifier
显然它接受:
但不是