1

我有一个包含不同太阳能发电厂时间序列数据的数据库:太阳有多强以及该工厂创造/收获了多少电力。该数据以 15 分钟为增量。

我想使用数据挖掘来获得新的见解,然后将发现可视化给用户。

我知道这属于数据挖掘领域,但我的问题可能更具体(处理时间序列数据)。那么我可以从这种数据中提取什么,或者我在哪里可以读到这个?

4

1 回答 1

1

时间序列分析本身就是一个完整的领域。也就是说,您始终可以从一些基础知识开始,并不断为您的分析添加更多内容。

从您的太阳能数据开始,您可以尝试以下几件事:

  1. 首先,分析您的太阳能数据。也就是说,计算最小值、最大值、每日平均值、每小时峰值和最低值等,以了解数据。使用 x 轴绘制时间将为您提供视觉信息。
  2. 时间序列数据可以分解为“趋势”和“季节性”(可以是任何重复的时间间隔)
  3. 在数据流中寻找异常值和异常。缺失值、重复等。

如果您想了解有关时间序列的更多信息(并且如果知道 R),那么该forecast软件包是入门的好方法。(尤其是这本免费的电子书

对时间序列的任何搜索都会将您带到 Hyndman 教授的页面,我发现他的预测书的免费章节非常有用。

希望能帮助您入门。

于 2012-10-29T23:43:04.880 回答