1

我目前将各种站点事件(印象、点击事件、页面部分视图等)存储在 simpledb 中以进行原始数据记录,并且我正在探索处理这些数据的最佳方法。

由于 pandas 看起来可以通过多种不同的查询方法来满足要求(尚未进行深入研究),我正在考虑每天一次将 simpledb 中的所有记录(或增量记录)导出到 CSV 文件中,然后循环遍历所有的csv并导入熊猫。

csv 中大约有 15 列,可能有 10 条记录。

这是处理分析的好选择吗?或者有人可以提出更好的选择吗?

4

0 回答 0