Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我目前将各种站点事件(印象、点击事件、页面部分视图等)存储在 simpledb 中以进行原始数据记录,并且我正在探索处理这些数据的最佳方法。
由于 pandas 看起来可以通过多种不同的查询方法来满足要求(尚未进行深入研究),我正在考虑每天一次将 simpledb 中的所有记录(或增量记录)导出到 CSV 文件中,然后循环遍历所有的csv并导入熊猫。
csv 中大约有 15 列,可能有 10 条记录。
这是处理分析的好选择吗?或者有人可以提出更好的选择吗?