我问这是一个关于 的一般/初学者问题R
,而不是特定于我使用的包。
我有dataframe
300 万行和 15 列。我不认为这是一个巨大的数据框,但也许我错了。
我正在运行以下脚本,它已经运行了 2 个多小时 - 我想我必须采取一些措施来加快速度。
代码:
ddply(orders, .(ClientID), NumOrders=len(OrderID))
这不是一个过于密集的脚本,或者我不认为它是。
在数据库中,您可以向表中添加索引以提高连接速度。R
我应该在导入时执行类似的操作以使函数/包运行得更快吗?