我的目标是根据条件以有效的方式计算文件中字符串的出现次数。
我在输入 csv 文件中有大约 45k 条记录。我需要阅读它们并创建一个新文件,该文件描述特定时间段内原始文件中字符串的出现次数。
输入文件:
Timestamp Field
7/13/2013 10:30 ABC
7/13/2013 11:30 ABC
7/13/2013 10:34 ABC
7/13/2013 10:15 CDE
7/13/2013 10:00 ABC
7/13/2013 10:14 CDE
7/13/2013 12:30 ABC
7/13/2013 00:30 ABC
7/13/2013 07:30 CDE
主要目标是计算特定时间段内的字段出现次数。
我期待的输出是:
Slots ABC CDE
7/13/2013 00:01-03:00 1 0
7/13/2013 03:01-06:00 0 0
7/13/2013 06:01-09:00 0 1
7/13/2013 09:01-12:00 4 2
7/13/2013 12:01-15:00 1 0
7/13/2013 15:01-18:00 0 0
7/13/2013 18:01-21:00 0 0
7/13/2013 21:01-24:00 0 0
我已经编写了一个蛮力代码来完成我的工作,但是需要大量时间才能完成。我正在寻找一个有效的代码来完成这项任务。
我有一个单独的数据框,其中包含时隙(day_hour)和字段名称(field_data)。我的蛮力方法是使用两个 for 循环在两个数据帧的所有记录中搜索并相应地计算出现次数。
如果我可以使用类似的功能table()
或可以在这种情况下提供帮助的功能,请指导我。