我有这样的csv文件:
1392249600;EUR;CHF;USD;JPY;GBP
1392163200;GBP;JPY;USD;CHF;EUR
1392076800;GBP;CHF;EUR;JPY;USD
1391990400;JPY;USD;EUR;CHF;GBP
1391904000;GBP;EUR;CHF;USD;JPY
1391731200;GBP;EUR;CHF;JPY;USD
1391644800;EUR;CHF;USD;JPY;GBP
1391558400;JPY;USD;EUR;CHF;GBP
该文件中可能有超过 15 000 行。我正在尝试编写可以执行此类操作的代码:
1.将第一行保存为父行。然后作为那个孩子需要接下来的 3 天。
2.计算该文件中子项与该父项的频率和组合。
3.它为此创建了类似摘要的内容,因此我可以阅读今天的组合,脚本显示接下来 3 天中唯一最常见的子组合。
我没有数学思维,所以我有很大的问题要自己找到解决方案。
我认为首先我需要脚本来生成这些由 EUR、CHF、USD、JPY、GBP 组成的列的所有可能组合,因此可能有 5*4*3*2*1 = 120 种组合。因为他们不能单行重复。
会是这样。
第一个父项将是第一行的组合,如下所示:EUR;CHF;USD;JPY;GBP
Then 3 childs would be
GBP;JPY;USD;CHF;EUR
GBP;CHF;EUR;JPY;USD
JPY;USD;EUR;CHF;GBP
它将这种组合保存在父元素和子元素之外。然后它再次从文件的开头开始,但在下面移动一行(如迭代 +1)。那么接下来所有的孩子都会
GBP;CHF;EUR;JPY;USD
JPY;USD;EUR;CHF;GBP
GBP;EUR;CHF;USD;JPY
它再次保存这些组合以进行计数并得出一些频率结果。这个循环对 csv 文件上的所有行重复。
是否有一些提示我应该考虑如何创建这种类型的程序?
任何提示都会很棒!
非常感谢!BB