我正在实现模式挖掘算法,通常输入数据是具有以下格式的文件
item1 item2 item3
item0 item3 item10
....
item30 item40 item30
通常itemx
是一个String
。为了提高效率,我曾经读取ByteString
比默认文件更快的文件String
。由于模式挖掘算法的主要任务是项目集之间的比较。我想知道如果我更改输入文件格式以便进行比较Int
而不是比较ByteString
. 这是新颖的格式:
1 2 3
0 3 10
....
30 40 30
谢谢 !