我从十六进制形式的二进制项目中提取 4 克,这意味着我每个项目最多可以有 65535 克不同的克数。
我想将每个项目与它的克数及其频率相关联,但我对如何存储所有内容感到困惑——这是我的第一次数据挖掘经验,我对最佳实践和常用工具一无所知。
我本来想在关系数据库中构建一个大表,其模式类似于(ITEM-NAME, GRAM1, GRAM2... GRAM65535)
并在其中存储频率,但我可以看到这种方法由于列的数量而非常不切实际。
我知道那里必须有更好的解决方案,但我不知道在哪里看。
建议?