我有一个项目,我正在对一个大型数据库进行数据挖掘。我目前将所有数据存储在文本文件中,我试图了解存储数据关系数据库的成本和收益。这些点看起来像这样:
CREATE TABLE data (
source1 CHAR(5),
source2 CHAR(5),
idx11 INT,
idx12 INT,
idx21 INT,
idx22 INT,
point1 FLOAT,
point2 FLOAT
);
我可以在合理的表现下获得多少分?我目前有大约 1.5 亿个数据点,我可能不会超过 3 亿个。假设我使用的是具有 4 个双核 2ghz Xeon CPU 和 8GB RAM 的盒子。