我目前正在使用 MS SQL Server 2008,但我不确定它是否是完成这项特定任务的最佳系统。
我有一个像这样的表:
PK_ptA PK_ptB DateInserted LookupColA LookupColB ... LookupColF DataCol (ntext)
一个常见的查询是
SELECT TOP(1000000) DataCol FROM table
WHERE LookupColA=x AND LookupColD=y AND LookupColE=z
ORDER BY DateInserted DESC
该表大约有 10 亿行,每天插入 500 万行。
我对 SQL Server 的主要问题是分片或分散数据文件不太容易。此外,导出似乎以每秒 1000 行(约 1MB/秒)的速度最大,这似乎非常慢。
我遇到的另一个问题是,对于 SQL Server,如果我想添加一个新的 LookupCol,日志文件会大幅增长,需要大量很少使用的可用空间。
这个问题有什么明显更好的解决方案吗?