取决于你有多少内存,以及有多少令牌索引在内存中。
在任何旧计算机上都可以快速搜索 360MB 的总索引。360GB 的索引需要更长的时间...... ;)
例如,我启动了一个旧的 2GB 索引,并搜索“*e”。
在一个 8GB 的盒子上,它在 5 秒内返回了 50 万次点击。我在一个只有 1GB 内存的盒子上尝试了相同的索引,大约花了 20 秒。
为了进一步说明,这里有一些通用的 C# 代码,它基本上对 1000 万个随机 3 词短语进行“** E*”类型的搜索。
static string substring = "E";
private static Random random = new Random((int)DateTime.Now.Ticks);//thanks to McAden
private static string RandomString(int size)
{
StringBuilder builder = new StringBuilder();
char ch;
for (int i = 0; i < size; i++)
{
ch = Convert.ToChar(Convert.ToInt32(Math.Floor(26 * random.NextDouble() + 65)));
builder.Append(ch);
}
return builder.ToString();
}
static void FindSubStringInPhrases()
{
List<string> index = new List<string>();
for (int i = 0; i < 10000000; i++)
{
index.Add(RandomString(5) + " " + RandomString(5) + " " + RandomString(5));
}
var matches = index.FindAll(SubstringPredicate);
}
static bool SubstringPredicate(string item)
{
if (item.Contains(substring))
return true;
else
return false;
}
在将所有 1000 万个阶段加载到列表中之后,“var matches = index.FindAll(SubstringPredicate);”仍然只需要大约一秒钟 返回超过 400 万次点击。
关键是,内存很快。一旦事情不再适合内存并且您必须开始交换到磁盘,您就会看到性能下降。