搜索技术的重要组成部分是什么?
- 分布式文件系统
- 云计算
- 存储系统
- 排名算法
- 搜索算法
或者是其他东西?
//开始讽刺回答
RAM + CPU + 带宽 + 非常棒的搜索引擎软件
//结束讽刺的回答
不过说真的,像搜索技术这样复杂的东西将取决于许多问题,正如您已经列出的那样。试图将其固定在一颗奇异的银弹上确实不适用。
我认为在搜索中尚未解决的更大问题是Onotology。我们很难以人性化的方式理解和分类结果。有人称其为“语义网”。我们有大量的数据和索引,但我们对它进行分类或很好地理解它是一种非常糟糕的方式。错误在于我们缺乏以搜索(算法)可以理解的方式进行原子的自我表达。
索引?
搜索和排名至关重要,索引也是如此。您需要有效的算法来找到与我输入的关键字(ala google、yahoo 等)非常匹配的结果,然后您需要对这些结果进行排名。
搜索引擎的性能至关重要;缓慢的服务是死的,但这不是最重要的方面;我认为,该徽章与结果的相关性有关。
我们要求搜索引擎做不可能的事;获取一个短语或几个关键字,并以某种方式返回与我们想要的完全相关的一大堆结果——我们可能不知道我们在寻找什么,但只要我们看到它,我们就可以识别它。同样,当搜索引擎返回“错误的东西”时,我们会立即知道。
归根结底,这一切都是为了让一台愚蠢的机器按照我们的意思去做,而不是我们所说的,这在计算中基本上是一个无法解决的问题。最好的搜索解决方案总是那些拥有最新颖的结果排名方式并将它们与我们的原始查询相关联的解决方案。正如韦恩·哈特曼 (Wayne Hartman) 在他的回答中所描述的那样,这个概念与本体论的概念密切相关。
作为我最后一年项目的一部分,我构建了一个小型搜索引擎,我可以告诉你倒排索引是搜索引擎的重要组成部分。
我也可以说爬行者是一个重要的部分。
您也可以说 Page Rank 算法很重要。
你可以说集群很重要。
……
你到底在找什么?你的问题对我来说似乎很广泛。