我正在建立一个搜索引擎。我使用的是 NoSQL 各种键值数据存储,特别是 Amazon SimpleDB,而不是常规的 RDBMS。我有一个指向网页的 URL 表。我想我需要建立另一个表格,可以用来查找哪些页面包含给定的英文单词。
该表的结构是:Search (String word, String URL)
我的查询看起来像select from Search where word = "foo"
我应该在存储单词之前对单词进行哈希处理并进行查找吗? IE。我应该使用表:Search (String word_hash, String URL)
并使用类似的查询select from Search where word = "acbd18db4cc2f85cedef654fccc4a4d8"