如何使用 redis 实现自动完成?
比如说我有一个数组["alfred","joel","jeff","addick"]
。当我打字时,a
我得到["alfred", "addick"]
我希望你明白这一点。如何有效地使用 redis 命令实现这一点(如果可能,但我认为是这样)。如果我能得到一些简单的命令,我可以通过 telnet 尝试模仿这种行为,那就太好了。
谢谢
PS:祝大家圣诞快乐:)
如何使用 redis 实现自动完成?
比如说我有一个数组["alfred","joel","jeff","addick"]
。当我打字时,a
我得到["alfred", "addick"]
我希望你明白这一点。如何有效地使用 redis 命令实现这一点(如果可能,但我认为是这样)。如果我能得到一些简单的命令,我可以通过 telnet 尝试模仿这种行为,那就太好了。
谢谢
PS:祝大家圣诞快乐:)
如果您正在处理大型数据集,我建议您考虑将其作为一个尝试来实现。我已经拼凑了一点 Ruby 可以做到这一点:
require 'rubygems'
require 'redis'
class RedisTrie
TERMINAL = '+'
def initialize(prefix)
@prefix = prefix
@r = Redis.new
end
def add_word(word)
w = word.gsub(/[^a-zA-Z0-9_-]/, '')
key = "#{@prefix}:"
w.each_char do |c|
@r.zset_add key, c.bytes.first, c
key += c
end
@r.zset_add key, 0, TERMINAL
end
def add_words(*words)
words.flatten.compact.each {|word| add_word word}
end
def suggest(text)
@r.zset_range("#{@prefix}:#{text}", 0, -1).map do |c|
(c == TERMINAL) ? text : suggest(text + c)
end.flatten
end
end
rt = RedisTrie.new('trie')
rt.add_words %w( apple automobile carwash oil-change cranky five ruthie axe auto )
p rt.suggest(ARGV.shift.to_s)
例如:
$ ruby RedisTrie.rb
["apple", "auto", "automobile", "axe", "carwash", "cranky", "five", "oil-change", "ruthie"]
$ ruby RedisTrie.rb a
["apple", "auto", "automobile", "axe"]
$ ruby RedisTrie.rb au
["auto", "automobile"]
$ ruby RedisTrie.rb aux
[]
在Wikipedia 的 Tries 条目中阅读更多关于 Tries的信息。
您肯定会希望优化您的建议方法以不返回所有值,而只返回它找到的第一个 X 值。它会破坏迭代整个数据结构的目的。
在阅读 Simon Willison 令人印象深刻的Redis 教程时,我也发现了这个片段。
你好,麦克斯,
KEYS 不是要走的路,你能做的最好的事情就是使用一个排序集。您想要的是将字符串的前 4 或 5 个字符转换为整数(例如,您可以将每个字符想象为 radix 256 数字的数字,但有更好的表示形式)并将所有用户名添加到排序集中.
然后使用 ZRANGEBYSCORE 可以获得给定范围之间的所有元素。
这种方法更具可扩展性,因为它是 O(log(N)) 的事情。
我在我非常缓慢发展的 Redis 书中介绍了这些东西......
干杯,萨尔瓦多
这是 PHP 中用于使用 redis 进行字母自动完成的简单算法:
function getNextChar($char) {
$char++;
if(strlen($char) > 1) { $char--; }
return $char;
}
function createDictionary($redis, $key, $wordList) {
if(!$redis->exists($key)) {
foreach($wordList as $word) {
$redis->zadd($key, 0, $word);
}
}
}
function getLexicalAutocomplete($redis, $dictionaryKey, $input) {
$inputNext = substr($input, 0, -1) . getNextChar(substr($input, -1)); //ab -> ac
$redis->zadd($dictionaryKey, 0, $input);
$redis->zadd($dictionaryKey, 0, $inputNext);
$rangeStart = $redis->zrank($dictionaryKey, $input)+1;
$rangeEnd = $redis->zrank($dictionaryKey, $inputNext)-1;
$autocompleteResults = $redis->zrange($dictionaryKey, $rangeStart, $rangeEnd);
$redis->zrem($dictionaryKey, $input);
$redis->zrem($dictionaryKey, $inputNext);
return $autocompleteResults;
}
$redis = new Redis();
$redis->connect('', 0); //Your redis server ip/port goes here
createDictionary($redis, "dict", array("alfred", "joel", "jeff", "addick"));
$result = getLexicalAutocomplete($redis, "dict", $argv[1]);
echo json_encode($result);
基于 Salvatore 的文章Auto Complete with Redis,除了我需要生成一个额外的自动完成字典,代价是一点点性能损失(额外的几个 zadds 和 zrems),但在大多数情况下它应该执行好。该脚本假定为 phpredis,但实际上应该与 predis 相同。
输出示例:
> php redisauto.php a
["addick","alfred"]
> php redisauto.php ad
["addick"]
> php redisauto.php al
["alfred"]
> php redisauto.php j
["jeff","joel"]
> php redisauto.php je
["jeff"]
这里是原始 antirez 在 Python 中的 Ruby 实现的一个端口:
http://www.varunpant.com/posts/auto-complete-with-redis-python