我正在将“zxcvbn”密码强度算法从 JavaScript 转换为 Scala。我正在寻找一种纯函数算法来查找字符串中的重复字符序列。
我知道我可以从 JavaScript 翻译命令式版本,但出于函数式编程通常给出的所有原因,我想尽可能地保持它没有副作用。
该算法可以是 Scala、Clojure、Haskell、F#,甚至是伪代码。
谢谢。
我正在将“zxcvbn”密码强度算法从 JavaScript 转换为 Scala。我正在寻找一种纯函数算法来查找字符串中的重复字符序列。
我知道我可以从 JavaScript 翻译命令式版本,但出于函数式编程通常给出的所有原因,我想尽可能地保持它没有副作用。
该算法可以是 Scala、Clojure、Haskell、F#,甚至是伪代码。
谢谢。
使用 Haskell 的标准高阶函数:
Data.List.group
查找列表中相等元素的运行:
> group "abccccdefffg"
["a","b","cccc","d","e","fff","g"]
我们关心这些运行的长度,而不是元素本身:
> let ls = map length $ group "abccccdefffg"
> ls
[1,1,4,1,1,3,1]
接下来,我们需要每个组的起始位置。这只是组长度的部分总和,我们可以使用 来计算scanl
:
> scanl (+) 0 ls
[0,1,2,6,7,8,11,12]
压缩这两个列表会给我们所有的起始位置对和相应的长度:
> zip (scanl (+) 0 ls) ls
[(0,1),(1,1),(2,4),(6,1),(7,1),(8,3),(11,1)]
最后,我们删除长度小于 3 的组。
> filter ((>= 3) . snd) $ zip (scanl (+) 0 ls) ls
[(2,4),(8,3)]
把它放在一起:
import Data.List (group)
findRuns :: Eq a => [a] -> [(Int, Int)]
findRuns xs = filter ((>= 3) . snd) $ zip (scanl (+) 0 ls) ls
where ls = map length $ group xs
这是另一个 Scala 解决方案
def findRuns(password: String): List[(Int, Int)] = {
val zipped = password.zipWithIndex
val grouped = zipped groupBy { case (c, i) => c }
val filtered = grouped.toList.filter{ case (c, xs) => xs.length >= 3 }
val mapped = filtered map { case (c, xs) => xs }
val result = mapped map (xs => (xs.head._2, xs.length))
result.sorted
}
Clojure 版本的hammar算法
(defn find-runs [s]
(let [ls (map count (partition-by identity s))]
(filter #(>= (% 1) 3)
(map vector (reductions + 0 ls) ls))))
这是我想出的 Scala 解决方案:
def repeatMatch(password: String): List[(Int, Int)] = {
val length = password.length
@tailrec
def loop(offset: Int,
result: List[(Int, Int)]): List[(Int, Int)] = {
if (offset >= length) result.reverse
else {
val candidate = password.charAt(offset)
val run = password.substring(offset).zip(Array.fill(length)(candidate)).
takeWhile{case (first, second) => first == second}.length
if (run > 2) loop(offset + run, (offset, run) :: result)
else loop(offset + 1, result)
}
}
loop(0, List.empty[(Int, Int)])
}
对于测试用例repeatMatch("abccccdefffg")
,结果是List((2,4), (8,3))
也许run
可以改进计算。