Jeff Atwood 最近在推特上发布了一个指向 CodeReview 帖子的链接,他想知道社区是否可以改进他的“计算字符串的熵”代码片段。他解释说:“我们在 Stack Overflow 的几个地方计算字符串的熵,作为低质量的标志。”
他的方法的要点似乎是,如果您计算字符串中唯一字符的数量,则表示熵(代码取自PieterG 的答案):
int uniqueCharacterCount = string.Distinct().Count();
我不明白唯一字符数如何表示字符串的熵,以及字符串的熵如何表示低质量。我想知道在这方面有更多知识的人是否可以解释阿特伍德先生正在努力实现的目标。
谢谢!