2

我一直在寻找可以导入并使用到我正在研究的密码短语构建工具中的名词、动词和形容词的单词列表。我没有抓住英语中的每一个单词,而是试图找到可以连接成声音密码短语的更简单的单词。

有谁知道这样的资源?我尝试过 Google 搜索、Binging、嬉皮士和 hoppity,但我似乎找不到任何相关内容。

4

5 回答 5

1

当您说“通过电话轻松沟通”时,您的意思是指在由各种说话者发音时通常很难与其他词混淆的词?即,也许“cape”听起来很独特,但是“teen”听起来太像“fifty”了?如果是这样,你手头有一项艰巨的任务。

您可以通过分析 Google Ngram 集获得“常用”词: http ://storage.googleapis.com/books/ngrams/books/datasetsv2.html

您可以使用 soundex/metaphone 分析来确定“声音唯一性”。

如果我接受这个,我会:

  1. 获取某个(最近)年份最常见的 1 克。
  2. 计算/存储每个单词的双变音位
  3. 按变音位分组,看看在变音位只有 1 个与之相关的常用词的情况下你得到了多少。

所以,是的,这不是一个简单的列表,但你所要求的也不简单,对不起!

于 2013-04-16T01:45:21.277 回答
1

您可以使用(几乎)所有 unix 发行版附带的词汇表。可以在/usr/share/dict/words.

这是列表,如果您没有 unix 框

于 2013-04-09T03:16:45.490 回答
0

我会对此进行破解,但您可能不喜欢答案。我能想到的最简单的方法是使用搜索词“名词”或“动词”以及 fyletype:csv 在谷歌上查找 CSV 列表。找到符合条件的文件后。我在 GITHub 上找到了很多,您可以进行一些 github 调用,或者如果不在 GIT 上,您可以使用您选择的服务器端语言对文件进行 CURL 或 HTTP 调用...生成逗号分隔列表或数组(某种结构),然后创建一个随机函数并调整列表(使用 randrange 或类似的方法获取一个或两个最重要的单词并拼接 rand 号)。然后,您可以连接一串单词和数字。如果您可以为所有单词制作一个简单的两个或三个字段表(剪切并粘贴它们)或从原始文件导入,那就更容易了...... 并做一个做同样事情的查询。选择一个或三个随机单词并将它们连接起来,并使用记录的行号来唯一化它们。

但是有两件事是肯定的,你需要一个消耗过程,你需要字符串连接函数。

于 2013-04-15T20:50:33.677 回答
0

请检查这些: http: //ogden.basic-english.org/words.html https://simple.wikipedia.org/wiki/Wikipedia:List_of_1000_basic_words https://simple.wikipedia.org/wiki/Wikipedia:Basic_English_alphabetical_wordlist

通过使用简单的网络抓取,您可以获取所有这些单词的列表,然后使它们独一无二。

此外还引用了其他一些链接,也请检查这些链接。

于 2013-04-15T18:59:28.547 回答
0

我完全推荐这个: http: //packetstormsecurity.com/Crackers/wordlists/

只是在开玩笑!你试过WordNet吗?它有各种语言、平台等的接口,非常强大。

于 2013-04-15T20:10:58.707 回答