python - 为什么实现随机词生成器需要累积频率和列表？

Question

我正在做Think Python: How to Think Like a Computer Scientist中的练习 13.7 。练习的目标是提出一种相对有效的算法，该算法从单词文件（比方说小说）中返回一个随机单词，其中返回单词的概率与其在文件中的频率相关。

作者建议采取以下步骤（可能有更好的解决方案，但这可能是我们迄今为止在本书中介绍的最佳解决方案）。

我的问题是：以下解决方案有什么问题？

谢谢。

score 1 · Accepted Answer

您的方法（也）是正确的，但它使用与输入文本大小成比例的空间。本书建议的方法使用的空间仅与输入文本中不同单词的数量成比例，通常要小得多。（想想像“the”这样的词在英文文本中出现的频率。）

1 回答 1