我在使用 Python 下的 NLTK 时遇到问题,特别是 .generate() 方法。
生成(自我,长度=100)
打印使用三元语言模型生成的随机文本。
参数:
* length (int) - The length of text to generate (default=100)
这是我正在尝试的简化版本。
import nltk
words = 'The quick brown fox jumps over the lazy dog'
tokens = nltk.word_tokenize(words)
text = nltk.Text(tokens)
print text.generate(3)
这将始终生成
Building ngram index...
The quick brown
None
与从单词中构建随机短语相反。
这是我的输出
print text.generate()
Building ngram index...
The quick brown fox jumps over the lazy dog fox jumps over the lazy
dog dog The quick brown fox jumps over the lazy dog dog brown fox
jumps over the lazy dog over the lazy dog The quick brown fox jumps
over the lazy dog fox jumps over the lazy dog lazy dog The quick brown
fox jumps over the lazy dog the lazy dog The quick brown fox jumps
over the lazy dog jumps over the lazy dog over the lazy dog brown fox
jumps over the lazy dog quick brown fox jumps over the lazy dog The
None
再次从相同的文本开始,然后改变它。我也尝试过使用 Orwell 1984 年的第一章。同样,它总是从前3 个标记(在这种情况下其中一个是空格)开始,然后继续随机生成文本。
我在这里做错了什么?