我是一名文学研究生,我一直在阅读 O'Reilly 在自然语言处理方面的书 (nltk.org/book)。它看起来非常有用。我已经玩过第 1 章中的所有示例文本和示例任务,比如索引。我现在知道白鲸用了多少次“鲸鱼”这个词。问题是,我无法弄清楚如何对我自己的一篇文章进行这些计算。我找到了有关如何创建自己的语料库的信息(O'Reilly 书的第 2 章),但我不认为这正是我想要做的。换句话说,我希望能够做到
import nltk
text1.concordance('yellow')
并获取在我的文本中使用“黄色”一词的地方。目前我可以用示例文本做到这一点,但不是我自己的。
我对 python 和编程非常陌生,所以这些东西非常令人兴奋,但也非常令人困惑。