问题标签 [nltk-book]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

44 问题

0 投票

2 回答

2154 浏览

python - Python，NLTK：NameError：未定义名称“load_parser”

我正在尝试在这里运行 NLTK 书中提供的这个示例：

但是当我输入第一行时，它给了我这个错误：

我尝试寻找类似的问题，但没有一个有相同的问题。我该如何解决？

2017-05-20T15:29:16.393

0 投票

1 回答

710 浏览

python - 'str' 对象在 NLTK 中不可调用

错误：如果 type(chunk) == nltk.tree.Tree 和 chunk.label() == "DataChunk": TypeError: 'str' object is not callable

但是我可以打印chunk.label()

python python-2.7 nlp nltk nltk-book

2017-05-29T06:50:08.810

0 投票

1 回答

1394 浏览

python - nltk "OMW" wordnet 与阿拉伯语

我正在使用专门针对阿拉伯语的（OMW）wordnet 开发 python/nltk。所有功能都可以在英语中正常工作，但是当我使用“arb”标签时，我似乎无法执行其中的任何一个。唯一有效的方法是lemma_names从给定的阿拉伯语同义词集中提取。

下面的代码适用于 u'arb'：输出是阿拉伯引理的列表。

当我尝试使用同义词集、定义、示例、上位词执行与上述代码相同的逻辑时，我收到一条错误消息：

（如果我提供'arb'标志）或

如果我写，这是将不起作用的代码之一 synset.hyponyms(u'arb')：

这是否意味着我无法使用 wn.all_synsets 和其他内置函数来提取所有阿拉伯语同义词、上位词等？

python python-2.7 nltk wordnet nltk-book

2017-07-18T03:27:07.437

0 投票

0 回答

80 浏览

python - Steven Bird 书中 nltk.TaggerI 的功能

我目前正在使用 Python 浏览 Steven Bird 的 NLP。我有个问题。nltk.TaggerI 的作用是什么？它在第 6 章的示例 6-5 中。

我希望对此有更好的了解。谢谢

python nltk-book

2017-08-24T07:40:01.603

0 投票

2 回答

335 浏览

python-3.x - 字典在python中没有正确排序

我的代码应该输出语料库中频率最高的前 10 个单词。但是，它给出了 10 个随机单词的输出。

当前的输出低于错误：

请帮助

python-3.x nltk nltk-book

2017-09-10T11:42:42.133

0 投票

1 回答

358 浏览

python - 如何处理字符之间有空格的单词？

我正在使用达nltk.word_tokenize里语。问题是我们在一个单词之间有空格。
例如"زنده گی"表示生命的词。和相同的; 我们还有很多别的词。所有以字符结尾的单词"ه"我们必须给它一个空格，否则，它可以组合，例如"زندهگی"。

任何人都可以帮助我使用[tag:regex]或任何其他方式不应该标记一个单词的一部分以结尾的单词，"ه"然后，就会有这个"گ "字符。

python regex nltk nltk-trainer nltk-book

2017-09-20T09:29:45.773

0 投票

1 回答

240 浏览

python-3.x - 在应用 ngram 之前理解输入文本的最佳方法

目前我正在从excel文件中读取文本并将bigram应用到它。finalList具有以下示例代码中使用的列表，具有从输入 excel 文件中读取的输入单词列表。

在以下库的帮助下从输入中删除了停用词：

应用于单词输入文本列表的二元逻辑

输入文本：我完成了端到端的流程。

当前输出：已完成结束，结束结束，结束过程。

期望的输出：完成端到端、端到端的过程。

这意味着像 (end-to-end) 这样的一组词应该被视为 1 个词。

python-3.x pandas nlp nltk nltk-book

2017-10-09T07:25:04.300

0 投票

0 回答

405 浏览

python - ntlk TypeError：预期的字符串或类似字节

当我尝试使用 nltk 包中的 sent_tokenize 时，我有 TypeError: expected string or bytes-like object

这是我的代码：

你能帮我吗？非常感谢

python python-3.x nltk nltk-book

2018-01-23T21:33:28.167

0 投票

1 回答

400 浏览

python - 如何找到 NLTK 缺失的资源？

我是 python 编程的新手，我的目标是学习使用 nltk 书籍收藏。但不幸的是，我无法使用任何函数，它显示了一个查找错误，并建议使用函数 nltk.download('genesis')。但是我在下载管理器中找不到任何名为 genesis 的资源。这是显示的屏幕截图

还

python nltk nltk-book

2018-02-25T14:59:12.983

0 投票

0 回答

638 浏览

python - 从 github repo 设置 nltk 数据

我正在关注nltk 书第 1 章。我能够安装nltk( import nltk) 但无法通过运行下载图书语料库nltk.download()。它给了我getattrinfo failed错误。所以我开始快速浏览本章中的命令而不执行这些命令，因为给出的大多数示例都需要书籍语料库。

但现在我想尝试FreqDist示例。

跑的时候FreqDist，我意识到我还没有做from nltk.book import *。所以，我再次尝试安装书籍语料库。现在，我完全厌倦了尝试各种帖子中给出的不同解决方案来修复getattrinfo failed导入 nltk 数据时发生的错误。（我尝试设置公司代理，更改 nltk 下载器源链接等许多东西）

因此，我没有遵循使用 nltk 下载器的路线，而是尝试做一些可能很奇怪的事情。我从下载ziphttps://github.com/nltk/ ，解压缩然后setup.py在其中运行。

现在当我运行时from nltk.book import *，我得到以下输出：

我手动复制粘贴的nltk文件夹也包含book.py在上面列出的各种文件夹中：

但是没有用。如何从 github 下载的 zip 将这本书导入到我的解释器环境中，而不需要使用 nltk 下载器？甚至可能吗？

python nltk nltk-book

2018-03-06T10:48:14.733

1 2 3 4 5 6 7 8 9 10

问题标签 [nltk-book]

Reference