问题标签 [nltk-book]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

44 问题

0 投票

1 回答

104 浏览

python - 如何在 python 中使用 nltk 找到特定的二元组？

我目前正在使用 nltk.book iny Python，并希望找到特定二元组的频率。我知道有 bigram() 函数可以为您提供文本中最常见的二元组，如以下代码所示：

但是，如果我只搜索“希望”之类的特定内容怎么办？到目前为止，我在 nltk 文档中找不到任何关于此的内容。

2020-11-14T15:13:47.893

0 投票

0 回答

25 浏览

nlp - 什么是更自然的解析，导致句子的首选阅读

我有这些规则：

以及这两个可能的解析树：

我被问到下一个问题：

什么是更自然的解析，导致对句子的首选阅读？

谁能向我解释一下，英语中什么更自然，为什么？

按照这个

我看不出有任何更自然的区别。

nlp nltk stanford-nlp linguistics nltk-book

2021-01-05T14:30:52.277

0 投票

0 回答

53 浏览

python - 在 python NLTK 或其他包中将任何州、县、地区的名称或其缩写更改为国家/地区名称

我有一个位置列表，其中包含州、城市和国家、县和地区，有缩写，有一些是完整的。例如，纽约州、加利福尼亚州、英格兰、英国、美国、明尼苏达州、伦敦、布拉德福德等。我希望将其全部转换为国家/地区，例如 NY=USA、England=UK、Scotland = UK、Minnesota = USA 等。

我想要一个可以在我的程序中使用的包或库来将任何缩写、州、州代码或任何城市更改为位置所在的国家/地区。所以如果你是伦敦，它应该返回英国，芝加哥返回美国，等等。

是否有可能在python中实现这一点？提前致谢。

python nltk nltk-trainer nltk-book pycountry-convert

2021-01-22T02:40:39.457

0 投票

2 回答

34 浏览

python - 如何阅读以下代码行？

为这个基本问题道歉，因为我对这个话题很陌生。

您能否按照下面给出的格式破解上面的代码：

python nlp nltk nltk-book

2021-03-31T20:14:55.040

0 投票

1 回答

83 浏览

python - 在函数中使用 nltk.book 导入

我正在尝试编写一个简单的函数，如下所示：

我知道我可以在函数之前导入文本。但是，我想知道为什么会出现以下错误

ImportError：无法从“nltk.book”导入名称“文本”

它告诉我，作为语料库的“文本”在 nltk 中不存在——这是真的。但是，我希望用户将文本识别为 text1、text2 或 text3。

python function nlp nltk nltk-book

2021-05-02T00:57:38.077

0 投票

1 回答

23 浏览

python - 如何在标签后获得合并的单词？

我正在研究一个数据集，该数据集需要从数据框列的每个句子中提取形容词、动词和副词的所有单词。

这是我正在研究如何获得所需输出的示例。

它给我的输出是：

我需要得到的输出是这样的：

有人可以帮忙吗？

python nltk sentiment-analysis pos-tagger nltk-book

2021-06-16T15:36:33.467

0 投票

1 回答

34 浏览

nltk - 获取日语文本的 METEOR 分数

我希望为几个日语字符串生成 METEOR 分数。我已经导入nltk，但结果wordnet并omw不能说服我它工作正常。

这个输出0.5但肯定应该更接近于1.0参考和假设是相同的？

我是否需要以某种方式指定要在调用中使用的 wordnet 语言single_meteor_score()，例如：

single_meteor_score(reference, hypothesis, wordnet=wordnetJapanese.

nltk nltk-book

2021-07-21T19:41:21.160

0 投票

0 回答

56 浏览

nlp - 条件频率分布

嗨 :) 我对 Python 和 NLP 非常陌生，现在正在尝试阅读 O'Reilly 的 NLTK 书。我目前正处于关于使用条件频率分布进行绘图和制表的任务中。任务如下：“找出一周中哪些日子最有新闻价值，哪些日子最浪漫。定义一个名为 days 的变量，其中包含一周中的几天列表，即 ['Monday', ...]。现在使用 cfd.tabulate(samples=days) 将这些单词的计数制成表格。现在使用 plot 代替 tabulate 尝试同样的事情。您可以借助一个额外的参数来控制天数的输出顺序：samples=['Monday' , ...]。”

这是我的代码：

我的结果是：

我得到了什么

请有人向我解释为什么我有这些数据，而不是计算语料库中每种类型的每个单词使用了多少？我会非常感激任何帮助

nlp nltk nltk-book

2021-07-28T22:52:02.353

0 投票

1 回答

130 浏览