问题标签 [nltk-book]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
123 浏览

python-3.x - 构建基于特征的语法时,为什么会出现“无效语法”错误?

为什么在 % start S 的行中出现“无效语法”?

0 投票
1 回答
41 浏览

nltk - 为 nltk 设置 macecommand 的路径

我找到了从链接 config_prover9 设置 prover9 路径的方法中为 prover9设置路径的解决方案 是否也有类似的方法来处理 macecommand?我的代码如下

有没有办法设置它来找到我安装 Macecommand 的目录?提前致谢。

0 投票
2 回答
880 浏览

python - Python - 使用递归函数按字母顺序打印出 trie

我正在阅读Bird、Klein 和 Loper的NLTK 书籍,但遇到了一个问题。我正在阅读这本书是为了丰富自己的个人生活,而不是为了上课。

我遇到的问题是 4.29:

编写一个递归函数,以字母排序的顺序漂亮地打印一个 trie,例如:

chair: 'flesh' ---t: 'cat' --ic: 'stylish' ---en: 'dog'

我正在使用书中的这段代码来创建 trie:

我从这个讨论中修改了一个函数的答案,该函数递归地遍历 trie 并提取完整的键和值:

但是我无法使用递归来制作按字母顺序排列的列表,也无法弄清楚如何使用递归来替换键的重复部分。我能做的最好的事情是创建一个辅助函数来遍历上述函数的结果:

这将是输出:

有谁知道是否可以使用一个递归函数获得相同的结果?或者我被困在使用递归函数来遍历 trie 时,使用第二个辅助函数来让一切看起来都很好?

干杯,

  • MC
0 投票
1 回答
2098 浏览

python-3.x - 如何在 python 库 nltk 中计算古腾堡语料库中的单词覆盖率?

计算与文本语​​料库 Gutenberg 关联的所有文件 ID的单词覆盖率。这个的写代码是什么,

0 投票
1 回答
62 浏览

python - 正则表达式匹配单词中的字符

我正在做Pig Latin文本转换:

要求之一是放在qu一起。

我做了什么 re.findall(r'^qu', token)

但它仅qu在单词/标记以开头时一起接受qu

如果单词/标记以 then 开头,aqu则它不能qu一起识别。

我想要的是识别qu任何位置,包括它是否以Qu.

我该如何解决?

0 投票
1 回答
587 浏览

nlp - Porter and Lancaster stemming clarification

I am doing stemming using Porter and Lancaster and I find these observations:

My question are:

  • Lancaster was supposed to be "aggressive" stemmer but it worked properly with replied. Why?
  • The word In remained the same in Porter with uppercase In, Why?
  • Notice that the Lancaster is removing words ending with e, Why?

I am not able to understand these concepts. Could you please help?

0 投票
0 回答
72 浏览

types - 如何从类型论到一阶逻辑 lambda 表达式

从O'Reilly NLTK 书的第 10 章中可以看出,当我想对句子“Bob love Alice”的句法树进行建模时,即

在此处输入图像描述

进入一阶逻辑 lambda 表达式,我得到以下信息:

在此处输入图像描述

左边是类型树,右边是 λ 表达式树。我选择对 Bob 和 Alice 进行类型加注。

我的问题如下:从类型树中,我可以很容易地计算出“爱”的类型必须是<<<e,t>,t>,<e,t>>,但是我如何从中推断出相应的 λ 表达式必须是

λR.λx.R(λy.loves(x,y))

是否有某种方法可以从语法树的类型和周围的 λ 表达式中获取其叶子的 λ 表达式?

0 投票
1 回答
72 浏览

nlp - WordNet 语料库中的单词说明

我想获取WordNet语料库中单词的长度

代码:

我得到的输出为147306

我的问题:

  • 我得到了单词的总长度WordNet吗?
  • tokens像这样zoom_in算吗word
0 投票
1 回答
1207 浏览

python - 在此示例中如何使用 nltk.metrics 中的 edit_distance()?

edit_distance()在下面的例子中使用我有一点问题。我需要在 5 列中打印语言列表中提到的语言中的单词,这不是问题。我已经这样做了:

这部分按预期工作。现在我需要测量来自“be”语言的单词与其他语言中该单词的等价词之间的 Levensthein 字符串编辑距离。并且距离应该出现在括号中的每个单词之后。所以它应该看起来像,例如:

tamto(0) acela(5) oni(5) то(3)

你认为衡量它的最佳方法是什么?我在考虑装箱字典:

然后以某种方式计算编辑距离,但我无法执行此操作。特别是因为其中一种语言 - 俄语有不同的脚本,这意味着我必须使用translit(如果我错了,请纠正我,这是我在网上找到的)。你有什么建议吗?我是编程新手,所以这对你来说可能是一个简单的问题,但我仍在努力找出解决 nltk 中所有问题的方法。先感谢您!

0 投票
1 回答
32 浏览

nltk - 如何将 nltk.book、common_contexts 函数的输出转换为变量

nltk.book 中的 common_contexts 返回 NoneType ,因此如何将其输出存储到变量中

上面的 wtc 变量将返回 NONE。