问题标签 [nltk-book]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 构建基于特征的语法时,为什么会出现“无效语法”错误?
为什么在 % start S 的行中出现“无效语法”?
nltk - 为 nltk 设置 macecommand 的路径
我找到了从链接 config_prover9 设置 prover9 路径的方法中为 prover9设置路径的解决方案 是否也有类似的方法来处理 macecommand?我的代码如下
有没有办法设置它来找到我安装 Macecommand 的目录?提前致谢。
python - Python - 使用递归函数按字母顺序打印出 trie
我正在阅读Bird、Klein 和 Loper的NLTK 书籍,但遇到了一个问题。我正在阅读这本书是为了丰富自己的个人生活,而不是为了上课。
我遇到的问题是 4.29:
编写一个递归函数,以字母排序的顺序漂亮地打印一个 trie,例如:
chair: 'flesh'
---t: 'cat'
--ic: 'stylish'
---en: 'dog'
我正在使用书中的这段代码来创建 trie:
我从这个讨论中修改了一个函数的答案,该函数递归地遍历 trie 并提取完整的键和值:
但是我无法使用递归来制作按字母顺序排列的列表,也无法弄清楚如何使用递归来替换键的重复部分。我能做的最好的事情是创建一个辅助函数来遍历上述函数的结果:
这将是输出:
有谁知道是否可以使用一个递归函数获得相同的结果?或者我被困在使用递归函数来遍历 trie 时,使用第二个辅助函数来让一切看起来都很好?
干杯,
- MC
python-3.x - 如何在 python 库 nltk 中计算古腾堡语料库中的单词覆盖率?
计算与文本语料库 Gutenberg 关联的所有文件 ID的单词覆盖率。这个的写代码是什么,
python - 正则表达式匹配单词中的字符
我正在做Pig Latin
文本转换:
要求之一是放在qu
一起。
我做了什么 re.findall(r'^qu', token)
但它仅qu
在单词/标记以开头时一起接受qu
如果单词/标记以 then 开头,aqu
则它不能qu
一起识别。
我想要的是识别qu
任何位置,包括它是否以Qu
.
我该如何解决?
nlp - Porter and Lancaster stemming clarification
I am doing stemming
using Porter
and Lancaster
and I find these observations:
My question are:
Lancaster
was supposed to be "aggressive"stemmer
but it worked properly withreplied
. Why?- The word
In
remained the same inPorter
with uppercaseIn
, Why? - Notice that the
Lancaster
is removing words ending withe
, Why?
I am not able to understand these concepts. Could you please help?
types - 如何从类型论到一阶逻辑 lambda 表达式
从O'Reilly NLTK 书的第 10 章中可以看出,当我想对句子“Bob love Alice”的句法树进行建模时,即
进入一阶逻辑 lambda 表达式,我得到以下信息:
左边是类型树,右边是 λ 表达式树。我选择对 Bob 和 Alice 进行类型加注。
我的问题如下:从类型树中,我可以很容易地计算出“爱”的类型必须是<<<e,t>,t>,<e,t>>
,但是我如何从中推断出相应的 λ 表达式必须是
λR.λx.R(λy.loves(x,y))
是否有某种方法可以从语法树的类型和周围的 λ 表达式中获取其叶子的 λ 表达式?
nlp - WordNet 语料库中的单词说明
我想获取WordNet
语料库中单词的长度
代码:
我得到的输出为147306
我的问题:
- 我得到了单词的总长度
WordNet
吗? tokens
像这样zoom_in
算吗word
?
python - 在此示例中如何使用 nltk.metrics 中的 edit_distance()?
edit_distance()
在下面的例子中使用我有一点问题。我需要在 5 列中打印语言列表中提到的语言中的单词,这不是问题。我已经这样做了:
这部分按预期工作。现在我需要测量来自“be”语言的单词与其他语言中该单词的等价词之间的 Levensthein 字符串编辑距离。并且距离应该出现在括号中的每个单词之后。所以它应该看起来像,例如:
tamto(0) acela(5) oni(5) то(3)
你认为衡量它的最佳方法是什么?我在考虑装箱字典:
然后以某种方式计算编辑距离,但我无法执行此操作。特别是因为其中一种语言 - 俄语有不同的脚本,这意味着我必须使用translit(如果我错了,请纠正我,这是我在网上找到的)。你有什么建议吗?我是编程新手,所以这对你来说可能是一个简单的问题,但我仍在努力找出解决 nltk 中所有问题的方法。先感谢您!
nltk - 如何将 nltk.book、common_contexts 函数的输出转换为变量
nltk.book 中的 common_contexts 返回 NoneType ,因此如何将其输出存储到变量中
上面的 wtc 变量将返回 NONE。