问题标签 [nltk]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
8097 浏览

python - 使用特征频率训练分类器(朴素贝叶斯)的 Python NLTK 代码片段

我想知道是否有人可以通过一个代码片段来帮助我,该代码片段演示了如何使用特征频率方法而不是特征存在来训练朴素贝叶斯分类器。

我认为第 6 章链接文本中所示的以下内容是指使用特征存在 (FP) 创建特征集 -

请指教

0 投票
3 回答
11130 浏览

parallel-processing - 特征选择、特征提取、特征权重的区别

我对“特征选择/提取器/权重”的含义以及它们之间的区别感到有些困惑。当我阅读文献时,有时我会感到迷茫,因为我发现这个词使用得非常松散,我主要担心的是——

  1. 当人们谈论特征频率、特征存在时——是特征选择吗?

  2. 当人们谈论诸如信息增益、最大熵之类的算法时,它仍然是特征选择吗?

  3. 如果我训练分类器——以一个要求分类器记下文档中单词位置的特征集为例——人们还会称之为特征选择吗?

谢谢拉胡尔·迪赫

0 投票
3 回答
6742 浏览

python - 如何在 Python 自然语言工具包中创建自己的语料库?

我最近在 nltk 中扩展了名称语料库,想知道如何将我拥有的两个文件(male.txt、female.txt)转换为语料库,以便我可以使用现有的 nltk.corpus 方法访问它们。有没有人有什么建议?

非常感谢,詹姆斯。

0 投票
3 回答
1200 浏览

python - 安装 numpy 破坏了 NLTK(OS X 10.6.2,Python 2.6)

我在我的 Mac(OS X 10.6.2)上安装了 NLTK(py26-nltk)。然后我安装了numpy。现在,当我尝试导入 nltk 时,我得到了这个:

出了什么问题?我怎样才能解决这个问题?

0 投票
3 回答
5046 浏览

php - 从命令行运行脚本和使用 PHP 从 exec() 运行脚本有什么区别?

我正在尝试使用 PHP 中的 exec() 运行 Python 脚本。当我直接使用窗口运行它时,我的命令运行良好,但是当我在 PHP 中cmd运行它时会产生错误。exec()

我的 Python 脚本使用NTLK来查找专有名词。示例命令:

[London]当我从 运行它时返回cmd,但是当我从 运行相同的命令时在 Apache 日志中抛出一个错误exec()。脚本肯定会运行正常 - 如果我将 python 脚本更改print "Hello World"为返回正常。

我知道任何人都知道如何修复这个 NLTK 错误是一个很大的要求,但我真的可以用任何指针来解释为什么execcmd. (命令相同)。

我正在使用 Apache 2.2.11 在 Windows 7 上运行 WAMP。

这是 Apache 日志中的错误:

0 投票
2 回答
1937 浏览

python - 如何在 Ubuntu 9.04(使用 nltk)上为 tkinter 设置 pythonpath(python2.6)?

我想在运行 Ubuntu 9.04 的机器上使用 nltk 工具包。我安装了 python 2.6.4 和几个附加包(numpy、scipy、matplotlib,当然还有 nltk)。我可以导入 nltk,但调用一些方法会给出各种错误消息,都包含“请安装 Tkinter 库”。谷歌搜索我从http://wiki.python.org/moin/TkInter发现我应该设置我的 pythonpath 环境变量。但是,在搜索了几个小时后,我无法找到如何做到这一点。

0 投票
1 回答
1237 浏览

wpf - 来自 WPF 的 IronPython 中的 NLTK

我想使用 IronPython 为 Python 使用 NLTK(自然语言工具包)并从现有的 WPF/c# 项目中调用。

是否可以以这种方式从 WPF 中引用 NLTK。例如使用 NTLK 的命名实体识别?

任何建议或指导表示赞赏。

0 投票
4 回答
62455 浏览

nlp - 如何从一系列文本条目中提取常见/重要的短语

我有一系列文本项——来自 MySQL 数据库的原始 HTML。我想在这些条目中找到最常见的短语(不是单个最常见的短语,理想情况下,不强制逐字匹配)。

我的示例是 Yelp.com 上的任何评论,它显示了来自给定餐厅的数百条评论的 3 个片段,格式如下:

“试试汉堡包”(44 条评论)

例如,本页的“回顾重点”部分:

http://www.yelp.com/biz/sushi-gen-los-angeles/

我已经安装了 NLTK 并且我已经玩过它了一点,但老实说,我对这些选项感到不知所措。这似乎是一个相当普遍的问题,我无法通过在这里搜索找到一个简单的解决方案。

0 投票
1 回答
188 浏览

python - 我如何编辑和运行 python nltk 程序

我如何编辑和运行 python nltk 程序

0 投票
1 回答
1721 浏览

python - Python NLTK 找出时态

我有一个将句子翻译成英语的网络应用程序;用户从基本上提供上下文的下拉菜单中选择选项。现在我想把这个词和上下文变成一个英文句子。

一种情况是用户选择“谁”和“何时”,“谁”可以是:我、你、你们两个、他、她、我们、他们。“什么时候”可以是:“做了”、“会做”、“可能做”、“做”、“做!”。所以最后我会得到用户输入的词,以及谁和什么时候输入的。前任。'sing', 'you', 'did it' 会得到英文句子“You sang”。

另一种情况是像“追逐”这样的及物动词,仍然会有“谁”和“何时”,但还有另一个“完成”选项,基本上是另一个“谁”菜单。前任。'chase'、'I'、'will do it'、'they' 会得到英文句子“I'm going to follow them”。

我是 NLTK 的新手,所以我真的不知道从哪里开始解决这个问题。谁能指出我从哪里开始的大致方向?