问题标签 [nltk-trainer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
126 浏览

python - nltk-trainer 重新训练分类器

我想看看我是否可以用一些新获得的数据重新训练现有的分类器(.pickle 文件,使用 nltk-trainer 训练)。我已经使用这些链接作为参考训练了分类器,[1][2]

到目前为止,每次我收到新的训练数据时,我都会对所有数据重新训练一个新的分类器,但这是一件很麻烦的事情,因为一次又一次地对整个数据集进行训练需要时间和计算成本。

有没有更好的办法?

0 投票
1 回答
302 浏览

python - 如何在 NLTK 中连续使用不同的分块器?

我正在使用“Python 3 Text Processing with NLTK3 Cookbook”来分析文本。我创建了 2 个块“LocationChunker”和“PersonChunker”,它们运行良好。

我到处找,但是你怎么能同时使用它们来分析一个句子呢?之后我还想使用 ne_chunk 函数。

使用 POSTaggers 声明退避非常容易,但是如何使用 ChunkParserI 执行此操作

非常感谢。

0 投票
2 回答
2942 浏览

python - 如何通过nltk python中的标签获取树中的节点?

我有一棵树:

我想通过 nltk 中的标签获取特定节点。例如,我有标签“CITY-NAME”,我想获取节点(CITY-NAM Hue)。我怎样才能做到这一点?

0 投票
1 回答
3764 浏览

python - NLTK - 从没有下载器 UI 的命令行下载除 corpara 之外的所有 nltk 数据

我们可以使用以下命令下载所有 nltk 数据:

或使用特定数据:

但我想下载除“corpara”文件之外的所有数据,例如 - 所有块化器、语法器、模型、词干分析器、标记器、标记器等

没有下载器 UI 有什么办法吗?就像是,

0 投票
1 回答
992 浏览

python-3.x - 如何在 NLTK 中训练新标签以进行名称实体识别

我是 python 新手,我需要从文本中提取职位,我需要知道如何训练数据以进行名称实体识别以及在哪里训练数据

0 投票
1 回答
664 浏览

python - 在plaintext.split('\ n')中获取行:UnicodeDecodeError:'ascii'编解码器无法解码位置2的字节0x96:序数不在范围内(128)

我将使用 nltk 教程设计对 twitter 数据的情感分析,但无法运行以下代码

0 投票
0 回答
573 浏览

python - 从文本中识别兴趣/主题

我正在尝试构建一个模型,该模型将尝试识别所提供文本的兴趣类别/主题。例如:

从我们令人筋疲力尽的各种美丽和设计师设计的纱丽中购买新娘婚礼纱丽。获得超值优惠、优质拼接和免费国际送货服务。

将解析为顶级类别,例如:

时尚或婚礼时尚

为了实现这一点,我使用了潜在狄利克雷分配 (LDA),它是一种主题模型,它根据一组文档中的词频生成主题。

所以我得到了如下的文档主题,但没有找到将它们映射到人类可以理解的格式的方法

主题#0 (0.500):0.100*sare + 0.060*intern + 0.060*get + 0.060*deal + 0.060*exhaust + 0.060*design + 0.060*free + 0.060*qualiti + 0.060*shop + 0.060*great

主题 #1 (0.500):0.063*sare + 0.063*beauti + 0.063*deliveri + 0.063*stitch + 0.063*varieti + 0.063*wed + 0.062*bridal + 0.062*great + 0.062*shop + 0.062*qualiti

我已经使用此脚本来实现上述内容。

所以问题是如何将上述确定的主题映射到时尚等人类可读的类别?

0 投票
1 回答
8461 浏览

nltk - NLTK - 将分块树转换为列表(IOB 标记)

我需要执行命名实体识别/分类,并以 IOB 标记格式生成输出。

我正在使用由NLTK-train library提供的 NLTK 分块器,但这会产生一个树,而不是 IOB 标签列表。

我们得到 c 作为一棵树,比如:

...

但我正在寻找类似的东西:

这是 list_of_words 参数的 IOB 标记列表,与 list_of_words 的顺序相同。

如何从树中获取该标记列表?

0 投票
0 回答
266 浏览

nlp - 使用 textblob nltk 提取主题

我正在使用 textblob nltk 对给定句子执行一些操作。我对 nltk 和文本处理非常陌生。我能够决定给定句子的操作,但我不知道如何提取主题

这是代码

这给了我“采取”的标签,但我如何训练它来提取主题呢?那就是我希望结果是'take','pumpkin'

0 投票
1 回答
7085 浏览

python-3.x - 如何从 python 和我的系统以及命令提示符中删除 nltk

我尝试使用 python 命令提示符上的命令下载 nltk

现在我想从我的系统中删除所有 nltk 文件,请帮助卸载和删除所有 nltk 文件。