问题标签 [pos-tagger]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
7986 浏览

java - Build a Part-of-Speech Tagger (POS Tagger)

I need to build a POS tagger in Java and need to know how to get started. Are there code examples or other resources that help illustrate how POS taggers work?

0 投票
1 回答
4796 浏览

python - How to obtain better results using NLTK pos tag

I am just learning nltk using Python. I tried doing pos_tag on various sentences. But the results obtained are not accurate. How can I improvise the results ?

Also I am getting lot of extra words being categorized as NN. How can I filter these out to get better results.?

0 投票
2 回答
3799 浏览

machine-learning - NLP 从文本中提取动作

我希望有人能指出正确的方向来学习如何从一堆文本中分离出动作。

假设我有这个文本

我正在尝试将其拆分为

我无法在我的搜索中找到任何具体基于操作的内容。它需要比仅仅挑选动词更聪明,因为有时会有多个动词与一个动作相关联,例如第二个项目有“go”、“pick-up”和“get”,但这只是一部分的单一动作。当然,“Tim's flight”只是暗示带有现在分词的动作,动词出现在片段的末尾。

关于在哪里寻找做这种事情的任何建议?需要注意的事项,推荐的阅读材料等。

0 投票
1 回答
448 浏览

nlp - 调试 Baum Welch 算法的实现(用于 POS 标记)

我正在做一个项目,其中一部分是开发一个用于 POS 标记的无监督 HMM 训练器,我现在想测试它是否存在可能的错误。

我正在使用 Baum-Welch 算法来训练模型。输入是序列词(从语料库中提取),输出是来自一组状态的隐藏状态序列(s1, s2, ... sn)。我现在完成了编码,但我不确定它是否没有错误。

谁能建议我一些调试想法?正如我应该在输出中检查什么?如何检查我的算法的准确性?

0 投票
1 回答
745 浏览

python - Topia 术语提取物 - 意大利语词典

我正在寻找一种从文本中提取主题关键字的工具。Topia 似乎是一个很好的解决方案,无论如何它没有附带意大利语词典文件。

在网上搜索我找不到预编译文件,所以我想我需要自己构建。有没有人建议如何在不花费一生的情况下构建它?

英文文件的格式如下:

提前感谢您的任何建议。

0 投票
7 回答
46755 浏览

python - NLTK POS tagger 要求我下载什么?

我刚开始使用词性标注器,我面临很多问题。

我开始使用以下内容进行 POS 标记:

当我想打印'text'时,会发生以下情况:

我用过nltk.download(),但没有用。

0 投票
2 回答
776 浏览

c# - 如何在 C# 代码中使用 python NLP POS 标记器?

我遇到并成功使用了 python NLP POS 标记器。问题是我的代码在 c# 中,我使用了 python pos 标记器,因为我找不到好的 c# pos 标记器。现在,我不知道如何使用它我的 c# 代码中的 python NLP POS 标记器。有人可以指导我吗?另外请建议任何 C# POS 标记器。谢谢

编辑:
我想过使用 IronPython 来使用 python NLP POS 标记器。但是当我使用时import nltk,我得到了一个ImportError:No module named nltk
在 python2.6 中使用时相同的命令运行得非常好。

0 投票
5 回答
23810 浏览

nlp - 词性标注和浅解析有什么区别?

我目前正在我的大学学习自然语言处理课程,但仍然对一些基本概念感到困惑。我从《统计自然语言处理基础》一书中得到了 POS 标记的定义:

标记是用适当的词性标记(或标记)句子中的每个单词的任务。我们决定每个单词是名词、动词、形容词还是其他。

但是我在书中找不到浅解析的定义,因为它也将浅解析描述为 POS 标记的实用程序之一。于是我开始在网上搜索,并没有发现浅层解析的直接解释,而是在维基百科中:

浅层解析(也称为分块,“轻解析”)是对一个句子的分析,它识别成分(名词组、动词、动词组等),但没有指定它们的内部结构,也没有指定它们在主句中的作用。

坦率地说,我看不出有什么区别,但这可能是因为我的英语或只是我不理解简单的基本概念。谁能解释一下浅解析和POS标记之间的区别?浅解析通常也称为浅语义解析吗?

之前谢谢。

0 投票
2 回答
2246 浏览

php - PHP中的Pos标记器

我正在寻找可以在 php 中使用的 pos-tagger。或者我需要知道是否有任何方法可以将 Qtag java 应用程序的结果与 php 一起使用。

0 投票
1 回答
512 浏览

java - 移除 POS tagger 的标签

是否可以从句子中删除标签?可以通过扫描文件并找到标签并删除它们来完成它,但是由于标签很多(有些型号有 30+,有些型号有 48-50 左右,它们基本上遵循penn treebank pos 标签),有没有快速和以更有效的方式删除标签的甜蜜方式?我确实检查了 API,但没有这样的方法来删除标签。