问题标签 [part-of-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1262 浏览

nltk - 导入我自己的文本以使用 NLTK 词性标注器

我是这方面的初学者,但我想创建一个文件夹,其中有很多文本(假设小说保存为 .txt)。然后我想请用户选择其中一本小说,然后自动让词性标注器分析整个文本。这可能吗?我一直在尝试:

如何让它分析用户选择的文本而不是这句话?以及如何导入这些文本?

0 投票
0 回答
222 浏览

nlp - 为什么 OpenNLP 中 POS 标记的过程很慢?

我正在使用 OpenNLP 进行 POS 标记,我发现这非常慢。

我将此代码用于 5 个句子的示例,这是我在 ms 中获得 PoS 的时间。

有什么办法可以提升这个。任何帮助,将不胜感激。

0 投票
1 回答
164 浏览

pos-tagger - 带有斯坦福 POS 标记器的 POS 直方图

我需要使用 Stanford POS Tagger 标记推文中的单词。

正如这里1所解释的,我使用了MaxentTagger类,然后使用了方法:maxtagger.tagString("This is a sample text");

这会产生输出:

this_DT is_VBZ a_DT sample_NN text_NN

现在我必须为每条推文创建推文中每个标签出现的直方图。我在 JavaDoc 中进行了搜索,但没有发现任何有用的信息。

如果我必须自己创建直方图,如何以字符串以外的其他方式读取输出(例如,标签列表)?

0 投票
1 回答
1616 浏览

n-gram - 将文档中的所有命名实体分组

我想将给定文档中的所有命名实体分组。例如,

我不想使用 OpenNLP API,因为它可能无法识别所有命名实体。有没有办法使用其他服务生成这样的 n-gram,或者可能是一种将所有名词术语组合在一起的方法。

0 投票
1 回答
1122 浏览

python-2.7 - 无法使用 Pip 安装任何东西

我正在尝试安装这个:https ://pypi.python.org/pypi/textblob-aptagger它说要使用此代码-但我不知道在哪里使用它(命令行和 Python 控制台不起作用) :

我使用来自http://www.lfd.uci.edu/~gohlke/pythonlibs/的 exe 文件安装了 easy_install 和 pip

所以当我使用命令时:

在 Python 控制台中,我收到此错误:

我应该在哪里使用这个安装命令?

0 投票
1 回答
3875 浏览

c# - C# 中是否有任何词性标注器?

我的数据聚类数据预处理需要词性 (POS)标记。我想知道 C# 中是否有一些库为此做好了准备。

0 投票
1 回答
1977 浏览

r - 为什么使用空格分隔符粘贴不能按预期工作?

我需要从 POS 向量列表中造句。所以我使用pastewithsep=' '但这似乎对我的结果没有影响。为什么?

0 投票
2 回答
446 浏览

c#-4.0 - 如何在 SpeechSynthesizer 中获取口语单词的数量

我是 C# 新手,我正在使用 SpeechSynthesizer 读出一些单词。但我需要数一数我说话时说了多少字。有什么办法吗??任何帮助将不胜感激。谢谢

0 投票
2 回答
687 浏览

go - GoLang PoS Tagger 脚本花费的时间比终端中没有输出的时间长

此脚本在 play.golang.org 中编译时没有错误:http ://play.golang.org/p/Hlr-IAc_1f

但是当我在我的机器上运行时,比我预期的要长得多,终端没有发生任何事情。

我正在尝试构建的是 PartOfSpeech 标注器。

我认为最长的部分是将 lexicon.txt 加载到地图中,然后将每个单词与那里的每个单词进行比较,看看它是否已经在词典中被标记。词典只包含动词。但是不是每个单词都需要检查它是否是动词。

更大的问题是我不知道如何确定一个单词是否是具有简单启发式的动词,如副词、形容词等。

0 投票
1 回答
217 浏览

parsing - 是否有用于英语的开源深度解析器作为输入并生成解析树?

我想知道是否有用于英语的开源概率深度解析器,它将一系列标记及其相应的词性(POS 标签)作为输入,并生成解析树作为结果。我知道的解析器只将标记序列作为输入,并生成 POS 标签和解析树作为输出。在我的例子中,我已经有一个特定的标记器和对应的(被黑的)POS 标记器和 Penn 标记集,并且只想生成基于这些标记和相应标记的解析树。