问题标签 [pos-tagger]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - c/c++ 自然语言处理库
我正在寻找用于 c/c++ 的开源自然语言处理库,尤其是我对词性标记感兴趣。
java - Java 中的斯坦福 POS 标记器
我正在尝试这个:
这给了我:
错误:\u\nlp\data\pos-tagger\wsj3t0-18-left3words\left3words-wsj-0-18.tagger(系统找不到指定的路径)
我正在使用斯坦福的POS tagger。
我能做些什么来克服这个问题?
java - 在 java 中使用 Stanford postagger,得到 java.lang.IncompatibleClassChangeError
我正在尝试初始化斯坦福 NLP 语音标记器,但我不断收到 java.lang.IncompatibleClassChangeError。当我打印错误原因时,我得到空值,当我打印消息时,我得到实现类。
这是我的代码:
有谁知道如何解决这一问题?
c# - SharpNLP 中的词性标注器
我正在使用 SharpNLP 进行 POS 标记:
我只有 3 个标签。如何加载一组 Penn 树库或其他一些标记树库以供使用?
谢谢
:)
parsing - 尝试使用 HPSG PET 解析器
您好我正在尝试使用PET解析器,但提供的使用文档不足。谁能给我指出一篇关于使用 PET 的好文章或教程?它支持 utf-8 吗?
parsing - 有谁知道一个好的快速和肮脏的文本/语法解析器?
我有一个“疯狂的库”场景,我想
a)确定句子中每个(或大多数)单词的词性
b)让用户选择这些单词的替代项 - 或用等效单词计算替换它们
我查看了斯坦福解析器,但它有点慢......有什么建议吗?
python - 试图将 MEGAM 用作 NLTK ClassifierBasedPOSTagger?
我目前正在尝试使用 NLTK 构建一个通用(或尽可能通用)的 POS 标记器。我已经涉足了 brown 和 treebank 语料库进行培训,但可能会选择 treebank 语料库。
边走边学,我发现分类器词性标注器是最准确的。最大实体分类器应该是最准确的,但我发现它使用了太多内存(和处理时间),以至于我必须显着减少训练数据集,因此最终结果不如使用默认的朴素贝叶斯分类器准确。
有人建议我使用 MEGAM。NLTK 对 MEGAM 有一些支持,但我发现的所有示例都是针对通用分类器(例如,使用单词特征向量的文本分类器),而不是更具体的词性标注器。无需重新创建我自己的 POS 特征提取器和编译器(即,我更喜欢使用 NLTK 中已有的那个),我如何使用 MEGAM MaxEnt 分类器?IE。我怎样才能将它放在一些现有的 MaxEnt 代码中,这些代码类似于:
r - 从文本中提取名词+名词或(adj|noun)+名词
我想查询R包openNLP中是否可以提取名词+名词或(adj|noun)+名词?也就是说,我想使用语言过滤来提取候选名词短语。你能指导我怎么做吗?非常感谢。
感谢您的回复。这是代码:
读者可以参考acqTagSplit上的索引来进行名词+名词或(adj|noun)+名词的提取。(代码不是最佳但可以工作。如果您有任何想法,请告诉我。)
此外,我还有一个问题。
Justeson 和 Katz (1995) 提出了另一种语言过滤来提取候选名词短语:
((Adj|Noun)+|((Adj|Noun) (Noun-Prep)?)(Adj|Noun) )名词
我不能很好地理解它的含义。您能否帮我解释一下或将这种表示形式转换为 R 语言。非常感谢。
python - 有谁知道如何在 nltk 上配置 hunpos 包装类?
我尝试了以下代码并从http://code.google.com/p/hunpos/downloads/list安装
英语-wsj-1.0
hunpos-1.0-linux.tgz
我已将文件解压缩到“~/”目录中
当我尝试以下python代码时:
我收到以下错误
如何在 python 中配置 hunpos?我需要输入哪个python命令?