问题标签 [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - PHP中的词性标注器?
我正在寻找可以下载的简单词性库或代码。我的标准是它必须易于使用并且可以免费使用。
你知道这样的图书馆吗?
ios5 - iOS nslinguistictagger 语言
我正在使用NSLinguisticTagger
课程,我想测试一下丹麦语:
NSString *textToAnalyse = @"Her skal du finde det tal, som mangler";
这个范围包含整个字符串,因为我们想要完全解析它:
我找不到...
...丹麦语。请告诉我是否有人使用过它或有任何想法。
python - 如何使用 NLTK 获得动词的不定式(pos tagging)
我正在尝试使用 NLTK 和 Python 学习自然语言处理(英语)。有没有办法在 POS 标记期间或之后获得动词的不定式形式。
例如:
- 是 (VBZ) => 是
- 提供 (VBN) => 提供
- 使用 (VBG) => 使用
solr - apache openNLP chuker/POS 名词检测
我正在为我的一个项目试验 apache Open NLP,我的要求是从电子邮件内容中检测名词并检查我们的客户数据库(该数据库由个人姓名、组织名称等组成,我的搜索引擎是 Solr 库)。
对于普通的英语名词,默认训练模型可以正常工作(对于大多数情况),但一个棘手的要求是,我们有一个带有 OK、LET 等缩写的业务组织,因此在少数情况下我需要考虑 OK、LET 等作为名词。
例如 1) “寄一些物品给 LET,请注意延迟付款” 2) “让我们去参加派对吧”
在#1中,我想将LET视为名词,而在#2中,LET不是名词。
如果我能达到这个要求,我可以在我的搜索引擎中减少大量的误报匹配。
非常感谢任何帮助。
python - 用 python 的 NLTK 计算动词、名词和其他词性
我有多个文本,我想根据他们对不同词性(如名词和动词)的使用来创建它们的配置文件。基本上,我需要计算每个词性使用了多少次。
我已经标记了文本,但不知道如何进一步:
如何将每个词性的计数保存到变量中?
semantic-markup - 查找与名词输入相关的形容词
我想尝试根据用户在搜索框中输入的词来确定用户的个性特征。这是一个例子:
搜索词:“电脑”
检测到的性格/描述符:分析的、逻辑的、系统的、有条理的
我知道这项任务非常重要。我以前使用过 WordNet,但我不确定它是否包含每个名词节点的形容词云。词性标注本身就是一头野兽,所以我不确定建立自己的语料库并搜索与关键字共存的形容词词频是否是最好的主意,但我将在下面解释。
我目前正在使用维基百科转储,在删除停用词(and、or、of、to、a 等)后处理每篇文章的词频。我的想法是可能在整个语料库中搜索形容词(使用 WordNet 进行词性标注)和名词的共存(例如,形容词逻辑经常与名词计算机同时出现),并且基于相对的词干形容词频率,判断它是否与名词语义相关。潜在的应用是巨大的。
另一个想法是将名词词干,搜索以该词干开头的形容词,然后搜索该形容词的同义词。例子:
搜索词:“电脑”
词干:“计算-”
带词干的形容词:计算
同义词:???
问题是名词的形容词形式并不总是有形容词形式,一些名词词干会匹配到非常错误的形容词。*不好*例如:
搜索词:“running”(技术上是动名词,但仍然是名词)
词干:“跑——”
带词干的形容词:流鼻涕
同义词:不是我想要的词。想找到像“运动”、“有动力”、“有纪律”这样的词
这是以前做过的事情吗?你对我如何处理这个问题有什么建议吗?这几乎就像我正在为文档中的“重要”单词生成形容词云一样。
编辑:我意识到这个问题没有“正确”的答案。我将奖励赏金给提出具有最佳理论潜力的方法的人。
java - JCreator Java 中的斯坦福 POS 标记器?
这是我的代码,在 JCreator > Configure >Option > JDK Tools
在选择工具类型:编译器
我设置的参数-g -source 1.5 -classpath "$[ClassPath]" -d "$[OutputPath]" -classpath stanford-postagger.jar $[JavaFiles]
在运行应用程序中,我设置的参数-classpath "$[ClassPath]" -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger $[JavaClass]
该stanford-postagger
文件位于 location 中C:\prototype
。当我运行程序时,它会显示结果:
我做错了什么?
syntax - 了解布朗标签
我正在阅读与自然语言处理相关的语言学,但布朗标签让我感到困惑。
您能帮我解释一下以下标签吗(如果您可以添加示例,那就更好了)?它们都与疑问代词和疑问限定词有关。
WDT (wh-determiner: what, which)
WP$(所有格 wh 代词:who)
WPO(客观 wh 代词:谁、哪个、那个)
WPS(主格 wh 代词:谁、哪个、那个)
例如,限定词应该是The dog中的the ,因为正如它所定义的那样,它描述了一个名词在上下文中的引用。但是 wh-determiner 呢?它的用途是什么?询问名词的引用或我应该以哪种方式解释这些形式?
非常感谢
objective-c - Mac OSX 上意大利语的 POS-Tagging API
我需要帮助寻找适用于意大利语文档的 POS-Tagging API。我更喜欢开源代码(可能是 ruby、jruby、macruby、java、scala)。我编写的程序将在 Mac OsX 上运行,我已经浏览过这个列表,但“意大利语”没有太多内容
从 10.8 开始,Cocoa NSLinguisticTagger 为西班牙语和意大利语提供了词性标签和词条,我可以尝试一下,但在升级我的 OSX 10.7 之前,请告诉我你是否认为真的值得,或者我是否有其他好的选择。
nlp - 有判别训练的监督词性标注
我必须实现一个经过判别训练的监督词性标注器,并且我一直在研究几种技术,包括最大似然、感知器和大边距 (SVM)。最后,在阅读了几篇研究论文中引用的一些实验结果后,我决定使用 SVM。我已经研究了一段时间,理论上有几件事似乎有点令人困惑。有人可以向我指出一些相关的阅读材料来实际实现,或者只是更清楚地说明如何使用维特比算法来实现它。
PS:我不是在寻求解决方案,而只是需要一些指导。