问题标签 [dependency-parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - nlp:语法依赖标签“attr”到底是什么?
我正在探索 spacy nlp python 库。我有这个:
Spacy 解释说,“professor”是“is”的一个属性('attr')。
究竟什么是属性?
我在哪里可以找到此类信息?
在不同的语法上下文中是否还有其他“attr”示例?
nlp - nlp:这个依赖标签正确吗?在这种情况下究竟意味着什么?
我正在探索惊人的 python 库,我得到了这个:
token_pos=[token.pos_ for token in spacy_doc] token_tag=[token.tag_ for token in spacy_doc] token_dep=[token.dep_ for token in spacy_doc]
token_pos
令牌标签
token_dep
树
问题:我对“管理”和“去”之间的依赖关系感到困惑。这是一个“conj”。(1) 这是分类错误吗?如果是分类错误,那么正确的分类是什么?如果不是,你能解释为什么会这样吗?Spacy 将此解释为“连词”:(2)有没有办法将这种情况与下面的情况区分开来?
根据斯坦福依赖手册:
连词是由并列连词连接的两个元素之间的关系,例如“and”、“or”等:
“比尔大而诚实”</p>
“他们要么滑雪,要么单板滑雪”</p>
conj(大,诚实)
conj(滑雪,滑雪板)
现在看最后一句话:
“ski”和“snowboard”之间的关系依赖也是“conj”,在这种情况下,它似乎是正确的分类。
nlp - NLP:哪些是与动词相关的依赖标签?
我需要识别与动词相关的所有依赖标签。到目前为止,我已经确定:
'根'
'xcomp'
- '辅助'
还有其他人吗?
python-3.x - NLP:比较这两个句子。这是错误分类吗?
我正在使用 spacy 的依赖解析。我对这两个非常相似的句子感到困惑。
第 1 句:
请注意,这句话中的“father”显然是“father was a nice guy”的主语:
第 2 句:
这是上一句的一个小变化。“父亲”不再是主题。
我试图了解 spacy 如何对句子进行分类。第二种情况是错误分类错误吗?我的意思是“父亲”仍然应该是主题吗?
nlp - 如何使用动词时态/情绪制作一个 spacy 匹配器模式?
我一直在尝试使用动词时态和情绪为 spacy 匹配器制作特定的模式。
我发现了如何使用 model.vocab.morphology.tag_map[token.tag_] 访问用 spacy 解析的单词的形态特征,当动词处于虚拟语气模式(我感兴趣的模式)时,它会打印出类似这样的内容:
{'Mood_sub':真,'Number_sing':真,'Person_three':真,'Tense_pres':真,'VerbForm_fin':真,74:100}
但是,我想要一个像这样的模式来重新标记特定的动词短语:pattern = [{'TAG':'Mood_sub'}, {'TAG':'VerbForm_ger'}]
对于像“Que siga aprendiendo”这样的西班牙语短语,“siga”在其标签中具有“Mood_sub”=True,而“aprendiendo”在其标签中具有“VerbForm_ger”=True。但是,匹配器没有检测到这个匹配。
谁能告诉我为什么会这样以及我该如何解决?这是我正在使用的代码:
spacy - 基于动词形式的Spacy模式异常案例
我正在尝试制作一种能够识别名词后跟形容词时的spacy模式,如下所示:
模式 = [{'POS':'NOUN'}, {'POS':'ADJ'}]
但是,我试图在形容词不是动词的分词形式的情况下例外。我的例子是西班牙语,所以我很抱歉。例如,我想查找并重新标记诸如“institución educativa”之类的东西,而不是“institución comprometida”,因为“comprometida”的标签中有 VerbForm_part=True。
我尝试添加以下内容,但它只会使模式在'institución educativa'这样的情况下停止工作:pattern = [{'POS':'NOUN'}, {'OP':'!', 'TAG':' VerbForm_part'}, {'POS':'ADJ'}]
我也试过:pattern = [{'POS':'NOUN'}, {'POS':'ADJ', 'TAG': not 'VerbForm_part'}]
总之,我需要将名词后跟形容词组合在一起,但只有某些类型的形容词,并根据它们的 TAG 属性“VerbForm_part”排除其他形容词
Spacy 有没有办法做到这一点?它是否支持其模式中的异常?
谢谢!
python - 非结构化医学文本的实体属性提取
我正在研究命名实体及其属性提取。我的目标是提取与句子中特定实体相关的属性。
例如 - “患者报告对 ABC 疾病呈阳性”
在上面的句子中,ABC 是一个实体,Positive 是一个定义 ABC 的属性。
我正在寻找一种简洁的方法来提取属性,我已经制定了一个提取实体的解决方案,该解决方案可以以相当高的准确性无缝工作,现在正在处理问题陈述的第二部分以提取其相关属性。
我尝试使用基于规则的方法提取属性,该方法提供下降结果但具有以下缺点:
- 源代码难以管理。
- 它一点也不通用,也很难管理新场景。
- 耗时的。
为了描绘一个更通用的解决方案,我探索了不同的 NLP 技术并发现依赖树解析是一种潜在的解决方案。
寻找有关如何使用 Python/Java 进行依赖树解析来解决此问题的建议/输入。
随意提出任何其他可能有帮助的技术。
python - Stanford Stanza -- 依赖解析模块 -- 多于一个句子的文档的输出
当要解析的文档包含多个句子时,我有一个关于格式化依赖解析模块的输出的查询。
Stanza 手册( https://stanfordnlp.github.io/stanza/depparse.html )中使用依赖解析模块的示例之一如下:
这个例子只包含一个句子。我想为包含多个句子的文档修改此代码。更具体地说,我想修改代码,以便所有行都包含对相关句子编号的引用。
以下是我自己想出的:
这似乎工作正常。但是,鉴于我没有编写代码的经验,我非常感谢知道我的想法是否可行,或者您是否会建议做一些不同的事情。
提前感谢您的时间和帮助。
nlp - 无法使用 Allennlp 双仿射解析器模型
我正在尝试将 allennlp 预测器用于 biaffine 解析器。这是代码: -
但是,我收到此错误:-
parsing - 使用包含“:”冒号的关系名称创建 Semgrex 模式时出现问题
我正在尝试在以下句子中的https://corenlp.run/中执行 Semgrex 以提取转换事件。由于依赖关系“obl:from”中有一个冒号,我得到一个错误。但相反,如果我使用 nsubj,我会得到想要的结果。有人可以告诉我如何解决这个问题吗?
我的文字:当驾驶员处于控制状态时,汽车应将状态从关闭变为开启。