问题标签 [dependency-parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - python stanford core NLP中的依赖解析
我正在研究基于 stanford Coe NLP 的 NLP 项目。我得到了与每个文本/句子相对应的情绪——感谢这里的文档 现在我需要获取数据框列中每个文本的名词和相关形容词列表,那里我可以根据形容词的情绪对它们进行存储。我尝试了斯坦福网站,但没有找到任何示例函数/代码来实现这一点。我能得到帮助吗?TIA
对于我的 text_df 数据框,
此代码基本上在一个数据帧(text_df1)中创建具有依赖解析器(dep)、源和目标令牌的数据帧,并在另一个数据帧中创建具有 POS 值(text_df2)的每个令牌。我的要求是用名词和相关形容词在句子中获取每个标记/单词。最后,我将这两个表结合起来,得到了所需的数据框。但我现在的问题是,我有句子“raj 去办公室,他的办公室很远”我看到下面给出的 text_df1:nsubj 去了 raj nmod 去办公室 dep 去是案例办公室到 cc 办公室和 conj 办公室办公室 nmod :poss office 他的 advmod 远 advmod 远非常
理想情况下,我应该看到一个带有 nsubj(far,office) 的依赖解析器,但我错过了这个特定的值,有什么时候可以帮我找出我错过的地方..?
当我检查http://nlp.stanford.edu:8080/parser/index.jsp时,我也看到了同样的句子 nsubj(far,office) ..
我想我需要编写 python 代码来在他们的网站上生成“通用依赖,增强”。任何人都可以帮忙吗
nlp - 如何使用 spacy 或 nltk 检索句子的主要意图?
我有一个用例,我想使用 spacy 或 nltk 或任何 NLP 库来提取句子的主要有意义部分。
例句1: “我如何提高反对骚扰的声音” 意图是: “提高反对骚扰的声音”
例句2: “唐老鸭是由哪个漫画家/哪个男人/谁创作的?” 意图是: “唐老鸭是由”
例句3: “如何使用 spacy 或 nltk 检索句子的主要意图”? 意图: “使用 spacy nltk 检索句子的主要意图”
我是依赖解析的新手,并不完全知道如何做到这一点。请帮我。
python - 使用依赖规则匹配的方面意见提取中的命名实体识别
使用 Spacy,我根据我定义的语法规则从文本中提取方面意见对。规则基于 POS 标签和依赖标签,由token.pos_
和获取token.dep_
。以下是其中一种语法规则的示例。Japan is cool,
如果我通过它返回的句子[('Japan', 'cool', 0.3182)]
,其中的值代表 的极性cool
。
但是我不知道如何让它识别命名实体。例如,如果我通过Air France is cool
,我想得到,[('Air France', 'cool', 0.3182)]
但我目前得到的是[('France', 'cool', 0.3182)]
。
我查看了 Spacy 在线文档,我知道如何提取 NE( doc.ents
)。但我想知道使我的提取器工作的可能解决方法是什么。请注意,我不想要强制措施,例如连接字符串AirFrance
等Air_France
。
谢谢!
结果
期望的输出
dependency-parsing - 如何将文本句子转换为 CoNLL-U 格式?
我正在研究使用 CoNLL-U 格式的依赖项解析。我可以找到如何处理 CoNLL-U 解析器或标记列表,但我找不到如何将文本句子转换为 CoNLL-U 格式。
我尝试从https://github.com/datquocnguyen/jPTDP转换代码
“test”文件是conllCoverter(path)函数的输入,是“_io Text10Wrapper”格式的文件,里面包含我要转换成CoNLL-U文件的文本语句,例如: 1. 完全令人沮丧的经历。2. 额外花钱买了有网的空调。
但是,在我尝试了上面定义的 conllConverter(path) 函数后,输出只显示了 10 个原始列(看起来像 CoNLL-U 格式)和原始文本,没有任何额外信息。
最后,我想问一下如何将文本句子转换为 CoNLL-U 格式。
parsing - 非投影依赖树的 Gap-Degree
以下是我的类如何定义间隙度:依赖树中单词的间隙度是由单词及其后代组成的子字符串完全由 k +1 个连续子字符串组成的最小 k。依存树的间隙度是树中任何单词的最大间隙度。
使用以下示例: 非投影依赖树
以上非射影树的gap-degree是多少?你怎么知道的?
我不确定我应该如何使用上面的例子来计算这个。
spacy - 如何在 spaCy 上训练伪投影解析器?
我正在尝试按照https://raw.githubusercontent.com/explosion/spaCy/master/examples/training/train_intent_parser.py中的示例代码训练自定义语义解析器
这个想法是得到一个非投影解析所以当我传递了这样的文本:ROOT AAAA BBBB 12 21
12 成为 AAAA 的孩子,21 成为 BBBB 的孩子。为了测试这一点,我只训练这个案例并测试同样的案例,但它似乎不起作用,我得到的回应是:
如您所见,这两个数字都依赖于 BBBB,而 12 应该依赖于 AAAA。
我用来训练和测试的代码是:
那么,我做错了什么?
提前感谢您对此提供的任何帮助!
android-intent - Dialogflow 基于规则的语法匹配
我正在做一些关于聊天机器人的研究,更具体地说是 Dialogflow。当我搜索意图分类时,我发现 Dialogflow 正在使用基于规则的语法匹配和 ML 匹配。我试图找到有关基于规则的语法匹配的更多信息,但我找不到任何东西......这和依赖解析一样吗?有人可以帮助我提供一些有用的资源,在那里我可以获得有关此 alogritme 工作原理的更多信息吗?
提前致谢!
python - 如何在 Spacy 依赖解析中获取单词索引?
我正在尝试使用 Spacy 来提取单词关系/依赖关系,但我有点不确定如何使用它给我的信息。我了解如何生成用于调试的可视依赖树。
具体来说,我看不到将令牌的子级列表映射到特定令牌的方法。没有索引——只有单词列表。
看这里的例子:https ://spacy.io/usage/linguistic-features#dependency-parse
nlp("Autonomous cars shift insurance liability toward manufacturers")
另外,如果句子是nlp("Autonomous cars shift insurance liability toward manufacturers of cars”)
,我将如何消除两个汽车实例之间的歧义?
我唯一能想到的是,也许这些标记实际上是我可以自己映射到索引的引用类型。是这样吗?
基本上,我希望从获取谓词和参数开始,以了解“谁对谁做了什么以及如何/使用什么”。
nlp - 在 Spacy NLP 中,如何提取代理、动作和患者——以及因果关系?
我想用Space来提取“agent, action, and patient”形式的词关系信息。例如,“自动驾驶汽车将保险责任转移给制造商”->(“自动驾驶汽车”,“shift”,“责任”)或(“自动驾驶汽车”,“shift”,“对制造商的责任”)。换句话说,“谁对谁做了什么”和“什么将动作应用于其他事情”。我对我的输入数据了解不多,所以我不能做出很多假设。
我也想提取逻辑关系。例如,“每当/如果太阳在天空中,鸟儿就会飞”或“热使冰淇淋融化”之类的因果案例。
对于依赖关系,Space 建议逐字迭代句子并以这种方式找到根,但我不确定在遍历中使用什么清晰的模式才能以我可以组织的可靠方式获取信息。我的用例涉及将这些句子结构化为可用于查询和逻辑结论的形式。这可能与我自己的迷你 Prolog 数据存储相当。
对于因果关系,我可以硬编码一些规则,但是我仍然需要找到一种可靠地遍历依赖树并提取信息的方法。(我可能会将其与使用神经核的核心解析以及词向量和概念网络相结合来解决歧义,但这有点切题。)
简而言之,问题实际上是关于如何提取该信息/如何最好地遍历。
顺便说一句,我想知道我是否真的需要一个选区树来进行短语级解析来实现这一点。我认为斯坦福提供了这一点,但 Spacy 可能没有。
nlp - 测试令牌是否是 spaCy 中的连词头
问题
有没有办法检测令牌是否是 spaCy 中的连词头?
问题描述
我想要以下句子:
“美国人和穆斯林朋友和公民、纳税公民和各国的穆斯林都感到震惊,无法相信我们在电视屏幕上看到的一切。”
...返回以下内容custom_chunks
:
这句话在其主要连词中包含一个子连词,这使得任务更加复杂:
目前,我正在使用以下代码来产生所需的答案:
用于识别连词头和子连词头的if
andelif
语句感觉有点 hacky,是否有更肯定的方法来识别标记是否是连词头,或者可以请求这样的属性?