0

我想研究使用 NLP 来检测负面/非建设性评论,即那些在网上讨论政治时经常出现的评论。我很想知道,如果给出这样的句子:

你是个自由派的笨蛋。克林顿作为总统的不当行为正在毁掉美国。

是否不仅可以使用 NER 推断实体(你,克林顿),还可以获得关于每个实体的陈述树:

+-----------------+                             +------------------------+
|                 |                             |                        |
|                 |                             |                        |
|       you       |                             |          Clinton       |
|                 +------+                      |                        +------+
|                 |      |                      |                        |      |
+--+--------------+      |                      |                        |      |
   |                     |                      +--+---------------------+      |
   |                     |                         |                            |
   |                     |                         |                            |
 +-+-------+        +----+-----+                   |                  +---------+----------+
 |         |        |          |              +----+---------+        |                    |
 |         |        |   dweeb  |              |              |        |                    |
 |  liberal|        |          |              |  ruining US  |        | has inappropriate  |
 |         |        +----------+              |              |        | behavior as pres.  |
 +---------+                                  |              |        |                    |
                                              +--------------+        +--------------------+

NLP可以做到这样的事情吗?

4

2 回答 2

1

选区解析器或依赖解析器,可能加上某种语义分析,为您提供有关命名和非命名实体的更多信息,可能是您正在寻找的。尝试将一些例句粘贴到http://corenlp.run/http://demo.ark.cs.cmu.edu/parse中,它应用依赖解析和语义解析,看看它是否是事物的类型您正在寻找。

于 2018-02-17T13:08:47.873 回答
0

是的,您正在寻找的东西当然可以通过 NLP 实现。您应该进一步研究两种方法。

1) 在编码方面更快的方法是使用斯坦福 NLP、Spacy 等 NLP 框架的“关系提取器”功能,但需要在标记和训练注释数据方面进行投资。但是,您必须进行一些定制和训练的默认模型。这是一篇关于使用 NLTK 执行此操作的示例博客文章的链接,但如果您采用此方法,则应该查找更新的文章。

2)@Gabriel 在对您的句子运行依赖解析器和实体 NER 管道然后在代码中使用一组手动规则来提取关系时提到了在编码方面较慢但不需要数据标记和注释的方法。

于 2018-02-17T20:16:03.377 回答