问题标签 [stanford-nlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
399 浏览

stanford-nlp - 斯坦福 NLP 网络工具?

我刚刚下载了最新版本的斯坦福 CoreNLP 软件。我在哪里可以找到 WebCrawler.java 等 Web 工具?我在提供的下载中找不到它们。TIA

0 投票
1 回答
614 浏览

text-parsing - 使用 Stanford-Parser 从文本中提取阿拉伯语专有名称

我正在尝试使用斯坦福解析器从文本中提取阿拉伯语专有名称。

例如,如果我有一个输入句子:

使用阿拉伯语斯坦福解析器,树形图将是:

我想提取正确的名称:

其中有子树:

我试过这个:类似的问题

但是这一行有一些问题:

将树类型放入 taggedword 列表中的错误另一件事我不明白我在哪里可以使用建议的 taggedYield() 功能

请问有什么想法吗?

0 投票
1 回答
429 浏览

java - 斯坦福 NLP 工具和大量文本

我目前正在使用斯坦福 CoreNLP 工具从文本中提取三元组。我一直在处理相对较小的文本,但我需要让它与更大的文本一起工作。此外,我需要在具有平均内存量的普通机器上进行这项工作。关于如何减少内存负载的任何建议?也许将文本分成更小的部分(但这会搞砸共指......)?

谢谢

0 投票
3 回答
10445 浏览

java - 斯坦福核心 NLP - 理解共指解析

我在理解最新版本的斯坦福 NLP 工具中对 coref 解析器所做的更改时遇到了一些麻烦。例如,下面是一个句子和对应的 CorefChainAnnotation:

我不确定我是否理解这些数字的含义。查看源代码也无济于事。

谢谢

0 投票
3 回答
19979 浏览

nlp - 易用性:斯坦福 CoreNLP 与 OpenNLP

我想为个人项目使用一套 NLP 工具,我想知道是斯坦福的 CoreNLP 更容易使用还是 OpenNLP 更容易使用。或者有没有你推荐的其他免费套餐?我之前没有真正做过任何 NLP,所以我正在寻找可以快速用来学习概念和原型化我的想法的东西。任何帮助表示赞赏。

0 投票
1 回答
1625 浏览

java - 使用 Stanford Tregex 提取子树

我制作了一个类来使用 Tregex 提取子树。我使用了“TregexPattern.java”中的一些代码片段,因为我不想让程序使用控制台命令。

一般来说,有一个句子树,我想提取某个子树(没有用户交互)。

到目前为止我所做的如下:

但它给出了以下错误:

有什么修改或想法吗?

0 投票
1 回答
417 浏览

ruby - 使用 treetop 与 stanford nlp 解析数据和 POS

我正在尝试在 Ruby 中解析事件(音乐会、电影等)数据,但无法决定使用什么工具。

我认为 stanford 解析器最初是要走的路,但后来听说了 treetop。

我在这两个方面都在苦苦挣扎,因为让 stanford 解析器在 Windows 上与 Ruby 一起工作已经花费了两天多的搜索和挣扎,并且在安装它时没有结束错误。

Treetop 安装没问题,但是文档非常有限,而且据我所知,treetop 似乎比实际内容更擅长处理语法结构,但也许我只是不完全了解 Treetop 的功能。

一件好事(我认为)是我拥有一个包含乐队和电影名称的大型数据库/语料库(?),以及我想要检索的相当有限的数据部分。

例如,一个清单是

另一个清单是

对于每个列表,我都试图获取一组相当具体的细节,例如谁/什么、日期、时间、城市、地点。

鉴于我已经有一个乐队名称数据集,并且城市名称应该很容易获得列表,所以应该“相当”容易挑选出其他细节,我只是不确定我应该使用哪个工具时间,或者是否有更好的方法来做到这一点?

有什么建议么?

0 投票
3 回答
777 浏览

dependencies - 如何使用斯坦福解析器 API 以数字方式查找出现的单词?

在类型依赖中,Stanford Parser 还显示了单词出现的地方,例如“love-2”。现在它表明“爱”在“2”的地方。

现在,如何使用斯坦福解析器 API 以编程方式找到单词的位置?API中是否有任何功能?

0 投票
2 回答
1937 浏览

python - 斯坦福解析器使用 jpype

当我尝试使用 jpype 使用 stanford 解析器时,出现以下错误

文件“C:\Python26\lib\site-packages\stanford_parser\parser.py”,第 103 行,在init

文件“C:\Python26\lib\site-packages\jpype_jpackage.py”,第 55 行,调用中

TypeError:包 edu.stanford.nlp.parser.lexparser.LexicalizedParser 不可调用

0 投票
0 回答
3492 浏览

nlp - 斯坦福主题建模工具箱中的标记 LDA 推理

我正在使用 Stanford Topic Modeling Toolbox v.0.3 进行 LabeledLDA。我能够使用提供的文档( example-6-llda-learn.scala ) 训练 LabeledLDA 模型。如何预测新数据集的标签?

我尝试使用类似于example-3-lda-infer.scala的代码来推断新数据集,但没有成功。谁能帮我解决这个问题?

编辑 这是我用于推理的代码,但它不起作用:

此代码在执行时java -Xmx3g -jar tmt-0.3.3.jar infer_llda.scala会产生以下错误:

在@Skarab 的帮助下,这里是 Labeled LDA 学习和推理的解决方案: