问题标签 [stanford-nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
stanford-nlp - 斯坦福 NLP 网络工具?
我刚刚下载了最新版本的斯坦福 CoreNLP 软件。我在哪里可以找到 WebCrawler.java 等 Web 工具?我在提供的下载中找不到它们。TIA
text-parsing - 使用 Stanford-Parser 从文本中提取阿拉伯语专有名称
我正在尝试使用斯坦福解析器从文本中提取阿拉伯语专有名称。
例如,如果我有一个输入句子:
使用阿拉伯语斯坦福解析器,树形图将是:
我想提取正确的名称:
其中有子树:
我试过这个:类似的问题
但是这一行有一些问题:
将树类型放入 taggedword 列表中的错误另一件事我不明白我在哪里可以使用建议的 taggedYield()
功能
请问有什么想法吗?
java - 斯坦福 NLP 工具和大量文本
我目前正在使用斯坦福 CoreNLP 工具从文本中提取三元组。我一直在处理相对较小的文本,但我需要让它与更大的文本一起工作。此外,我需要在具有平均内存量的普通机器上进行这项工作。关于如何减少内存负载的任何建议?也许将文本分成更小的部分(但这会搞砸共指......)?
谢谢
java - 斯坦福核心 NLP - 理解共指解析
我在理解最新版本的斯坦福 NLP 工具中对 coref 解析器所做的更改时遇到了一些麻烦。例如,下面是一个句子和对应的 CorefChainAnnotation:
我不确定我是否理解这些数字的含义。查看源代码也无济于事。
谢谢
nlp - 易用性:斯坦福 CoreNLP 与 OpenNLP
我想为个人项目使用一套 NLP 工具,我想知道是斯坦福的 CoreNLP 更容易使用还是 OpenNLP 更容易使用。或者有没有你推荐的其他免费套餐?我之前没有真正做过任何 NLP,所以我正在寻找可以快速用来学习概念和原型化我的想法的东西。任何帮助表示赞赏。
java - 使用 Stanford Tregex 提取子树
我制作了一个类来使用 Tregex 提取子树。我使用了“TregexPattern.java”中的一些代码片段,因为我不想让程序使用控制台命令。
一般来说,有一个句子树,我想提取某个子树(没有用户交互)。
到目前为止我所做的如下:
但它给出了以下错误:
有什么修改或想法吗?
ruby - 使用 treetop 与 stanford nlp 解析数据和 POS
我正在尝试在 Ruby 中解析事件(音乐会、电影等)数据,但无法决定使用什么工具。
我认为 stanford 解析器最初是要走的路,但后来听说了 treetop。
我在这两个方面都在苦苦挣扎,因为让 stanford 解析器在 Windows 上与 Ruby 一起工作已经花费了两天多的搜索和挣扎,并且在安装它时没有结束错误。
Treetop 安装没问题,但是文档非常有限,而且据我所知,treetop 似乎比实际内容更擅长处理语法结构,但也许我只是不完全了解 Treetop 的功能。
一件好事(我认为)是我拥有一个包含乐队和电影名称的大型数据库/语料库(?),以及我想要检索的相当有限的数据部分。
例如,一个清单是
另一个清单是
对于每个列表,我都试图获取一组相当具体的细节,例如谁/什么、日期、时间、城市、地点。
鉴于我已经有一个乐队名称数据集,并且城市名称应该很容易获得列表,所以应该“相当”容易挑选出其他细节,我只是不确定我应该使用哪个工具时间,或者是否有更好的方法来做到这一点?
有什么建议么?
dependencies - 如何使用斯坦福解析器 API 以数字方式查找出现的单词?
在类型依赖中,Stanford Parser 还显示了单词出现的地方,例如“love-2”。现在它表明“爱”在“2”的地方。
现在,如何使用斯坦福解析器 API 以编程方式找到单词的位置?API中是否有任何功能?
python - 斯坦福解析器使用 jpype
当我尝试使用 jpype 使用 stanford 解析器时,出现以下错误
文件“C:\Python26\lib\site-packages\stanford_parser\parser.py”,第 103 行,在init
文件“C:\Python26\lib\site-packages\jpype_jpackage.py”,第 55 行,调用中
TypeError:包 edu.stanford.nlp.parser.lexparser.LexicalizedParser 不可调用
nlp - 斯坦福主题建模工具箱中的标记 LDA 推理
我正在使用 Stanford Topic Modeling Toolbox v.0.3 进行 LabeledLDA。我能够使用提供的文档( example-6-llda-learn.scala ) 训练 LabeledLDA 模型。如何预测新数据集的标签?
我尝试使用类似于example-3-lda-infer.scala的代码来推断新数据集,但没有成功。谁能帮我解决这个问题?
编辑 这是我用于推理的代码,但它不起作用:
此代码在执行时java -Xmx3g -jar tmt-0.3.3.jar infer_llda.scala
会产生以下错误:
在@Skarab 的帮助下,这里是 Labeled LDA 学习和推理的解决方案: