问题标签 [lingpipe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Exact Dictionary based Named Entity Recognition with Stanford
I have a dictionary of named entities, extracted from Wikipedia. I want to use it as the dictionary of an NER. I wanted to know how can I use Stanford-NER with this data of mine. I have also downloaded Lingpipe, although I have no idea how can I use it. I would appreciate all kinds of information.
Thanks for your helps.
java - 使用 lingpipe 编译脚本
我在我的电脑上安装了 ubuntu 并下载了 ant 和 linpipe(桌面)。现在我已经编写了一个训练数据集来训练我的分类器,但我无法破解如何编译代码。帮我 !!
java - 在 Java 中将 HMM 模型序列化/编译为 FILE
我已经用我自己的 POS 语料库成功评估了 Lingpipe 的 HMM POS Tagging 实现(准确率超过 90%)。
在 My Own POS Corpus 上评估 POS HMM 的 Ant 文件与 Brown POS Corpus 相同:
评估 HMM POS 标记器的类是: EvaluatePos.java 给出如下。
我现在的问题是如何创建 HMM 模型文件以将其用作基于 Chain CRF 的 NER 中的功能。
The Lingpipe ../../models 文件夹中的 pos-en-general-brown.HiddenMarkovModel 是如何创建的?
我正在使用 BrownPosCorpus.java、BrownPosParser.java 和 EvaluatePos.java
我应该将以下代码放在哪里来创建 pos hmm 模型文件?
可以对 Ant 文件进行哪些更改以创建 pos hmm 模型文件?
我想使用 POS HMM 模型文件作为链 CRF 特征提取器中的一个特征:
此致。
java - 无法使用 Lingpipe 识别西班牙语文本
几天前,我正在开发一个 java 服务器来保存一堆数据并识别它的语言,所以我决定使用 lingpipe 来完成这样的任务。但是我遇到了一个问题,在训练代码并用两种语言(英语和西班牙语)评估它之后,我无法识别西班牙语文本,但我用英语和法语得到了成功的结果。
为了完成这项任务,我遵循的教程是: http ://alias-i.com/lingpipe/demos/tutorial/langid/read-me.html
我为完成任务而采取的后续步骤:训练语言分类器所遵循的步骤
~1.首先将英语和西班牙语元数据解压到一个名为 leipzig 的文件夹中,如下所示(注意:元数据和句子由http://wortschatz.uni-leipzig.de/en/download提供):
~2.第二次将压缩后的语言元数据解压到解压文件夹中
~3.然后删除每个句子的句子,以删除行号、制表符并用单个空格字符替换换行符。输出统一使用 UTF-8 unicode 编码编写(注意:Lingpipe 站点上的 munge.java)。
~4.接下来我们从训练语言开始(注意:Lingpipe LanguageId 教程中的 TrainLanguageId.java)。
〜5。我们用下一个结果评估了我们训练的代码,在混淆矩阵上有一些问题(注意:Lingpipe LanguageId 教程中的 EvalLanguageId.java)。
~6.然后我们尝试用西班牙语文本进行真正的评估:
ClassifyLang.java 的代码:
~7.我尝试使用 100 万个元数据文件,但它得到了相同的结果,并且通过获得相同的结果来更改 ngram 编号。我会非常感谢你的帮助。
java - Java 的 LingPipe 错误
我没有使用 java 的经验,我正在尝试在 windows 上使用 lingpipe(在 linux 上一切正常)和命令 shell 命令。但不断收到错误消息。
这些是命令:
cd lingpipe\lingpipe-4.1.2-website\demos\generic\bin cmd_pos_en_general_brown.bat -inFile=C:\lingpipe\test.txt -outFile=C:\lingpipe\testout.xml
如本教程所示: http ://alias-i.com/lingpipe/web/demo-pos.html通过 Shell 命令的词性演示部分。
错误信息是:
ps:输入文件已经存在,输出文件应该是命令自动创建的。