问题标签 [crf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 在槌中处理 CRF 的整数值特征
我刚开始在槌中使用 SimpleTagger 类。我的印象是它需要二进制特征。我要实现的模型具有正整数值特征,我想知道如何在 mallet 中实现它。另外,我听说如果模型要有意义,就需要对非二进制特征进行归一化。我将不胜感激有关如何执行此操作的任何建议。
附言。是的,我知道有一个专门的槌邮件列表,但我已经等了将近一天才能让我的订阅获得批准,以便能够在那里发帖。我只是很着急。
metadata - 使用条件随机字段进行命名实体识别
什么是条件随机场?条件随机字段究竟如何将专有名称识别为结构化或非结构化文本中的人、组织或地点?
例如:此产品由 StackOverFlow Inc. 订购。
条件随机场如何将 StackOverFlow Inc. 识别为一个组织?
machine-learning - Mallet CRF SimpleTagger 性能调优
任何使用 Java 库 Mallet 的 SimpleTagger 类用于条件随机字段 (CRF) 的人的问题。假设我已经在使用多线程选项来获得可用的最大 CPU 数量(就是这种情况):我从哪里开始,如果我需要它运行得更快,我应该尝试哪些事情?
一个相关的问题是,是否有一种方法可以做类似于随机梯度下降的事情,从而加快训练过程?
我想做的培训类型很简单:
(特征是我在自己的代码中对数据进行的处理的输出。)
我在让除 Mallet 之外的任何 CRF 分类器大致工作时遇到问题,但我可能不得不再次回溯并重新访问其他实现之一,或者尝试一个新的实现。
java - Mallet:每个预测的特征贡献
我正在使用 CRF 在 Mallet 上开发 NER 系统。
你知道是否可以收集每个预测的特征贡献?我需要知道并理解 CRF 模型的精确行为。
有什么建议么?
谢谢。
干杯,乌克兰
c++ - 什么是 C++ 实际支持的条件随机字段包?
我发现的几个软件包已经一年多没有更新了。我想知道 C++ 的标准 CRF 包是什么?
python - 如何在 NLTK 中使用 CRF?
在像 HMM 标注器这样的 NLTK 中,似乎也有 CRF 标注器。但我没有找到任何教程或帮助。我该怎么做?
pos-tagger - Mallet CRF SimpleTagger 短语/多词
我是 Mallet 的新手,我正在尝试使用 mallet 简单标记器/CRF 并尝试使用短语 - 我尝试在 mallet 网站上查找文档并浏览用户档案 - 没有任何帮助。
我尝试训练槌进行简单标记,它的工作原理很好。这是我的数据的样子(请注意训练之间有一个换行符,表示它们是不同的集合)
样本训练数据:
我遇到的问题是当城市名称是多个单词时,说
请注意,在上述训练数据中,“新”是一个停止词问题
- 对于简单标记器,上述表示是否正常?如果不是,我如何表示短语?
- 如果不是如何表示数据,以便 SimpleTagger/CRF 可以使用前面的“n”个词来到达标签?即我输入的一种块
mallet - 您如何从命令行使用 GenericAcrfTui 查看测试集的标签?
我正在使用 Mallet 的 GenericAcrfTui 训练和测试数据。所以我正在使用槌中的图形模型 (GRMM) 进行 CRF 训练。我已经为我的训练集和测试集创建了功能,并希望从命令行运行 GenericAcrfTui。当我运行它时,我会取回每个标签的 F 分数和准确度度量,但我不会取回每一行的实际标签。我做这样的事情:
这是槌示例中给出的示例。似乎没有用于获取标签的开关。如何做到这一点?