问题标签 [crf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
334 浏览

python - 使用 CRF 模型 (CRFSuite) 标记项目时处理缺失或未知的特征

我正在使用 CRFSuite(python-crfsuite 实现)来构建命名实体提取器,类似于http://nbviewer.ipython.org/github/tpeng/python-crfsuite/blob/master/examples/上的教程CoNLL%202002.ipynb 训练输入是一个单词序列,每个单词都有许多特征。

问题在于,对于我的特定用例,我并不总是具有我试图识别的实体的特征。我希望 CRF 模型根据周围单词的特征来识别实体。但是,当我简单地输入一个空字典 {} 作为单词的特征时,命名实体永远不会被正确分类。

我想知道是否有处理这种情况的特征或标准方法,在训练模型后,一个模型并不总是具有所有项目的特征。

0 投票
1 回答
1754 浏览

python - 如何使用序列标签/ IOB 标签对 NER 进行分类?

我正在尝试根据 IOB/Sequence 标签识别和分类实体类型。

例如:

我只能通过标记对其进行分类,这意味着它将 Alex B-PER 和 Tan I-PER 分类为不同的类/实体类型。

所以我的问题是如何将 Alex B-PER 和 Tan I-PER 分类为一个/同一类,即 PERSON?

谢谢你。

0 投票
1 回答
174 浏览

nlp - 在斯坦福 NER 中定制我自己的模型

我可以问一下斯坦福NER吗?实际上,我正在尝试训练自己的模型,以便以后使用它进行学习。根据文档,我必须在 SeqClassifierFlags 中添加自己的功能,并在 NERFeatureFactory 中为每个功能添加代码。

我的问题是,我提取了所有特征的标记,最后一列代表标签。那么,斯坦福 NER 有什么方法可以给它包含 30 列(1 是单词,28 是特征,1 是标签)的制表符分隔文件来训练我自己的模型,而无需花费时间提取特征???当然,在测试阶段,我会给它一个像前面提到的没有标签的文件一样的文件来预测标签。

这可能吗?

提前谢谢了

0 投票
0 回答
544 浏览

nlp - 使用 Java 代码训练自定义模型 - 斯坦福 NER

有人可以帮我将这些行转换为 Java 代码,而不是使用终端吗?

我正在尝试使用 Stanford Ner 训练我自己的模型:

培训文件必须是 .tsv 格式吗???

0 投票
2 回答
366 浏览

python - 如何在使用 crfsuite 时使用先前令牌的实体类作为 NER 的功能

我在 python 中使用 python-crfsuite 包,这是由 Naoaki Okazaki 开发的 CRFSUITE 的实现(http://www.chokkan.org/software/crfsuite/

我想使用前一个标记的实体类作为特征,这将帮助我识别多词命名实体。我的训练数据示例:

[(Raheja,B-builder),(vista,I-builder),(is,O),(very,O),(着名,O)]

在这里,如果我可以在训练时使用之前的类特征。但是在预测时,我们将特征列表传递给标记器对象。测试时的问题是不知道以前的课程。

谁能告诉我这在 python-crfsuite 中是否可行。我觉得我们将特征传递给标记器对象的方式,是不可能的。

0 投票
2 回答
925 浏览

macos - MAC 上的 CRF++-058

我对使用 mac 几乎没有新意,当我尝试从命令行运行工具时遇到了一些问题。我正在尝试运行需要 CRF++ 的软件。这是错误;

我已经在我的机器上安装了 CRF++-058。我使用 brew 来安装 CRF++ 0.58。

这是 brew doctor 的输出

有谁知道如何解决这个问题?任何帮助将非常感激。谢谢

0 投票
1 回答
666 浏览

python - What's meaning of BOS and EOS in CRFSuite feature list and what is the role of them?

In NER(Named Entity Recognition) example in python-crf package website we see this function as feature generator:

You can see the completed tutorial there: python-crfsuite NER example

As you see after appending meaningful features - like word.lower and ...- two features has appended.

and

My question is "What's meaning of BOS and EOS and what is the role of them?"

0 投票
1 回答
1632 浏览

python - ImportError:Python 2.7.6 中没有名为 _CRFPP 的模块

我在 Python 2.7.6 中安装了 CRF++0.58

当我尝试导入时,我收到以下消息:

安装过程在 CRF++0.58 的 python 目录下的 README 文件中有描述,具体如下:

这放置在目录 /usr/local/lib/python2.7/dist-packages/ 中:

  1. CRFPP.py
  2. CRFPP.pyc
  3. _CRFPP.so

    目录 /usr/local/lib/python2.7/dist-packages/ 在 sys.path

    在 setup 目录的 CRFPP.py 中,在其开头包含以下过程:

    /li>

imp 没有找到 _CRFPP.so,但是找到了 CRFPP.py:

0 投票
3 回答
11674 浏览

python - 实现双向 LSTM-CRF 网络

我需要在最后实现一个带有 CRF 层的双向 LSTM 网络。具体是本文提出的模型,并对其进行训练。

http://www.aclweb.org/anthology/P15-1109

我想最好在 Python 中实现它。任何人都可以提供一些库或示例代码来说明如何做到这一点。我查看了 PyBrain,但并不能真正理解它。

我也对其他编程语言的工具包持开放态度。

0 投票
1 回答
1495 浏览

nlp - 如何将地名词典或字典表示为 crf++ 中的特征?

如何使用地名词典或词典作为CRF++中的功能?

详细说明:假设我想对人名进行 NER,并且我有一个包含常见人名的地名词典(或字典),我想使用这个地名词典作为 crf++ 的输入,我该怎么做?

我正在使用条件随机字段包 crf++ 来执行命名实体识别任务。我知道如何在 crf++ 中表示一些常用的特性。例如,如果我们想使用大写作为特征,我们可以在 crf 的特征模板中添加一个单独的列,指示单词是否大写。