问题标签 [crf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 CRF 模型 (CRFSuite) 标记项目时处理缺失或未知的特征
我正在使用 CRFSuite(python-crfsuite 实现)来构建命名实体提取器,类似于http://nbviewer.ipython.org/github/tpeng/python-crfsuite/blob/master/examples/上的教程CoNLL%202002.ipynb 训练输入是一个单词序列,每个单词都有许多特征。
问题在于,对于我的特定用例,我并不总是具有我试图识别的实体的特征。我希望 CRF 模型根据周围单词的特征来识别实体。但是,当我简单地输入一个空字典 {} 作为单词的特征时,命名实体永远不会被正确分类。
我想知道是否有处理这种情况的特征或标准方法,在训练模型后,一个模型并不总是具有所有项目的特征。
python - 如何使用序列标签/ IOB 标签对 NER 进行分类?
我正在尝试根据 IOB/Sequence 标签识别和分类实体类型。
例如:
我只能通过标记对其进行分类,这意味着它将 Alex B-PER 和 Tan I-PER 分类为不同的类/实体类型。
所以我的问题是如何将 Alex B-PER 和 Tan I-PER 分类为一个/同一类,即 PERSON?
谢谢你。
nlp - 在斯坦福 NER 中定制我自己的模型
我可以问一下斯坦福NER吗?实际上,我正在尝试训练自己的模型,以便以后使用它进行学习。根据文档,我必须在 SeqClassifierFlags 中添加自己的功能,并在 NERFeatureFactory 中为每个功能添加代码。
我的问题是,我提取了所有特征的标记,最后一列代表标签。那么,斯坦福 NER 有什么方法可以给它包含 30 列(1 是单词,28 是特征,1 是标签)的制表符分隔文件来训练我自己的模型,而无需花费时间提取特征???当然,在测试阶段,我会给它一个像前面提到的没有标签的文件一样的文件来预测标签。
这可能吗?
提前谢谢了
nlp - 使用 Java 代码训练自定义模型 - 斯坦福 NER
有人可以帮我将这些行转换为 Java 代码,而不是使用终端吗?
我正在尝试使用 Stanford Ner 训练我自己的模型:
培训文件必须是 .tsv 格式吗???
python - 如何在使用 crfsuite 时使用先前令牌的实体类作为 NER 的功能
我在 python 中使用 python-crfsuite 包,这是由 Naoaki Okazaki 开发的 CRFSUITE 的实现(http://www.chokkan.org/software/crfsuite/)
我想使用前一个标记的实体类作为特征,这将帮助我识别多词命名实体。我的训练数据示例:
[(Raheja,B-builder),(vista,I-builder),(is,O),(very,O),(着名,O)]
在这里,如果我可以在训练时使用之前的类特征。但是在预测时,我们将特征列表传递给标记器对象。测试时的问题是不知道以前的课程。
谁能告诉我这在 python-crfsuite 中是否可行。我觉得我们将特征传递给标记器对象的方式,是不可能的。
macos - MAC 上的 CRF++-058
我对使用 mac 几乎没有新意,当我尝试从命令行运行工具时遇到了一些问题。我正在尝试运行需要 CRF++ 的软件。这是错误;
我已经在我的机器上安装了 CRF++-058。我使用 brew 来安装 CRF++ 0.58。
这是 brew doctor 的输出
有谁知道如何解决这个问题?任何帮助将非常感激。谢谢
python - What's meaning of BOS and EOS in CRFSuite feature list and what is the role of them?
In NER(Named Entity Recognition) example in python-crf package website we see this function as feature generator:
You can see the completed tutorial there: python-crfsuite NER example
As you see after appending meaningful features - like word.lower and ...- two features has appended.
and
My question is "What's meaning of BOS and EOS and what is the role of them?"
python - ImportError:Python 2.7.6 中没有名为 _CRFPP 的模块
我在 Python 2.7.6 中安装了 CRF++0.58
当我尝试导入时,我收到以下消息:
安装过程在 CRF++0.58 的 python 目录下的 README 文件中有描述,具体如下:
这放置在目录 /usr/local/lib/python2.7/dist-packages/ 中:
- CRFPP.py
- CRFPP.pyc
_CRFPP.so
目录 /usr/local/lib/python2.7/dist-packages/ 在 sys.path
在 setup 目录的 CRFPP.py 中,在其开头包含以下过程:
/li>
imp 没有找到 _CRFPP.so,但是找到了 CRFPP.py:
python - 实现双向 LSTM-CRF 网络
我需要在最后实现一个带有 CRF 层的双向 LSTM 网络。具体是本文提出的模型,并对其进行训练。
http://www.aclweb.org/anthology/P15-1109
我想最好在 Python 中实现它。任何人都可以提供一些库或示例代码来说明如何做到这一点。我查看了 PyBrain,但并不能真正理解它。
我也对其他编程语言的工具包持开放态度。
nlp - 如何将地名词典或字典表示为 crf++ 中的特征?
如何使用地名词典或词典作为CRF++中的功能?
详细说明:假设我想对人名进行 NER,并且我有一个包含常见人名的地名词典(或字典),我想使用这个地名词典作为 crf++ 的输入,我该怎么做?
我正在使用条件随机字段包 crf++ 来执行命名实体识别任务。我知道如何在 crf++ 中表示一些常用的特性。例如,如果我们想使用大写作为特征,我们可以在 crf 的特征模板中添加一个单独的列,指示单词是否大写。