问题标签 [conll]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
33 浏览

python - 如果其中一个单元格包含所有大写字符串的列表,则从熊猫数据框中删除一行

我正在使用 conll2003dataset。它包含来自各种新闻来源的文章。它包含句子、这些句子中每个单词的词性标签、这些单词的块 ID 等。

有些句子都是大写的。我只是想从相应的数据框中删除这些行。这是我尝试过的:

但我收到以下错误:

我哪里错了?我该怎么做呢?

是说明相同内容的 colab 笔记本。

0 投票
1 回答
99 浏览

python - 将 Spacy NER 实体格式转换为 CONLL 2003 格式

我正在研究 NER 应用程序,其中我有以下数据格式的数据注释。

有没有办法将其转换为 CONLL 2003 格式?

0 投票
2 回答
56 浏览

python - 如何将 XML 中的带注释文本转换为 CONLL?

我需要为 NER 任务预处理 XML 文件,并且我正在努力转换 XML 文件。我想有一种很好且简单的方法可以解决以下问题。

给定具有以下结构的 XML 中的注释文本作为输入:

我想要一个 IOB2 标记格式的 CoNLL 文件,如下所示: