问题标签 [brat]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
brat - 在 Brat 中如何通过 UI 设置事件?
我正在尝试通过 UI 使用事件,但在文档中没有看到如何正确使用它们。我有兴趣标记主语谓词和宾语,然后将它们连接起来(因为每个句子中可以有多个)。在这种情况下,主语、谓语和宾语可以是任何字符串,所以我将它们定义为实体。
当我将一个句子标记为 SPO 时,我看到上面的错误“不完整:事件需要恰好 1 个 Arg1 参数”以及一些其他错误。识别事件和该事件的论点的正确方法是什么?
谢谢
brat - 小子:多标签多选?
我希望不必为要分配给同一字符串的每个附加标签打开“新注释”窗口。在单个打开的窗口中进行多项选择将有助于大大加快注释速度。那可能吗?
nlp - 在 nlplab Brat 注释工具中创建每个用户工作区
是否可以在一个 Brat 服务器实例上分离用户?我知道如何在 config.py 文件中创建新的用户帐户,但似乎所有用户都可以通过网络应用程序中的收集窗口查看所有文件(在 Brat 的数据目录中)。
我需要用户只能查看(以某种方式)属于他们的登录名的文件。我将文本和 .ann 文件直接上传到数据文件夹,因此用户只需要登录并开始注释。
这可能吗?
python - 如何读取 brat annotation toll 提供的 ann 文件并将它们转换为 python 中的数据框?
我正在研究基于序列标记分类的 IOB 方案,
首先,我想读一下我的语料库和他们的标签,但是语料库已经以一种叫做 .ann 文件的格式保存,我在这里从来没有像你一样工作过。当我打开它时,它使用https://brat.nlplab.org/进行了注释 ,我看到了这个
我想轻松解码,并将我的数据保存为这种格式的数据框:
带有标签的句子(如您在文本中看到的那样,声明或前提或 MAJORCLAIM)
类似这种格式的东西
带有标签的句子
我尝试使用此功能读取 .txt 文件
但是对于brat提供的这个ann文件,我就不知道了
nlp - 清理文本后在命名实体识别任务中保持对齐
我正在处理命名实体识别 (NER) 任务,实体以 BRAT 格式 (.txt + .ann) 进行注释。在使用我的模型之前,我已经实现了一些正则表达式来清理文本,但是如果我修改文本,我必须对齐实体的注释偏移量。这个任务相对简单,在此之后,我可以使用我的 NLP 模型对不同的实体类进行分类。然而,一旦我得到模型的分类,我需要重新对齐原始文本中识别的实体,即将清理后的文本的偏移量更改为我使用正则表达式之前的偏移量。有没有办法在清理文本后跟踪原始偏移量?
python - 如何将文件夹中的多个 ann 文件(来自 brat 注释)读入一个 pandas 数据帧?
我可以将一个 ann 文件读入 pandas 数据帧,如下所示:
但我不知道如何将多个 ann 文件读入一个 pandas 数据帧。我尝试使用concat
,但结果不是我所期望的。
如何将多个 ann 文件读入一个 pandas 数据帧?
nlp - 如何同时进行序列标记和实体关系标记
有没有一个 NLP 注释工具可以做到这两个?顺便说一句,我无法安装Brat,下载页面是404页面。我有 doccane 和 tagtog 但似乎他们只能做一种标签。
json - Brat 注释文件到 json 文件的转换
我是使用 brat 注释工具的新手,我想将我的两个注释文件“test.ann”和“train.ann”转换为 .json 文件,以便我可以在我的神经网络中使用它们。是否有相同的特定转换工具?我尝试了一个 cli 工具,但它是用 GO 语言编写的,我想知道是否有任何用 Python 语言编写的