1

我希望使用 Senseval-2 Coarse Sense Dataset,但有相同的描述(关于数据集的格式)。

它应该有决策数据,即是否应该合并两种感官。中间值是置信度吗?此外,他们使用了 Wordnet 1.7 的预发布版本。我可以用 Wordnet 1.7 做同样的事情吗?

文件中的示例如下所示:

材料%5:00:00:物理:00 3 材料%5:00:00:世俗:00

材料%3:00:03::3 材料%5:00:00:世俗:00

材料%3:00:04:: 2 材料%3:00:01::

材料%3:00:02::

发布%5:00:00: 成功(a):00

现在%3:00:01::

现在%3:00:02::

现在%3:01:00::

石头%3:01:00::

石头%5:00:00:彩色:00

空气%1:15:00:: 4 空气%1:27:00::

空气%1:19:00:: 4 空气%1:27:00::

空气%1:27:01:: 4 空气%1:27:00::

空气%1:04:00::

空气%1:10:02::

空气%1:07:00::

空气%1:10:01::

上诉%1:04:00:: 3 上诉%1:10:00::

上诉%1:10:02:: 3 上诉%1:10:00::

4

1 回答 1

2

通过检查,中间的数字实际上描述了有多少个感官在同一个合并的意义上。例如:

matrial%5:00:00:physical:00 3 material%5:00:00:worldly:00
material%3:00:03:: 3 material%5:00:00:worldly:00

基本上说有 3 种感觉被认为与 相同material%5:00:00:worldly:00,它们是两条线中提供的两种感觉,以及感觉本身。

您还可以看到,没有合并的感觉没有数字,例如air%1:04:00,并且material%3:00:04:: 2 material$2:00:01::您可以看到有两种感觉。因此,您可以通过将第一个位置的感官映射到第二个位置的感官来进行合并。

于 2013-09-06T04:05:43.550 回答