4

我一直在研究用于存储数据的 freebase 项目。它似乎是存储具体、客观数据(如姓名、位置和日期)的好地方。它是存储主观数据(如意见或评级)的好地方吗?是否有另一种/更好的开放数据、语义数据存储或存储和查询此类信息的策略?

此外,由于它是主观的,我可以肯定其他人不会同意我的意见。我将如何在线存储其他人的意见,以便更好地代表人群意见?

freebase 是存储此类数据的正确位置吗?

例如:餐厅评级或电影评级。电影评级的时间敏感性可能不如餐厅评级。任何关于输入数据的人的非识别信息对于确定其他因素和关系都是有趣的。

4

4 回答 4

2

在很大程度上,语义网或多或少是一阶逻辑的变体,因此重要的部分是清楚地了解每个谓词的“含义”。这个想法非常简单,但适用于各种各样的意义表示——即它在数据库的实体模型之后。

在语义网络表示中表示您提到的信息应该没有问题。只需确保对每个谓词的含义有一个明确的定义,这样含义就不会随着时间的推移而改变,并且最终会出现不一致的表示。

Genesereth 的书很旧,但如果您有兴趣更详细地阅读这本书,它是一本不错的书。我认为很多从事语义网工作的人都参与了 Douglas Lenat 的 Cyc 项目,该项目随着时间的推移逐渐转向基于逻辑的意义表示。

http://www.amazon.com/Logical-Foundations-Artificial-Intelligence-Genesereth/dp/0934613311

Cyc的网站:

http://www.cyc.com/

于 2009-06-15T21:51:17.530 回答
1

如果不了解我将使用该数据提出的问题,我发现设计/选择数据格式非常困难。您希望这些数据用于什么目的?提出一些用例,这可能会指导您的搜索。

存储属性数据是一个开放的研究课题,在(以及其他地方)情报社区的发展:这些用户显然需要跟踪信息的来源,以及一路上谁添加了信息,以验证其可靠性和执行诸如跟踪机密信息是否被意外包含之类的操作。那可能是个值得一看的好地方。

于 2009-06-15T19:36:17.837 回答
0

数据就是数据,您要做的就是将数据标记为它是什么、意见或评级。我认为可以从这些数据中推断出的“事实”是大多数人x对所述主题有主观意见。

于 2009-06-15T19:24:32.260 回答