2

刚开始研究 RDF 和本体,主要是将非结构化文本转换为 RDF(可能是手动),我发现了许多将简单句子转换为 RDF 三元组的示例1 2 3,但关于复杂句子的例子不多(使用形容词或副词)4

复合句示例:那些非常高兴地喜欢巧克力冰淇淋的孩子和那些喜欢香草冰淇淋的孩子,谁更好?

别管句子的意思,值得注意的是对冰淇淋(巧克力、香草)和喜欢(愉快)的形容词的使用,以及两种类型的孩子(谁更好)和一个问题的比较。我们如何将这样的句子表示为 SPO 三元组 (RDF) 语句的集合——以便它可以处理形容词、副词或比较或其他操作?

S1:儿童 - 喜欢 -(冰淇淋、风味、巧克力)
S2:儿童 - 喜欢 -(冰淇淋、风味、香草)
S3:愉快地喜欢
S4:更好(S1+S3,S2+S3)

有没有一种通用的方法来翻译这些语句?人们应该在哪里寻找这个方向的一些探索 - 将非结构化文本转换为 n 元组?也许我没有问正确的问题——在这种情况下,请告诉我。谢谢!

4

2 回答 2

2

我并没有试图描述一种翻译此类语句的通用方式,而是想到了如何在 RDF 三元组中对具体的例句进行建模。

这是我的第一个(深夜)草稿:

@prefix : <https://example.org/> .

[] a :Question, :PreferenceQuestion;
   :option [ 
       a :GroupOfHumans;
       :ageGroup :young;
       :perfomingActivity [
          a :Activity, :LikingActivity;
          :mode :withPleasure;
          :object [
              :category :IceCream;
              :flavour :vanilla;
           ]
       ]
   ],
   [ 
       a :GroupOfHumans;
       :ageGroup :young;
       :perfomingActivity [
          a :Activity, :LikingActivity;
          :mode :withPleasure;
          :object [
              :category :IceCream;
              :flavour :chocolate;
           ]
       ]
   ].

这将是 23 个三元组,使用了非常有表现力的 Question/Activity/IceCream 本体。

于 2019-08-31T22:16:35.740 回答
1

这是您要问的一个非常困难的问题,没有一种方法可以在最终标准的图形或树或链接结构中表示“语义”。

例如查看Google 语法分析链接语法Spacy 依赖分析树斯坦福 NLP 分析器

看到这个有点相关的问题,给出了一个链接语法解析结果的例子:How to translate syntatic parse to a dependency parse tree?

对于更高级的方法,请查看多网络自然语言到一阶逻辑类型的方法。

应该在哪里寻找这个方向的一些探索 - 非结构化文本到 n 元组?

您可以使用 n 元组或 3 元组来表示您想要的任何内容,关键是要知道表示什么以及如何表示。

最后一件事,你可以想出你是注释,它们是像https://prodi.gy/这样的工具。看看这个看似无关的问题,但我给出了一个可能帮助您完成某些任务的示例问题https://stackoverflow.com/a/32670572/140837

祝你好运!!

于 2019-08-30T20:31:30.303 回答