我正在寻找可以帮助我解析 nquad 文件的 RegEx。nquad 文件是一个纯文本文件,其中每一行代表一个四边形 (s, p, o, c):
<http://mysubject> <http://mypredicate> <http://myobject> <http://mycontext> .
<http://mysubject> <http://mypredicate2> <http://myobject2> <http://mycontext> .
<http://mysubject> <http://mypredicate2> <http://myobject2> <http://mycontext> .
对象也可以是文字(而不是 uris),在这种情况下,它们用双引号括起来:
<http://mysubject> <http://mypredicate> "My object" <http://mycontext> .
我正在寻找一个给定该文件的一行的正则表达式,它将返回一个以下格式的 php 数组:
[0] => "http://mysubject"
[1] => "http://mypredicate"
[2] => "http://myobject"
[3] => "http://mycontext"
...或者在双引号用于对象的情况下:
[0] => "http://mysubject"
[1] => "http://mypredicate"
[2] => "My Object"
[3] => "http://mycontext"
最后一件事-在理想的世界中,正则表达式将满足各种组件之间可能存在1个或多个空格的情况,例如
<http://mysubject> <http://mypredicate> "My object" <http://mycontext> .