我正在使用 DMOZ 作为文档库,我正在尝试对其进行索引以便使用 Lucene 执行查询。我猜我需要把这个 RDF 文件转换成 java 对象。这是正确的方法吗?如果是,我怎样才能将此文件转换为对象?
这是 RDF 文件的示例:
<RDF>
<Topic>
<catid>121212</catid>
<link r:resource="http://page1.com"></link>
<link r:resource="http://page2.com"></link>
<link r:resource="http://page3.com"></link>
<link r:resource="http://page4.com"></link>
</Topic>
<ExternelPage about="http://page1.com">
<d:Title>the Title1</d:Title>
<d:Description>description1</d:description>
<ages>ages1</ages>
<topic>topic1</topic>
</ExternelPage>
<ExternelPage about="http://page2.com">
<d:Title>the Title2</d:Title>
<d:Description>description2</d:description>
<ages>ages2</ages>
<topic>topic2</topic>
</ExternelPage>
<ExternelPage about="http://page3.com">
<d:Title>the Title3</d:Title>
<d:Description>description3</d:description>
<ages>ages3</ages>
<topic>topic3</topic>
</ExternelPage>
<ExternelPage about="http://page4.com">
<d:Title>the Title4</d:Title>
<d:Description>description4</d:description>
<ages>ages4</ages>
<topic>topic4</topic>
</ExternelPage>
<Topic>
<catid>
.
.
.
.
</Topic>
<ExternelPage about="aLink">
.
.
.
etc...
</RDF>
谢谢。