我正在将 RDF 数据加载到 JUNG 图中以进行一些分析。所以我创建了一个新图表:
DirectedGraph g = new DirectedSparseGraph<String,GraphLink>();
我创建了一个支持类来指定链接:
public class GraphLink {
String uri;
Float weight;
}
然后我像这样填充它:
for each rdf triple <s,p,o>{
g.addVertex( s )
g.addVertex( o )
GraphLink link = new GraphLink()
link.uri = pred
link.weight = some weight;
g.addEdge( link, s, o )
}
这是一种有效的方法还是有更好的方法?边缘的表示非常违反直觉,但如果我这样做:
g.addEdge( p, s, o )
我得到了重复边缘的例外。
有什么提示吗?
更新:这段代码似乎运行良好:
DirectedGraph<RDFNode,Statement> g = new DirectedSparseGraph<RDFNode,Statement>()
// list all statements
// TODO: pagination for very large graphs.
assert m.size() < 10000000,"graph is too large."
m.listStatements().each{ stm->
RDFNode sub = stm.getSubject()
RDFNode obj = stm.getObject()
g.addVertex( sub )
if ( includeLiterals || !obj.isLiteral() ){
g.addVertex( obj )
g.addEdge( stm, sub, obj, EdgeType.DIRECTED )
}
}
穆龙