0

我刚刚开始掌握复杂网络和社交网络分析背后的想法和技术。我似乎总是在数据准备阶段绊倒并陷入困境。我经常在 Google Refine 中有一个数据集,它基本上是一堆以某种方式相关的行。例如,目前我有一份他们参加过的组织和活动的列表(有些重复,因为一个组织可能派了多个代表参加活动)

我的 Google 优化数据

所以我可以看到组织将是我图表上的节点,并且如果他们都参加了同一个活动,它们之间的关系就存在,但是我不知道我如何将这个数据集转换为 NWB、Gephi 等工具的格式, R 或 Tulip 会理解。

我经常发现自己有一个数据集,我可以看到列之间的关系,但我不知道下一步应该采取哪些步骤来准备我的数据,以便通过此类工具导入以探索关系。我浏览了支持文件类型的文档,我的猜测是在 Refine 中使用 RDF 骨架工具做一些事情并采用链接数据样式方法可能是一个可能的解决方案,但我没有运气。

任何有关数据准备的提示将不胜感激。

4

1 回答 1

0

以防万一有人在未来偶然发现这一点。我通过在 R 中导入我的 CSV 并创建一个模式矩阵来创建这个,然后创建一个基于此的图表。

organisations_events<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T, sep=",")

df<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T,     sep=",")

M = as.matrix( table(df) )

Mrow = M %*% t(M)

#Mcol = t(M) %*% M

write.csv(Mrow, "test.csv")

如果有帮助,请在此处记录答案.. http://www.davidsherlock.info/network-analysis

于 2012-06-11T21:16:26.533 回答