我正在研究与家庭/家庭组成有关的网络问题。我有多个包含 id1、id2 和关系代码的边缘表来说明身份变量之间的关系类型。这些表很大,每个表超过 700 万行。我还有一个节点表,其中包含相同的 id 和各种属性。
我想要实现的是一个邻接矩阵,它将提供类似于这样的汇总统计信息:
Children
1 2 3 4 total
--------------------
1 | 1 0 1 0 2
|
Adults 2 | 3 5 4 1 13
|
3 | 1 2 0 0 3
|
total | 5 7 5 1 18
本质上,我希望能够在我的数据中识别和计算不同的网络。
我的数据格式为:
ID1 ID2 Relationship_Code
X1 X2 Married
X1 X3 Parent/Child
X1 X4 Parent/Child
X5 X6 Married
X5 X7 Parent/Child
X6 X5 Married
. . .
. . .
. . .
我还有一个节点表,其中包含出生日期和可以识别成人/儿童状态的其他变量。
任何有关如何从图形数据框中提取此摘要信息的提示/提示都将非常有帮助并非常感谢。
谢谢