0

我准备了一个数据集,其中包含大约 20k 行唯一标识符和约 60 列包含布尔信息(如果标签连接到该标识符):

ID   Gender   Tag1   Tag2   Tag3   Tag4   Tag5   Tag6   Tag 7   ...
A    m        0      1      1      0      0      0      0       ...
B    m        1      0      1      0      0      1      0       ...
C    f        1      1      0      0      0      1      1       ...

我想探索 Gephi 中的数据,但不知道要使用什么导出结构/格式。为了能够探索标签之间的关系,数据应该是什么样子?我需要做什么才能到达这个结构?我是否需要进一步总结它,我可以将性别数据保留在那里作为分析的属性吗?

4

1 回答 1

1

假设您的数据代表一个网络,这是一种将其导出为边缘列表 csv 的方法:

df <- read.table(header =T, sep =";", text = "ID;Gender;Tag1;Tag2;Tag3;Tag4;Tag5;Tag6;Tag7
A;m;0;1;1;0;0;0;0
B;m;1;0;1;0;0;1;0
C;f;1;1;0;0;0;1;1")

library(dplyr)
library(tidyr)
library(magrittr)
df %>%
  gather(Target, isTrue, -ID, -Gender) %>%
  filter(isTrue == 1) %>%
  select(-isTrue) %>%
  set_names(c("Source", "Gender", "Target")) %>%
  write.csv(file = file.path(tempdir(), "my.csv"), row.names = FALSE)

您可以将它作为边缘列表导入 Gephi 并让 gephi 自动创建节点列表:

在此处输入图像描述

于 2015-02-13T23:32:51.057 回答