我想使用以下数据使用 ggraph R 包生成无向网络可视化,但我不知道如何将数据整理/重塑为可以使用的格式。
这是一些示例输出数据,类似于我在真实数据上使用的蛋白质序列聚类算法的输出。数据结构不是一个整洁的结构。
# Preparing example data
cluster_id <- c(1, 2, 3, 4)
cluster_membersA <- c("CAISGGGELFF", "CASSLGDEQYF", "CASSLLGEQFF", "CASSMGYEQYF")
cluster_membersB <- c("CASSAGGELFF", "CAWSLGVEQYF", "CASSLLGEQYF", "")
cluster_membersC <- c("CSASGGGEQYF", "CASSLGWEAFF", "", "")
cluster_membersD <- c("CASSGGGEQFF", "", "", "")
cluster_data <- data.frame(cluster_id, cluster_membersA, cluster_membersB, cluster_membersC, cluster_membersD)
write.table(cluster_data, quote = FALSE, sep = " ", col.names = FALSE, row.names = FALSE)
这是数据的样子:
1 CAISGGGELFF CASSAGGELFF CSASGGGEQYF CASSGGGEQFF
2 CASSLGDEQYF CAWSLGVEQYF CASSLGWEAFF
3 CASSLLGEQFF CASSLLGEQYF
4 CASSMGYEQYF
网络可视化应产生 4 个离散集群,其中由文本字符串表示的节点相互连接。第 4 个集群中的节点只能连接到自身。
我从 ggraph 文档中读到我应该使用该as_tbl_graph()
函数来制作一个整洁的格式网络对象,但是我无法成功地使用这个函数从这个数据格式中制作一个整洁的图形对象。