我已经阅读了 R 中的一个 csv 文件,其中包含其他信息中的共同作者数据。该文件的作者列包含以下共同作者信息:
Miyazaki T., Akisawa A., Saha B.B., El-Sharkawy I.I., Chakraborty A.
Saha B.B., Chakraborty A., Koyama S., Aristov Y.I.
Ali S.M., Chakraborty A.
...
我想将此信息转换为具有以下形式的边缘列表:
Miyazaki T. Akisawa A.
Miyazaki T. Saha B.B.
Miyazaki T. El-Sharkawy I.I.
Miyazaki T. Chakraborty A.
Akisawa A. Saha B.B.
Akisawa A. El-Sharkawy I.I.
Akisawa A. Chakraborty A.
Saha B.B. El-Sharkawy I.I.
Saha B.B. Chakraborty A.
El-Sharkawy I.I. Chakraborty A.
Saha B.B. Chakraborty A.
Saha B.B. Koyama S.
....
基本上,网络是一个无向图。任何帮助/入门代码将不胜感激。此外,有没有办法保持合作的计数/频率(例如,Saha 在示例中与 Chakraborty 一起发表了两次)?
到目前为止我的代码:
data <- read.csv(file="Citations.csv", header=TRUE)
split_authors <- strsplit(as.character(data$Authors), ',')
head(split_authors,5)
[[1]]
[1] "Miyazaki T." " Akisawa A." " Saha B.B." " El- Sharkawy I.I." " Chakraborty A."
[[2]]
[1] "Saha B.B." " Chakraborty A." " Koyama S." " Aristov Y.I."
[[3]]
[1] "Ali S.M." " Chakraborty A."
[[4]]
[1] "Myat A." " Thu K." " Kim Y.-D." " Chakraborty A." " Chun W.G." " Ng K.C."
[[5]]
[1] "Baran S.B." " Kandadai S." " Anutosh C." " Khairul H." " Ibrahim E.-S.I." " Shigeru K."