r - 在 R 中使用 PAM 对事务数据进行聚类？

Question

我需要将不同组中的交易集分组。我在文本文件中的数据格式如下：

T1  17  20  22  35  37  60  62    
T2  39  51  53  54  57  65  73    
T3  17  20  21  22  34  37  62    
T4  20  22  54  57  65  73  45    
T5  20  54  57  65  73  75  80    
T6  2   20  54  57  59  63  71    
T7  2   20  22  57  59  71  66    
T8  17  20  28  29  30  34  35    
T9  16  20  28  32  54  57  65    
T10 16  20  22  28  57  59  71    
-    
-

等等，超过5000行。每行代表一个交易。

到目前为止我做了什么：

txIn<-read.transactions("data2.txt",format="basket",sep=" ") 
d<-dissimilarity(txIn,method="Jaccard")
 library("cluster")
 clustersA<-pam(d,k=100)
 txOut <- paste("txOu", ".txt") 
write.table(clustersA$clustering, file="txOu",sep=" ")

但文件存储事务#及其集群，如：

"x"
"1" 1
"2" 1
"3" 1
"4" 1
"5" 1
"6" 2
"7" 2
"8" 2
"9" 1
"10" 2
-
-

我需要将其保存为，例如：

集群 1：

T1  17  20  22  35  37  60  62    
T2  39  51  53  54  57  65  73    
T3  17  20  21  22  34  37  62    
T4  20  22  54  57  65  73  45    
T5  20  54  57  65  73  75  80

T9  16  20  28  32  54  57  65

集群 2：

T6  2   20  54  57  59  63  71    
T7  2   20  22  57  59  71  66    
T8  17  20  28  29  30  34  35        
T10 16  20  22  28  57  59  71    
    -
    -

等等，因为我想单独处理每个集群。

请我搜索了很多，我需要任何信息，例如，文档，任何帮助。

score 0 · Accepted Answer

您确定要进行聚类吗？

对我来说，听起来你可能对频繁项集挖掘更感兴趣。

r - 在 R 中使用 PAM 对事务数据进行聚类？

1 回答 1

Related

Reference