我一直在使用 DBSCAN 处理我的数据的 t-SNE。然后我将获得的值分配给原始数据框,然后用 seaborn 散点图绘制它。这是代码:
from sklearn.manifold import TSNE
tsne_em = TSNE(n_components=3, perplexity=50.0, n_iter=1000, verbose=1).fit_transform(df_tsne)
from bioinfokit.visuz import cluster
cluster.tsneplot(score=tsne_em)
from sklearn.cluster import DBSCAN
get_clusters = DBSCAN(eps=4, min_samples=10).fit_predict(tsne_em)
filter_df['x'] = tsne_em[:,0]
filter_df['y'] = tsne_em[:,1]
g = sns.scatterplot(x='x', y='y', hue = 'Species', style = 'Gender', data=filter_df)
g.legend(loc='center left', bbox_to_anchor=(1, 0.5))
plt.savefig('Seaborn-MF-Species-TSNE-EPS4.png', dpi=600, bbox_inches='tight')
这是图像的显示方式:
我已经看到人们计算集群的大小(单元格数量、百分比等)并进行其他我没有找到任何类型代码的分析后工作。现在有没有人可以例如圈出确切的集群,显示其中的单元格数量等等......我有几个这样的图表,它真的会帮助我让他们的结果看起来更容易理解。