我正在对亚马逊食品评论进行情绪分析,我正在尝试将 Word2Vec 应用于评论并使用 t-SNE 将其可视化。
使用以下代码,我可以轻松地使用 Bag of words 表示来进行可视化:
from sklearn.manifold import TSNE
data_2000 = final_counts[0:2000,:]
top_2000 = data_2000.toarray()
labels = final['Score']
labels_2000 = labels[0:2000]
model = TSNE(n_components=2, random_state=0)
tsne_data = model.fit_transform(top_2000)
# creating a new data frame which help us in ploting the result
tsne_data = np.vstack((tsne_data.T, labels_2000)).T
tsne_df = pd.DataFrame(data=tsne_data, columns=("Dim_1", "Dim_2",
"label"))
# Ploting the result of tsne
sns.FacetGrid(tsne_df, hue="label", size=6).map(plt.scatter,
'Dim_1', 'Dim_2').add_legend()
plt.show()
此外,当我提供类型为 gensim.models.word2vec.Word2Vec 的 w2v_model 模型时,相同的代码不起作用
我使用以下代码获得了模型:
w2v_model=gensim.models.Word2Vec(list_of_sent,min_count=5,size=50,
workers=4)