我是初学者,第一次使用 Tableau。我想 从 Tableau Dekstop 中的 Python 代码执行 PCA。我得到了该过程背后的主要想法,安装了 TabPy。
我的数据集非常大,大约有 1000 多列。
我看了一下 modyfing python 代码(最后是我的 python 代码),以便能够在 tableau 中运行。
我的问题是,在我的情况下如何指定 _arg1,_arg2,_arg3,... 因为我使用 dataset.drop('Class', 1) 来定义 x,而 dataset['Class'] 来定义 y?
先感谢您。
# importing or loading the dataset
dataset = pd.read_excel('NL_undivided.xlsx')
# distributing the dataset into two components X and Y
X = dataset.drop('Class', 1)
Y = dataset['Class']
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(X)
scaled_data = scaler.transform(X)
from sklearn.decomposition import PCA
pca = PCA(n_components=2)
pca.fit(scaled_data)
x_pca = pca.transform(scaled_data)
plt.figure(figsize=(20,10))
fig, ax = plt.subplots(figsize=(20, 10))
scatter = ax.scatter(x_pca[:,0],x_pca[:,1],c=Y,cmap='rainbow',)
# produce a legend with the unique colors from the scatter
legend1 = ax.legend(*scatter.legend_elements(),
loc="best", title="Cohorts")
ax.add_artist(legend1)
plt.figure(figsize=(15,8))