0

我是初学者,第一次使用 Tableau。我想 从 Tableau Dekstop 中的 Python 代码执行 PCA。我得到了该过程背后的主要想法,安装了 TabPy。

我的数据集非常大,大约有 1000 多列。

我看了一下 modyfing python 代码(最后是我的 python 代码),以便能够在 tableau 中运行。

我的问题是,在我的情况下如何指定 _arg1,_arg2,_arg3,... 因为我使用 dataset.drop('Class', 1) 来定义 x,而 dataset['Class'] 来定义 y?

先感谢您。

# importing or loading the dataset

dataset = pd.read_excel('NL_undivided.xlsx')

 

# distributing the dataset into two components X and Y

X = dataset.drop('Class', 1)

Y = dataset['Class']

 

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

scaler.fit(X)

 

scaled_data = scaler.transform(X)

 

from sklearn.decomposition import PCA

pca = PCA(n_components=2)

pca.fit(scaled_data)

 

x_pca = pca.transform(scaled_data)

 

plt.figure(figsize=(20,10))

fig, ax = plt.subplots(figsize=(20, 10))

 

scatter = ax.scatter(x_pca[:,0],x_pca[:,1],c=Y,cmap='rainbow',)

 

# produce a legend with the unique colors from the scatter

legend1 = ax.legend(*scatter.legend_elements(),

                    loc="best", title="Cohorts")

ax.add_artist(legend1)

plt.figure(figsize=(15,8))
4

0 回答 0