我正在尝试实现两组(及其标签)的联合,但显然它为“幸存”列提供了一个“keyerror”。它应该相当简单,但我不知道是什么导致了错误
train_df 有 12 列,而 test_df 有 11 列,但“Survived”除外。
这是 train_df 的数据标签
Index(['PassengerId', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp',
'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'],
dtype='object')
这里是那些 test_df
test_df.columns
Index(['PassengerId', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp', 'Parch',
'Ticket', 'Fare', 'Cabin', 'Embarked'],
dtype='object')
编码
cols = train_df.columns
labels = []
for i in range(0,12):
train = train_df[cols[i]].unique()
test = test_df[cols[i]].unique()
labels.append(list(set(train) | set(test)))
输出应合并两者的列,但它会在“幸存”上给出 keyerror