0

我有一个带有多个房地产列表的熊猫数据框。数据集的一个子集如下。

Neighborhood      High School      ...
WOODLEY           LIBERTY
WOODLEY 
COUNTRY CLUB  
COUNTRY CLUB      HERITAGE
COUNTRY CLUB      HERITAGE
COUNTRY CLUB      TUSCORORA
...

许多社区没有信息,其他社区不正确。我正在尝试做一个映射来纠正这个问题。

cleanHS = {"WOODLEY": "LIBERTY", "COUNTRY CLUB": "HERITAGE", ...}
dirty["High School"] = dirty["High School"].map(cleanHS)

不幸的是,这导致该High School列只有NaN's。我在这里做错了什么?

4

3 回答 3

2

这是因为您将值从映射High School到其他值,但映射值的起始列应该是Neighborhood

dirty["High School"] = dirty["Neighborhood"].map(cleanHS)
于 2020-07-09T13:09:26.937 回答
1

dirty["High School"] = dirty["Neighborhood"].map(cleanHS)

如果您将高中映射到高中,您将不会收到预期的结果。高中区是从邻里派生的,因此您需要确保两个列是交互的。

于 2022-01-23T14:36:04.207 回答
1

您需要更改要映射的列

dirty["High School"] = dirty["Neighborhood"].map(cleanHS)
于 2020-07-09T13:10:03.993 回答