我一直在玩predict-appointment-noshow 笔记本教程,但我对PERCENT_TRUE
原语的输出感到困惑。
我的理解是,在特征生成之后,像这样的列locations.PERCENT_TRUE(appointments.sms_received)
给出了为真的行的百分比sms_received
,给定一个位置,该位置在Entity
之前被定义为它自己的位置。我希望该列对于单个位置的所有行都是相同的,因为这是它的条件,但我发现情况并非如此。任何想法为什么?
这是该笔记本数据中的一个示例来演示:
>>> fm.loc[fm.neighborhood == 'HORTO', 'locations.PERCENT_TRUE(appointments.sms_received)'].describe()
count 144.00
mean 0.20
std 0.09
min 0.00
25% 0.20
50% 0.23
75% 0.26
max 0.31
Name: locations.PERCENT_TRUE(appointments.sms_received), dtype: float64
即使位置仅限于'HORTO'
,列的范围为 0.00-0.31。这是如何计算的?