0

我有两个单独的 csv 文件,我读入了 pandas 数据框。我已经做了一些清理工作,并按日期列加入了表格。我有另一列名为“ExerciseTime”,并将导入的一天中执行时间的时间格式转换为浮点格式,即 22:30:00(晚上 10:30)到 22.5(浮点值)。

我想通过比较一天中的锻炼时间与睡眠质量(这是我的 Garmin 连接数据和睡眠周期数据)来运行训练/测试拆分分析。目前几乎没有准确性/相关性,但我怀疑如果我按小时将“ExerciseTime”列变成虚拟变量,它可能会有所帮助。我想将列中的所有值转换为整数值(向上和向下舍入)并希望忽略任何有空值的实例(我没有锻炼的日子)。我目前在使用以下公式时遇到错误:

JoinedTables = JoinedTables[JoinedTables.ExerciseTime.astype(int)]

忽略空值并将浮点值转换为整数的最佳方法是什么?

此外,如果有人知道用于此类数据的最佳类型模型预测器,我将不胜感激任何想法,因为我对此仍然很陌生。我还有其他数据点,例如“总运动持续时间”、“如果我睡前饮酒”、“那天的运动类型”、“那天的月相”,我也想合并这些数据点,看看是否有任何统计数据严重影响我的睡眠质量。

4

1 回答 1

2

pd.to_numeric(col, errors='coerce')应该可以解决问题:

JoinedTables['ExerciseTime'] = pd.to_numeric(JoinedTables['ExerciseTime'], errors='coerce')
于 2017-10-02T19:53:16.490 回答