我正在使用 Pandas 在 Python 中导入 Web 日志文本文件。Python 正在读取标题,但是使用文本“字段:”作为标题,然后在末尾添加了另一列空白(NaN)。如何停止将此文本用作列标题?
这是我的代码:
arr = pd.read_table("path", skiprows=3, delim_whitespace=True, na_values=True)
这是文件的开头:
软件:Microsoft Internet Information Services 7.5
版本:1.0
日期:2014-08-01 00:00:25
字段:日期时间
2014-08-01 00:00:25...
结果是“字段”被用作列标题,并且正在为“时间”列创建一个充满 NaN 值的列。