1

我正在尝试从 pandas 的数据框中删除括号和撇号,以便我可以进一步解析时间戳,格式为:YYYY/MM/DD:HH:MM:SS。

我正在使用的代码如下所示:

finallog = newerlog.split()
ts = finallog[0::6]
ip = finallog[1::6]
proxy = finallog[3::6]
refurl = finallog[4::6]
requrl = finallog[5::6]

数据帧开头的错误时间戳示例如下: ['2020/11/13:02:16:43 数据帧中还有其他带有撇号的时间戳,例如 '2020/11/14:10:14 :16 当然,最后一个元素有结束逆作为开始的例子']

有关如何删除这些的任何建议?如果我要进一步切片,时间戳需要是统一的长度。

4

1 回答 1

1

if you know all the erroneous characters already:

element = '["2020/11/13:02:16:43'
clean_element = element.replace('[', '').replace('"', '').replace("'", '').replace(']', '')

>> '2020/11/13:02:16:43'
于 2020-11-19T18:44:23.563 回答