0

我的目标是从 LAS 文件表中制作一个数据框。但是,由于时间格式(小时:分钟:秒:毫秒),它错误地读取它,最终错误地构造了数据帧。

Here is small piece from my actual LAS file table:

    ~A           TIME           GTDEPTH  GTPQH  GTTQ  GTTN  GTET   GTTVD  
       05:06:54.946.18-Jan-2020 3717.16 -999.25 79.03 1.00   0.00 2797.33
       05:06:55.146.18-Jan-2020 3717.16    0.00 79.03 1.00   0.20 2797.33
       05:06:55.346.18-Jan-2020 3717.16    0.00 79.03 1.00   0.40 2797.33
       05:06:55.546.18-Jan-2020 3717.16 6314.02 79.03 1.00   0.60 2797.33
       05:06:55.746.18-Jan-2020 3717.16 6311.82 79.03 1.00   0.80 2797.33

And here, the data frame constructed by python:
        GTDEPTH  GTPQH       GTTQ     GTTN     GTET  GTTVD  UNKNOWN:1  UNKNOWN:2  UNKNOWN:3
TIME
05:06:      NaN    NaN  -Jan-2020  3717.16  -999.25  79.03        1.0        0.0    2797.33
05:06:      NaN    NaN  -Jan-2020  3717.16     0.00  79.03        1.0        0.2    2797.33
05:06:      NaN    NaN  -Jan-2020  3717.16     0.00  79.03        1.0        0.4    2797.33
05:06:      NaN    NaN  -Jan-2020  3717.16  6314.02  79.03        1.0        0.6    2797.33
05:06:      NaN    NaN  -Jan-2020  3717.16  6311.82  79.03        1.0        0.8    2797.33

我的目标是让熊猫正确阅读“时间”栏。

这是我的代码:

from matplotlib import pyplot as plt
import pandas as pd
import lasio
from datetime import datetime

data = lasio.read('myfile.las')
df = data.df()
print(df.head())
4

1 回答 1

0

问题似乎是'。在时间和日期之间。从此 '。' 出现在您的时间序列中的第 12 个字符,这是一种方法。

from dateutil import parser
tx = '05:06:54.946.18-Jan-2020'
datevalue = parser.parse(f'{tx[:12]} {tx[13:]}')

例如,这会产生:

datetime.datetime(2020, 1, 18, 5, 6, 54, 946000)

您可以利用此技术将 Time 列转换为正确的 datetime 对象:

def cnvrtTime(tx):
    return parser.parse(f'{tx[:12]} {tx[13:]}')

df['Time'] = df.apply(lambda row: cnvrtTime(row.Time), axis=1)
于 2021-11-30T20:09:47.947 回答