-4

我有一个文本文件,其中包含类似一百万行的格式,格式如下:

{"_id":"0e1daf84-4e4d-11ea-9f43-ba9b7f2413e0","parameterId":"visib_mean_last10min","stationId":"06193","timeCreated":1581590344449633,"timeObserved":1577922600000000,"value":11100}

该文件没有标题。我希望能够将它作为一个数组来观察。

我试过这个:

df = pd.read_csv("2020-01_2.txt", delimiter = ",", header = None, names = ["_id", "parameterId", "stationId", "timeCreated", "timeObserved", "value"])

虽然这确实将文件排序为我想要的列和行,但它会绘制"_id":"0e1daf84-4e4d-11ea-9f43-ba9b7f2413e0"为我只想要的第一个条目"0e1daf84-4e4d-11ea-9f43-ba9b7f2413e0"

如何仅将每个“:”之后的值绘制到数组中?

4

1 回答 1

0

正如@mousetail 所说,这看起来像是某种 json 文件。您可能需要执行以下操作:

import json
mylist = []
with open("2020-01_2.txt") as f:
          for line_no, line in enumerate(f):
              mylist.append([])
              mydict = json.loads(line)
              for k in mydict:
                  mylist[line_no].append(mydict[k])
              mydict= {}

它将输出一个列表列表,每个列表对应一个文件行。祝你好运!

于 2020-09-06T00:00:25.430 回答