1

我有一个文本文件,其中包含这样的日志:

245     (click,view,view,check,view,view)         (22,1,5,6,7,15)

305     (view,run)       (5,6)

3051         (run,run)      (115,36)

它是制表符分隔的,第二列字段中的条目数等于第三列字段。

我发现使用 np.loadtxt 很难将它带入 python,因为它有一个分隔符、文本和括号(圆形)来分隔第二个字段和第三个字段。

期待有关我应该如何去做的建议?

4

1 回答 1

2

在加载到numpy之前,最好先用标准python以某种方式解析它?在不了解 numpy 需要如何对其进行格式化的情况下,下面是一个将其转换为数组数组的示例。

例如,您可以使用split().

Def MakeItAList(lineFromFile): list = split(lineFromFile, " ") list[1] = split(list[1][1:-1],",") list[2] = split(list[2][1 :-1],",")

它有点笨重,但它会转动245 (click,view,view,check,view,view) (22,1,5,6,7,15)。变成像[245, [click,view,view,check,view,view], [22,1,5,6,7,15]]数据结构一样更易于管理的东西。

于 2013-09-14T01:33:40.853 回答