3

你能告诉我为什么 uproot 不解释树:Evt、AAObject、TObject 和 t?我可能在这里做错了什么,因为我不熟悉根文件。

我的目标:将根文件中的数据打开到 pandas DataFrame 中。

当我尝试遍历 ['Evt'] 树中的数据时,我收到以下分支 AAObject、TObject 和 t 的以下错误

ValueError: cannot interpret branch b'AAObject' as a Python type
in file: /myfile.root


ValueError: cannot interpret branch b't' as a Python type
in file: /myfile.root

ValueError: cannot interpret branch b'TObject' as a Python type
in file: /myfile.root

这是我键入以探索我的文件的内容

data = uproot.open("myfile.root")["E"]
data.show() 
data_branch_Evt['Evt']['AAObject'].basket(0)
data_branch_Evt['t'].basket(0)`

这是 data.show() 的结果

Evt                        TStreamerInfo              None
AAObject                   TStreamerInfo              None
TObject                    TStreamerInfo              None
fUniqueID                  TStreamerBasicType         asdtype('>u4')
fBits                      TStreamerBasicType         asdtype('>u4')

usr                        TStreamerSTL  asjagged(asdtype('>f8'), 10)
usr_names                  TStreamerSTL asgenobj(STLVector(STLString()))

id                         TStreamerBasicType         asdtype('>i4')
det_id                     TStreamerBasicType         asdtype('>i4')
mc_id                      TStreamerBasicType         asdtype('>i4')
run_id                     TStreamerBasicType         asdtype('>i4')
mc_run_id                  TStreamerBasicType         asdtype('>i4')
frame_index                TStreamerBasicType         asdtype('>i4')
trigger_mask               TStreamerBasicType         asdtype('>u8')
trigger_counter            TStreamerBasicType         asdtype('>u8')
overlays                   TStreamerBasicType         asdtype('>u4')
t                          TStreamerObjectAny         None
t.fSec                     TStreamerBasicType         asdtype('>i4')
t.fNanoSec                 TStreamerBasicType         asdtype('>i4')

hits                       TStreamerSTL               asdtype('>i4')

....等等...`

谢谢!

4

1 回答 1

1

并不是所有的 ROOT 类型都被识别——类的定义中有一些东西还没有被处理。没有看到文件(作为 GitHub 问题),我无法诊断它。我们从一组非常少的类型开始,并根据需要添加更多类型。

这不是逐个类处理每个类的问题,而是关于处理类特性的问题。例如,最近添加的是包含数字向量的类。如果您有内容非常保守的类,例如“只有数字字段”,那么它应该被自动识别。

作为个案项目,我们必须处理的不是类型(例如类),而是技术上的“种类”或类型的类型。

于 2019-10-31T22:54:10.400 回答