我有一个 pandas DataFrame,它在其中一个字段中包含一个管道分隔的字符串。我已将其拆分为一个列表apply
并将其添加到 DataFrame 中。管道分隔字符串中值的数量和内容各不相同。
df = DataFrame([{'wibble': 'a', 'pipestring': 'aa|aaa|aaa'},
{'wibble': 'b', 'pipestring': 'bb|bbbb|bbb|bbbbbb'}])
df['pipelist'] = df['pipestring'].map(lambda x: x.split('|'))
我对 pandas 很陌生,所以对此可能完全错误,但我认为这可以通过具有多个索引级别的 DataFrame 更好地表示,这样我就可以利用 panda 的索引和其他(极好的)工具。但是我无法弄清楚如何做到这一点。任何关于我应该做什么的指示/建议都非常感谢。