0

我写了很多涉及 DataFrame 的测试(基于鼻子)。最终用户应该可以阅读这些测试。与纯文本表格表示相比,DataFrame 构造函数的阅读不太友好。

使用像 reStructured 这样的文本表示来构造/断言 DataFrame 怎么样?

=========== =========== ========= ========= ========================
id1         id2         net       nnet      desc
(int64)     (int64)     (float64) (float64) (object)
----------- ----------- --------- --------- ------------------------
1001        1002             10.0       0.0 Closed part of queue
1002                          0.0       3.0 Opened part of queue
=========== =========== ========= ========= ========================

(dtype) 行有助于强制列类型不会在断言上失败(可能是可选的)。

在编码这个 reST DataFrame 构造/断言功能之前,我需要社区反馈。我还考虑使用 ipython 笔记本作为测试用例。

当可读性很重要时,您首选的 DataFrame 表示形式是什么?

4

1 回答 1

1

从 reST 表构建是不可能的,但会很有趣。您可以使用 read_csv 读取表格。另请参见 read_clipboard 和 read_fwf(固定宽度)

In [22]: table = """\
   ....: id1         id2         net       nnet       desc
   ....: 1001        1002             10.0       0.0  Closed part of queue
   ....: 1002        NaN               0.0       3.0  Opened part of queue
   ....: """

In [23]: df = pandas.read_csv(StringIO(table), sep='[\s]{2,}')

In [24]: df
Out[24]: 
    id1   id2  net  nnet                  desc
0  1001  1002   10     0  Closed part of queue
1  1002   NaN    0     3  Opened part of queue
于 2012-09-14T11:27:40.347 回答