0

我在 Jupyter 笔记本中运行 Python 2.7。我正在使用大型嵌套字典,有时打印出其中一个会很有帮助。

使用 pprint.pprint 是在屏幕上获取 dict 的可读版本的好方法。但是对于特别大的字典,这可能意味着打印一百万行,这会使笔记本崩溃(我认为我的浏览器无法处理它)。

在 bash 终端上,我习惯于将东西扔进 a| head中,但在 python 中似乎没有通用的方法。

我写了这个方法:

from pprint import pformat, pprint
def pprint_head(to_print,length=10)
    formatted=pformat(to_print).splitlines()
    pprint(formatted[:min(len(formatted),length)])

它有效,但我想知道

  1. 有更好/更规范/内置/'pythonic'的方法吗?
  2. 这些小问题可以改进吗?(按优先顺序):
    • 大物体的速度很慢。
    • 它对大对象使用大量内存。
    • 它被打印为字符串列表,因此它在开头有 [ 并在每行周围加上引号。

我还想知道是否有“Jupyter”解决方案(即告诉 Jupyter 只接受任何打印的前 x 行?)

4

1 回答 1

2

为了达到与外壳中的头管相同的结果,您可以轻松地在 Python 中设置输出过滤器,因为pprint只使用write其流的方法。它可能是:

class Head(object):
    def __init__(self, lines, fd=sys.stdout):
        self.lines = lines
        self.fd = fd
    def write(self, msg):
        if self.lines <= 0: return
        n = msg.count('\n')
        if n < self.lines:
            self.lines -= n
            return self.fd.write(msg)
        ix = 0
        while(self.lines > 0):
            iy = msg.find('\n', ix + 1)
            self.lines -= 1
            ix = iy
        return self.fd.write(msg[:ix])

然后,您可以使用它以这种方式仅打印对象的前 n 行:

def pprint_head(to_print,length=10):
    pprint(to_print, stream=Head(length))
于 2017-06-20T10:45:58.537 回答