我正在修复一个我想在 Github 上使用的损坏的库。
我已经在本地“修复”了这个问题。但我不认为这是一个非常干净的方法......
我正在通过互联网档案戳 WARC 库,特别是 arc.py 部分(https://github.com/internetarchive/warc/blob/master/warc/arc.py)。
由于编写了 lib,生成 ARC 文件的工具发生了一些变化,因此内置解析器失败,因为它不希望在文件中看到一些元数据。
我的本地修复如下所示:
if header.startswith("<arcmetadata"):
while not header.endswith("</arcmetadata>\n"):
header = self.fileobj.readline()
header = self.fileobj.readline()
header = self.fileobj.readline()
而且我不确定我是否readlines()
两次调用来删除接下来的两个空行(包含"/n"
是推进文件对象的最干净的方式。
这是好蟒蛇吗?或者,还有更好的方法?