3

我正在使用difflib.HtmlDiff该类,使用两组文本(来自网站的 HTML)调用该函数,但是当它制作表格时

html_diff = difflib.HtmlDiff()
print html_diff.make_table(previous_contents, fetch_url.page_contents)

然而,这似乎只是逐个字符比较(每个表行 1 个字符),我最终得到了一个 4.3MB txt 文件,用于两组只有 100k 的 html。

doc文件说,

Compares fromlines and tolines (lists of strings) and returns a string which is a 
complete HTML file containing a table showing line by line differences with 
inter-line and intra-line changes highlighted.

然而,情况似乎并非如此。

有什么建议么?

4

1 回答 1

6

您提供的是字符串,而不是字符串(行)列表。

假设 UNIX 或 Windows 行结束:

print html_diff.make_table(previous_contents.split('\n'),
                           fetch_url.page_contents.split('\n'))
于 2011-06-13T10:30:03.247 回答