问题标签 [difflib]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
65 浏览

python - 从列表 A 中减去列表 B,但保留列表 A 索引并使用 difflib 字符串相似性

我需要一些关于 Python 的帮助。这不是从列表 A 中减去列表 B 来制作列表 C 的经典方法。相反,我想查看列表 A 中不在列表 B 中的项目的索引(单个单词中的城市名称),并将它们存储到一个新的列表 C。另外,列表 B 中的匹配项与列表 A 中的不完全相同,它们来自 OCR,所以它们拼写错误很少,如果它们 90% 相似,我想考虑匹配。

例如

列表 A:#所有列表项都是一个单词中的城市名称

列表 B:#citynames 拼写错误

所以,结果应该是...

清单 C:

结果项目并不重要(Corneria、Blue_Mars、Setiro、Jeti_lo),相反,一旦进行减法,我需要保留列表 A 中项目的原始索引。

到目前为止,我正在这样做......

输出...

但是我需要实现 difflib 部分以匹配具有 90% 相似性的项目,我怎么能只使用纯 python 脚本来做到这一点,(最好只使用 difflib)???

0 投票
1 回答
1289 浏览

python - 无法在 python 中导入 Difflib。我该如何解决?

我正在尝试使用 difflib,但它给出了导入错误。有人可以帮忙吗?这是回溯:

0 投票
3 回答
3155 浏览

python - 查找两个字符串列表的差异

我试图在两个字符串列表之间找到一个差异(最长的公共子序列)。我猜difflib这里可能有用,但用,等difflib.ndiff注释输出。例如-+

标记化和删除输出中的字母代码是否正确?这是区分列表的正确 Pythonic 方式吗?

0 投票
3 回答
4959 浏览

python - 如何使用 Python 的 difflib 生成类似于 Unix sdiff 命令的两个文件的并排比较?

我正在使用 Python 2.6,我想创建一个简单的 GUI,其中有两个并排的文本窗格比较两个文本文件 (file1.txt & file2.txt)。

我正在使用difflib,但我不清楚如何产生类似于sdiff Unix 命令的结果。

为了重现并排比较,我需要difflib返回两个变量file1_difffile2_diff例如。

我也考虑过直接使用sdiff输出并解析它以分隔窗格,但结果并不像看起来那么容易......有什么提示吗?

0 投票
1 回答
3483 浏览

python - 使用 difflib 查找两个字符串变量之间最接近的匹配项

))大家好,我想使用 difflib 找到两个字符串变量之间最接近的匹配,这是我的情况......

我想 difflib 在 VarA 和 VarB 变量中找到最接近的匹配项(它们只是变量,而不是列表),如果我varC在搜索中添加第三个变量怎么办???我怎样才能让 difflib 找到一个最接近的匹配项。

目前我正在尝试这个......

我是这样弄的...

现在我这样做...

感谢进阶。

0 投票
1 回答
1437 浏览

python - Using difflib SequenceMatcher ratio to merge in Pandas

I'm trying to figure out if there's a way to do fuzzy merges of string in Pandas based on the difflib SequenceMatcher ration. Basically, I have two dataframes that look like this:

And I want to merge like this:

There are a few posts that are close to what I'm looking for, but none of them work with what I want to do. Any suggestions on how to do this kind of fuzzy merge using difflib?

0 投票
1 回答
1159 浏览

python - python中的“diff -u -B -w”?

使用 Python,我想将两个字符串之间的差异输出为统一的差异 (-u),同时可以选择忽略空行 (-B) 和空格 (-w)。

由于字符串是在内部生成的,我不想处理将一个或两个字符串写入文件、运行 GNU diff、修复输出和最后清理的细微复杂性。

虽然difflib.unified_diff生成统一的差异,但它似乎并没有让我调整空格和空行的处理方式。我查看了它的实现,我怀疑唯一的解决方案是复制/破解该函数的主体。

有更好的吗?

目前,我正在使用以下内容剥离填充字符:

当然,这会导致输出与原始输入不同的东西的差异。例如,将上面的文本传递给 GNU diff 3.3 作为“diff -u -w”运行,“line 3”显示为上下文的一部分,上面将显示“line3”。

0 投票
1 回答
167 浏览

python - 从两个文件python中获取删除的行

我有两个文件,我在获取新行时没有任何问题,new filenew_fileold_file. 我得到所有的线。我怎样才能得到删除的线?

0 投票
2 回答
364 浏览

python - 从两个字符串中获取后缀/前缀更正以在 python 中将源字符串转换为目标字符串

我需要将源字符串转换为目标字符串,并表达与对源字符串的操作 (D,A,TYPE) 即(删除、添加、PREFIX\SUFFIX)相同的操作,这将在应用这些操作时将其转换为目标字符串源字符串的后缀,或源字符串的前缀

例如:

以下代码确实获得了后缀,但也获得了所有其他匹配项,但我只需要后缀,除此之外它不会按照我的要求输出正确的格式。

此外,如果没有足够的后缀/前缀匹配,我也不需要输出任何更正,例如:字符串足够,超出不应该产生匹配,这可能来自:

0 投票
1 回答
2127 浏览

python - 在python中使用difflib比较两个文件

我正在尝试使用 difflib 比较两个文件。比较后,如果没有检测到差异,我想打印“No Changes”。如果它们在某些方面有所不同。我想打印那些行。

我试过这样:

如果检测到“没有更改”,它将打印文件的内容。但如果没有区别,我想打印“No Changes”。