问题标签 [difflib]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 比较两个 HTML 文件并返回两者之间不同的 HTML 标签
我正在使用 python 编写一个 web 监控脚本,它将查看页面的存档版本,将其与当前的在线版本进行比较,并在有任何更改时通知我。我有这项工作的基础知识,但是在 Web 表单中具有动态属性的网站遇到了问题。页面一般没有变化,但表单中的隐藏属性发生了变化,这会触发通知。
在两个 HTML 文件上使用 python 的 diflib diff = difflib.unified_diff(content1, content2)
,我能够得到下面的截断输出。
我想“阅读”这个输出,并返回不具有相同值的 HTML 属性,在这种情况下value='927eea55b8e87e961314033fce84de4a1418504077'
,并且value='1ccb910cbb9dc0d6f6dd5ed99212df741418800872'
我该怎么做呢?
python - difflib.SequenceMatcher 不返回唯一比率
我正在尝试比较 2 个街道网络,当我运行此代码时,它返回 0.253529 的比率...我需要它来比较每一行以获得唯一值,以便我可以查询不匹配的街道。我该怎么做才能让它返回每行唯一的比率值?
# 执行CalculateField arcpy.CalculateField_management(inFeatures, fieldName, expression, "PYTHON_9.3")
python - difflib 输出很奇怪,在每个字符上添加了额外的空格
我在 Python 中使用 difflib,但在让输出看起来不错时遇到了一些困难。出于某种奇怪的原因,difflib 在每个字符之前添加了一个空格。例如,我有一个如下所示的文件 (textfile01.txt):
测试没有意义的文本
和 textfile02.txt
测试没有意义的文本
但看起来不错
这是我尝试完成比较的一个小代码示例:
然后,我得到这个丑陋的输出,看起来……很奇怪:
testtextwhichhasnomea nin g-
- b- u- t- - l- o- o- k- s- - n- i- c- e
如您所见,输出看起来很糟糕。我一直在关注我在网上找到的基本 difflib 教程,根据这些教程,输出应该看起来完全不同。我不知道我做错了什么。有任何想法吗?
python - python中difflib.get_close_matches示例中cutoff参数的用途是什么?
在difflib.get_close_matches(word, possibilities[, n][, cutoff])
,cutoff
这里有什么用。它如何影响单词匹配?
python - Python difflib 报告不需要的差异
我正在尝试使用 比较两个序列difflib.Differ()
。但是,我观察到一些我无法理解的不必要的差异。有人可以解释这种行为以及如何解决吗?
输出:
为什么在?
这里报告差异?我希望只报告前两个差异(仅限更改)。
python - 如何使用 difflib.SequenceMatcher 获得多个匹配项?
我正在使用 difflib 来识别较长序列中短字符串的所有匹配项。然而,当有多个匹配时,difflib 似乎只返回一个:
我期望的输出是:
事实上,字符串 ACTGACT 包含两个匹配的 ACT,分别位于位置 0 和 4,大小均为 3(加上字符串末尾的另一个大小为 0 的匹配)。
如何获得多个匹配项?我期待 difflib 返回两个位置。
python - 以编程方式确定翻译后的名称是否等效
我正在尝试查看两个翻译后的名称是否相同。有时翻译的名称排序会有所不同。例如:
“欧玉成”和“欧玉成”是同一个人。有没有办法检测到这样的事情,这样这样的ratio
名字会更高?类似于以下结果:
python - 表示文本中后续更改并使用 Python 处理此表示的标准方法是什么?
假设我有一些文本(例如作为字符串给出)。稍后我要“编辑”这个文本,这意味着我想在某处添加一些东西或删除一些东西。这样我会得到另一个版本的文本。但是,我不想让两个字符串代表文本的每个版本,因为两个后续版本之间有很多“重复”(相似性)。换句话说,字符串之间的差异很小,因此仅保存它们之间的差异更有意义。例如,第一个版本。
第二个版本:
我想将这两个版本保存为一个对象(不一定是XML,我只是作为一个例子):
现在我想更进一步。我想将所有后续编辑保存为一个对象。换句话说,我将拥有两个以上版本的文本,但我想将它们保存为一个对象,以便轻松获取给定版本的文本并轻松找出两者之间的区别两个后续(或任何两个给定)版本。
所以,总而言之,我的问题是:表示文本变化并使用 Python 处理这种表示的标准方法是什么。
python - Trying to compare files opened using 'with open...' in Python 2.4 gives a SyntaxError
How can I compare two files in Python 2.4.4? The files could be different lengths.
We have Python 2.4.4 on our servers. I would like to use the difflib.unified_diff()
function but I can't find examples that work with Python 2.4.4.
All the versions that I have seen on Stack Overflow contain the following:
The problem that I have is within version 2.4.4 the with open ...
generates a SyntaxError. I would like to stay away from using the system call to diff or sdiff is possible.
python - 在文件中查找最相似的行
该程序的目的是收集计算机上所有程序的列表,并根据用户输入找到正确的路径。因此,如果输入是Audition
程序将返回
C:\Adobe\Audition CC 2014\Audition CC 2014.exe
。
我需要它在 txt 文件中搜索与用户输入的任何内容最相似的行。我的代码如下:
但是,这会为文件中的每一行打印一个空白括号“[]”,而不仅仅是给我我需要的那个。
我知道这是因为我告诉它对每一行都这样做,但我不知道如何解决这个问题。