我正在寻找一种机制来检测给定字符串的最小和唯一左右字符串。考虑以下文本:
<button id="allow" type="submit" class="button-big" name="allow" value="93db44648ab3607b10e600eaf796c794" tabindex="4">
我需要获得价值的价值。因此,如果我决定选择substring
,我将使用name="allow" value="
左字符串和"
右字符串(基于整个 html 数据的唯一性)以及它们的相对索引。但是我正在使用的工具是检测唯一但足够小的左字符串是w" value="
.
我的问题是如何找到这个?由于我没有工具的来源,我无法检测到它。
请不要向我推荐 C# 中的 HAP 或任何 html 库,因为上面的 html 代码只是一个易于理解的示例。我有其他类型的数据。
任何 C# 或 java 片段都会很好。
编辑:我正在处理的数据是非 html、非标准但团队描述的东西。而且由于其性质,它也需要用 Java 编码。因此我不能考虑 HtmlAgilityPack。
我想重视最少足够的字符串,而不是识别唯一模式的所有工作可能性。