我需要对 html 字符串进行排序,以便获得所需的内容。现在我需要遍历具有 ID 的表中的表行。如何使用正则表达式执行此操作?
问问题
1359 次
4 回答
1
正则表达式不能用于解析 HTML;HTML 不规则。使用适当的 HTML 解析器库。
于 2010-01-18T09:55:33.000 回答
1
这取决于 HTML 文本的规则性。例如,给定这张表:
<table>
<tr><td>1</td><td>Apple</td></tr>
<tr><td>2</td><td>Ball</td></tr>
<tr><td>3</td><td>Cookie</td></tr>
<table>
以下正则表达式在第一列中查找 ID:
(?<=<tr><td>).*?(?=</td>)
于 2010-01-18T10:06:42.773 回答
0
如果您通过像 BeautifulSoup 这样的 html 解析器运行页面,那么您可以美化它,以便这种正则表达式有机会。但是,如果您仍然在解析 html...
于 2010-01-18T13:19:35.760 回答
0
试试这个
Dim HTML As String = contentText
Dim options As RegexOptions = RegexOptions.IgnoreCase Or RegexOptions.Singleline
Dim regex As Regex = New Regex("<table[^>]*>(.*)</table>", options)
Dim match As MatchCollection = regex.Matches(HTML)
Dim sb As StringBuilder = New StringBuilder
For Each items As Match In match
sb.Append(items.ToString & vbLf)
Next
TextBox.Text = sb.ToString
于 2012-05-24T11:11:28.093 回答