过去两个小时我一直在尝试解决这些问题,但似乎找不到任何解决方案。
我需要从HTML
文件中提取链接。有 100 多个链接,但其中只有 25 个是有效的。
有效链接放在里面
<td><a href=" (link) ">
首先,我遇到(并且仍然遇到)逐字字符串中的双引号问题。所以,我已经用“普通”字符串逐字替换了,所以我可以使用 \" for " 但问题是Regex
我写的这个不起作用
Match LinksTemp = Regex.Match(
htmlCode,
"<td><a href=\"(.*)\">",
RegexOptions.IgnoreCase);
正如我得到"<td><a href="http://www.google.com">
的输出而不是http://www.google.com
任何人都知道我该如何解决这个问题以及如何在逐字字符串中使用双引号(例如 @" <>"das"sa ")