由于性能原因,我正在将 PHP 脚本解析为 C#。
这是我遇到问题的 PHP 源代码:
$dom = new DOMDocument;
$dom->loadHTML($message);
foreach ($dom->getElementsByTagName('a') as $node) {
if ($node->hasAttribute('href')) {
$link = $node->getAttribute('href');
if ((strpos($link, 'http://') === 0) || (strpos($link, 'https://') === 0)) {
$add_key = ((strpos($link, '{key}') !== false) || (strpos($link, '%7Bkey%7D') !== false));
$node->setAttribute('href', $url . 'index.php?route=ne/track/click&link=' . urlencode(base64_encode($link)) . '&uid={uid}&language=' . $data['language_code'] . ($add_key ? '&key={key}' : ''));
}
}
}
我遇到的问题是getElementByTagName
部分。
正如这里所说,我应该使用htmlagilitypack 吗?到目前为止,我的代码是这样的:
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(leMessage);
leMessage
是一个包含 HTML 的字符串。到目前为止,一切都很好。唯一的问题是 HtmlAgillityPack 中没有getElementsByTag
函数。在普通的 HtmlDocument (没有包)中,我不能使用字符串作为 html 页面,对吗?
那么有人知道我应该怎么做才能完成这项工作吗?我现在唯一能想到的就是在 Windows 窗体中制作一个 webbrowser 并将文档内容设置为leMessage
然后从那里解析它。但是个人我不喜欢那个解决方案...但是如果没有其他方法...