0

我正在尝试使用 HTML 敏捷包解析 HTML 页面。我的问题是,我必须使用 HAP 解析和显示每个页面中的页面查看次数。假设我有 3 页。每个页面包含随机位置的 div 或 span 或 table 中的页面视图数。坦率地说,它没有任何固定的位置,很难找到包含页面浏览量的标签。

例如,

In Page 1
<!--Some content-->
<div>12 Page views</div>
<!--Some content-->

In Page 2
<!--Some content-->
<span>11 Page views</span>
<!--Some content-->

In Page 3
<!--Some content-->
<table><tr><td><!--Some content--></td></tr>
<tr><td>3 Page views only</td></tr></table>
<!--Some content-->

我需要从上面的标签中找到计数。格式可以是任何东西,

<no> Page views
<no> Page views Only
<no> Page view till now
etc...

有人可以建议一种解析内容的方法吗?

4

1 回答 1

0

我得到了解决这个问题的办法。它不是一个全球性的解决方案,但它现在对我有用。希望它可以帮助其他人。

int result = -1;
            var matches = Regex.Matches(
                HTMLText,
                @"(?:\S+\s)?\S*page views\S*(?:\s\S+)?",
                RegexOptions.IgnoreCase
            );

            foreach (Match m in matches)
            {
                string val = m.Value;
                int res=-1;
                if (Int32.TryParse(val, out res))
                {
                    result = res;
                    break;
                }
            }
于 2012-06-27T09:56:25.323 回答