1

我需要使用 VBA 从 HTML 中提取某些信息。

这是我试图单独提取位置信息的 HTML。

<dl id="headline" class="demographic-info adr">
<dt>Location</dt>
<dd>
<span class="locality">
      Dallas/Fort Worth Area
</span>
</dd>
<dt>Industry</dt>
    <dd class="industry">
           Higher Education
</dd>

在我的 excel VBA 中,打开网页后,我使用以下代码提取信息。

Dim openedpage as String
openedpage = iedoc1.getElementById("headline").innerText

但是,我得到的信息是,

位置达拉斯/沃斯堡地区工业高等教育

我只需要提取,

达拉斯/沃斯堡地区作为输出。

4

1 回答 1

3

尝试:iedoc1.getElementById("headline").getElementsByTagName("span")(0).innerText

你得到了所有额外的文本,因为这有点像你所要求的,父元素的 innerText ,它是它里面的所有东西。

上面的代码获取“headline”元素的内容,然后在其中找到所有“span”标签。查看返回的列表,它选择第一个实例并返回 innerText。

更新 我似乎总是弄错索引基数,1在我的例子中应该是0

于 2013-05-17T22:34:17.337 回答