0

我正在刮这个页面。我正在访问以下 HTML 以获取部分详细信息:

<h2>
    <span class="mw-headline" id="Volume_one:_Quicksilver_.282003.29">Volume one:
        <i>
            <a href="https://en.wikipedia.org/wiki/Quicksilver_(novel)"
                class="extiw"
                title="w:Quicksilver (novel)">Quicksilver</a>
        </i> (2003)
    </span>
    <span class="mw-editsection">
        <span class="mw-editsection-bracket">[</span>
        <a href="/w/index.php?title=The_Baroque_Cycle&amp;action=edit&amp;section=1"
            title="Edit section: Volume one: Quicksilver (2003)">edit</a>
        <span class="mw-editsection-bracket">]</span>
    </span>
</h2>

我想抓住id, Volume_one: Quicksilver .282003.29。为此,我编写了以下代码:

$sectionid = '#Volume_one:_Quicksilver_.282003.29';
print($crawler->filter( $sectionid ));

但尽管它在那里,但它并没有返回细节。我在哪里做错了?它确实可以#Epilogs很好地获取部分。

请帮忙。

4

1 回答 1

0

你有没有尝试过:

print( $crawler->filterXPath('//*[@id='Volume_one:_Quicksilver_.282003.29']') );

我在 FirFox 浏览器(安装了 FireBug)中使用“Inspect in FirePath”从该页面获取 xpath。

于 2017-04-23T22:14:48.397 回答