我正在尝试解析 html 页面Google play
并获取有关应用程序的一些信息。Simple-html-dom 工作完美,但如果页面包含没有空格的代码,它会完全忽略属性。例如,我有 html 代码:
<div class="doc-banner-icon"><img itemprop="image"src="https://lh5.ggpht.com/iRd4LyD13y5hdAkpGRSb0PWwFrfU8qfswGNY2wWYw9z9hcyYfhU9uVbmhJ1uqU7vbfw=w124"/></div>
如您所见,image
and之间没有任何空格src
,因此 simple-html-dom 忽略src
属性并仅返回<img itemprop="image">
. 如果我添加空间,它会完美运行。要获取此属性,我使用以下代码:
foreach($html->find('div.doc-banner-icon') as $e){
foreach($e->find('img') as $i){
$bannerIcon = $i->src;
}
}
我的问题是如何更改这个美丽的图书馆以获得完整的内部文本div
?