我正在编写一个函数,它从它在 html 文件中找到的第一个图像标记中找出 src。按照此处此线程中的说明,我得到了一些似乎正在工作的东西:
preg_match_all('#<img[^>]*>#i', $content, $match);
foreach ($match as $value) {
$img = $value[0];
}
$stuff = simplexml_load_string($img);
$stuff = $stuff[src];
return $stuff;
但是在使用该函数几分钟后,它开始返回如下错误:
警告:simplexml_load_string() [0function.simplexml-load-string0]:实体:第 1 行:解析器错误:第 42 行的路径/到/脚本中标记 img 第 1 行中的数据过早结束。
和
警告:simplexml_load_string() [0function.simplexml-load-string0]: tp://feeds.feedburner.com/~f/ChicagobusinesscomBreakingNews?i=KiStN" border="0"> 在第 42 行的 path/to/script 中。
我对 PHP 有点陌生,但似乎我的正则表达式错误地分割了 HTML。我怎样才能使它更“密封”?