- 我想从 url 获取第一个帖子内容到我的网站。这是我需要获取的网址:
http://www.vietvbb.vn/up/forumdisplay.php?f=15
所以我用萤火虫来做。我需要在这个 html 代码之间获取第一个帖子内容:
<td id="td_post_11229294" class="alt1" style="border-right: 0px solid #262626"><--content that i need--></td>
我这样做了:
$url = 'http://www.vietvbb.vn/up/showthread.php?t=65690'; $data = file_get_contents($url); preg_match('/<td class="alt1" id="td_post_(.*?)">\r\n(.*?)\r\n<\/td>/s', $data, $tc);echo '<pre>';print_r($tc);echo '</pre>';
但正如您所见,它不仅返回了我在 td 标签中真正需要的内容,它还为我提供了 td 标签中的第一个内容帖子和一个 id=postmenu_xxx 的 div 标签和一个 class=tborder 的 table 标签(这个 div 和 table,他们是我不需要的东西):
<div id="postmenu_11229294_menu" class="vbmenu_popup" style="display:none">.....</div> <table class="tborder" cellspacing="0" cellpadding="3" border="0" align="center" width="100%">....</table>
我只希望它在上面的 td 标记之间返回我的内容。那么,我该怎么办?