0

例如,我的网站是 mysite.com。以下是本站的来源:

<html>
<head>
<title>site</title>
//here is many javascript and css codes
</head>
<body>
<div>
<table border="1">
<tr>
  <td><a href="somthing.html">Here is a text</td>
  <td><img src="image.gif" alt="this is image"/></td>
</tr>
</table>
</div>
</body>
</html>

如何使用 php 只获取没有所有标签的文本和图像(javascript 代码、链接、表格和其他)?我只想得到“这是一个文本”和“image.gif”。

4

1 回答 1

2

如果文件在 Internet 上,则使用 PHP cURL;如果file_get_contents()文件在本地计算机上,则可以使用该函数。

要摆脱额外的标签,您可以使用以下代码:

$contents - file_get_contents('file.html');
$contents = strip_tags( $contents, '<img>' ); //other than <img> you can specify more tags also

或者,您也可以使用 DOM 方法。

于 2012-07-23T12:31:03.340 回答