我想从通过 url 加载的表中提取“名称”和“ID”。该表始终包含不同的值。一张表可能是这张:https ://www.lectio.dk/lectio/262/FindSkema.aspx?type=stamklasse 我想在它指向的链接中获取每个名称和 id。例如:名称:1m/id:4514546468(来自链接的 ID:https ://www.lectio.dk/lectio/262/SkemaNy.aspx?type=stamklasse&klasseid=4514546468 )
我如何过滤掉所有东西,但我需要的东西?我用 cURL 获取源代码并想过滤掉代码,所以我有我需要的东西。
我做了一个始终具有固定值的列表,但由于该表始终具有不同的值,我不能使用相同的代码:
<?php
$ch = curl_init("http://www.lectio.dk/lectio/login_list.aspx");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch, CURLOPT_AUTOREFERER, TRUE);
$output = curl_exec($ch); // do it!
curl_close($ch); // close handle
$expld = explode("<a", $output);
$list = array();
$remove = array("/", "d");
$removefrom = array("/", "'", ">", "<");
foreach($expld as $key){
$gymnr = substr($key, 15, 3);
$gymnr = str_replace($remove, "", $gymnr);
$gymname = substr($key, 54);
$gymname = str_replace($removefrom, "", $gymname);
$gymname = substr($gymname, 0, -40);
$prelist = array($gymname, $gymnr);
$gymlist[] = $prelist;
};
unset($gymlist[0]);
foreach($gymlist as $school){
echo "<li data-id='".$school[1]."'>".$school[0]."</li>";
}
?>
我想我可以使用正则表达式来过滤它,但我对此了解不够,我需要示例或解决方案。