有人知道他们是怎么做到的吗?我目前使用 OffLiberty.com 来解析 Mixcloud 链接以获取原始 MP3 URL,以便在自定义 HTML5 播放器中使用以实现 iOS 兼容性,我只是想知道是否有人知道他们的流程到底是如何工作的,所以我可以创建类似的东西可以这么说,这样我的最终用户就不必去外部站点获取他们想要发布的混音的 MP3 链接。真的只是一个想法,如果它不能完成,并不是非常重要,但它会是一个很好的接触:)
有人知道吗?
请注意,我反对内容抓取,您应该请求这些网站允许抓取他们的 MP3 URL。否则,如果我是他们,我会立即阻止您并广告 vitam æternam。
无论如何,您可以使用DOMDocument
.
例如 :
<?php
// just so you don't see parse errors
$internal_errors = libxml_use_internal_errors(true);
// initialize the document
$doc = new DomDocument();
// load a page
$doc->loadHTMLFile('http://www.mixcloud.com/LaidBackRadio/le-motel-on-the-road/');
// initialize XPATH for the document
$xpath = new DomXPath($doc);
// span with "data-preview-url" seems to contain MP3 url
// we request them inside a DomNodeList http://www.php.net/manual/en/class.domnodelist.php
$mp3 = $xpath->query('//span[@data-preview-url]');
foreach($mp3 as $m){
// we print the attribute value
echo $m->attributes->getNamedItem('data-preview-url')->nodeValue . '<br/>';
}
libxml_use_internal_errors($internal_errors);