我想使用正则表达式来识别 .pdf 文件名中的空格
到目前为止,我已经能够识别到文件的 src 链接,但它无法识别文件名中的空格。
<?php
echo "<h1>Reading content from ITM website!</h1>";
$ch = curl_init("http://domain.edu/index.php?option=com_content&view=article&id=58&Itemid=375&alias=lms");
$fp = fopen("example_homepage.txt", "w");
curl_setopt($ch, CURLOPT_FILE, $fp);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_exec($ch);
curl_close($ch);
$my_file="example_homepage.txt";
$handle = fopen($my_file, 'rb');
$data = fread($handle,filesize($my_file));
$contents = strstr(file_get_contents('example_homepage.txt'), 'More quick links');
$new_content = str_replace('<a href="', '<a href="http://www.domain.edu', $contents);
$regex = '@((https?://)?([-\w]+\.[-\w\.]+)+\w(:\d+)?(/([-\w/_\.\,]*(\?\S+)?)?)*)@';
$text = preg_replace($regex, '<a href="$1">$1</a>', $new_content);
//echo $new_content;
echo $text;
fclose($fp);
?>
电流输出:
http://www.domain.edu/academiccalendar/Notice for final practical.pdf" target="_blank">Title
在此“最终实用.pdf 的通知”中,不显示为 URL,而仅显示为文本。