我有一个文本文档,其中列出了带有主题和电子邮件地址的 url。我需要提取所有带有主题和电子邮件地址的 url,并将其全部放入 csv 文件中。我只需要知道如何使用正则表达式来做到这一点。目前我能够提取所有网址,但我需要与它们关联的电子邮件和主题。到目前为止,这是我正在使用的:
$file=file_get_contents('/data/urls.txt');
$pattern='([A-Za-z][A-Za-z0-9+.-]{1,120}:[A-Za-z0-9/](([A-Za-z0-9$_.+!*,;/?:@&~=-])|% [A-Fa-f0-9]{2}){1,333}(#([a-zA-Z0-9][a-zA-Z0-9$_.+!*,;/?:@&~=%-]{0,1000}))?)';
preg_match_all($pattern, $file, $matches);
$matches=array_unique($matches[0]);
print_r($matches);
文件结构:
主题:网址
电子邮件:someemail@email.com