0

我试图使以下函数仅返回每个域 1 封电子邮件。

示例:如果我提供函数:

email1@domain.com email2@domain.com email1@domain.com email1@domain.com email3@test.co.uk

我希望它返回

email1@domain.com email3@test.co.uk

这是当前功能:

function remove_duplicates($str) {

  # match all email addresses using a regular expression and store them
  # in an array called $results
  preg_match_all("([\w-]+(?:\.[\w-]+)*@(?:[\w-]+\.)+[a-zA-Z]{2,7})",$str,$results);

  # sort the results alphabetically
  sort($results[0]);

  # remove duplicate results by comparing it to the previous value
  $prev="";
  while(list($key,$val)=each($results[0])) {
    if($val==$prev) unset($results[0][$key]);
    else $prev=$val;
  }

  # process the array and return the remaining email addresses
  $str = "";
  foreach ($results[0] as $value) {
     $str .= "<br />".$value;
  }

  return $str;
};

任何想法如何实现这一目标?

4

4 回答 4

2

这些方面的东西:

$emails = array('email1@domain.com', 'email2@domain.com', 'email1@domain.com', 'email1@domain.com', 'email3@test.co.uk');

$grouped = array();
foreach ($emails as $email) {
    preg_match('/(?<=@)[^@]+$/', $email, $match);
    $grouped[$match[0]] = $email;
}

var_dump($grouped);

这会保留域的最后一次出现,如果需要,不难修改以保留第一个。

于 2012-06-19T09:28:29.967 回答
1

您可以简单地使用该array_unique功能为您完成工作:

$emails = explode(' ', $emailString);
$emails = array_unique($emails);
于 2012-06-19T09:25:34.677 回答
0

我建议以下技巧/程序:

  1. 从一个字符串更改为地址数组。你这样做preg_match_all,其他人可能这样做explode,一切似乎都有效。所以你已经有了这个。
  2. 从地址中提取域。您可以使用正则表达式或其他东西再次执行此操作,我会说这很简单。
  3. 现在检查该域是否已被使用,如果没有,请选择该电子邮件地址。

最后一点可以通过使用数组和域作为键轻松完成。然后您可以使用isset它来查看它是否已在使用中。

编辑:由于 deceze 选择了类似的答案(他覆盖了每个域的匹配项),因此以下代码示例略有不同。由于您有字符串输入,我考虑逐步迭代它以节省临时地址数组并立即进行地址和域解析。为此,您需要处理由preg_match. 但是,实际上可以进行类似的操作preg_match_all,然后您将再次拥有该数组。

此代码将选择第一个并忽略每个域的其他地址:

$str = 'email1@domain.com email2@domain.com email1@domain.com email1@domain.com email3@test.co.uk';
$addresses = array();
$pattern = '/[\w-]+(?:\.[\w-]+)*@((?:[\w-]+\.)+[a-zA-Z]{2,7})/';
$offset = 0;
while (preg_match($pattern, $str, $matches, PREG_OFFSET_CAPTURE, $offset)) {
    list(list($address, $pos), list($domain)) = $matches;
    isset($addresses[$domain]) || $addresses[$domain] = $address;
    $offset = $pos + strlen($address);
}
于 2012-06-19T09:30:54.953 回答
0

这个概念prev是不可靠的,除非所有相同的主机名都在一个连续的序列中。如果您按主机名排序并提供排序功能,它会起作用,但这有点矫枉过正。

使用主机名构建一个数组,删除数组中已经存在主机名的条目。

于 2012-06-19T09:26:52.927 回答