正则表达式不起作用

Question

当正文如下时，我正在尝试从转发的电子邮件中获取和抄送该电子邮件：

$body = '-------
Begin forwarded message:


From: Sarah Johnson <blabla@gmail.com>

Subject: email subject

Date: February 22, 2013 3:48:12 AM

To: Email Recipient <thatwouldbe@yayyy.com>

Cc: Ralph Johnson <johnson@gmail.com>


Hi,


hello, thank you and goodbye!

 blabla@gmail.com'

现在，当我执行以下操作时：

$body = strtolower($body);
$pattern = '#from: \D*\S([\w-\.]+)@((?:[\w]+\.)+)([a-zA-Z]{2,4})\S#';
if (preg_match($pattern, $body, $arr_matches)) {
     echo htmlentities($arr_matches[0]);
     die();
}

我正确地得到：

from: sarah johnson <blabla@gmail.com>

现在，为什么抄送不起作用？ 我做的事情很相似，只是从改为cc：

$body = strtolower($body);
$pattern = '#cc: \D*\S([\w-\.]+)@((?:[\w]+\.)+)([a-zA-Z]{2,4})\S#';
if (preg_match($pattern, $body, $arr_matches)) {
     echo htmlentities($arr_matches[0]);
     die();
}

我得到：

cc: ralph johnson <johnson@gmail.com> hi, hello, thank you and goodbye! blabla@gmail.com

如果我从原始页脚中删除了电子邮件（删除blabla@gmail.com），那么我正确地得到了：

cc: ralph johnson <johnson@gmail.com>

电子邮件似乎正在影响正则表达式。 但是，它如何以及为什么不从头开始影响它呢？ 我怎样才能解决这个问题？

Answer 1

问题是\\D*匹配太多，即它也匹配换行符。 我在这里会更加严格。 为什么要完全使用\\D （而不是数字）？

使用例如[^@]*可以正常工作

cc: [^@]*\S([\w-\.]+)@((?:[\w]+\.)+)([a-zA-Z]{2,4})\S

在Regexr上看到它。

这样，您可以确保第一部分与电子邮件地址不匹配。

\\D也是原因，它适用于第一个“发件人”案例。 “日期”行中有数字，因此在该行中不匹配。

Answer 2

这样尝试

$body = '-------
Begin forwarded message:


From: Sarah Johnson <blabla@gmail.com>

Subject: email subject

Date: February 22, 2013 3:48:12 AM

To: Email Recipient <thatwouldbe@yayyy.com>

Cc: Ralph Johnson <johnson@gmail.com>


Hi,


hello, thank you and goodbye!

 blabla@gmail.com';

$pattern = '#(?:from|Cc):\s+[^<>]+<([^@]+@[^>\s]+)>#is';
preg_match_all($pattern, $body, $arr_matches);
echo '<pre>' . htmlspecialchars(print_r($arr_matches, 1)) . '</pre>';

产量

Array
(
    [0] => Array
        (
            [0] => From: Sarah Johnson <blabla@gmail.com>
            [1] => Cc: Ralph Johnson <johnson@gmail.com>
        )

    [1] => Array
        (
            [0] => blabla@gmail.com
            [1] => johnson@gmail.com
        )

)

$arr_matches[1][0] - "From" email
$arr_matches[1][1] - "Cc" email

正则表达式不起作用

问题描述

2 个解决方案

解决方案1
3 已采纳 2013-02-26 18:58:47

解决方案2
1 2013-02-26 19:21:25

正则表达式不起作用

问题描述

2 个解决方案

解决方案1 3 已采纳 2013-02-26 18:58:47

解决方案2 1 2013-02-26 19:21:25

解决方案1
3 已采纳 2013-02-26 18:58:47

解决方案2
1 2013-02-26 19:21:25