我需要一个正则表达式，它将从文本文档中提取URL

Question

我尝试提取的网址都是www.domain.com的格式。 我想用一个简单的正则表达式将它们从文本文档中拉出来。 它只需要匹配www.domain.com，而无需匹配其他网址变体。

与preg_match_all（）一起使用的最简单的正则表达式是什么？

Answer 1

/w{3}\.\w{2,}\.\w{3}/

这将匹配www. 任何带有两个以上字母的单词dot + 3个字母

匹配带连字符或大写字母的域：

/w{3}\.[\w\-]{2,}\.\w{3}/i

Answer 2

我不会用PHP做很多事情，但是regex就像这样：

w{3}.([a-zA-Z0-9\~\!\@\#\$\%\^\&amp;\*\(\)_\-\=\+\\\/\?\.\:\;\'\,]*)?

将返回以“ www。”开头的所有域名。 它将忽略标记的协议部分（例如http:// ）

Answer 3

preg_match_all('%((mailto\\:|(news|(ht|f)tp(s?))\\://){1}\\S+)%m', $subject, $result, PREG_PATTERN_ORDER);
for ($i = 0; $i < count($result[0]); $i++) {
    // $result[0][$i];
}

如果您想轻松提取部分URL，也可以使用我编写的类https://github.com/homer6/altumo/blob/master/source/php/String/Url.php 。 有关用法，请参阅同一目录中的单元测试。

如果您正在寻找一个好的程序来调整您的regex模式，我强烈建议regexbuddy 。

希望有帮助...

我需要一个正则表达式，它将从文本文档中提取URL

问题描述

3 个解决方案

解决方案1
2 已采纳 2011-11-29 05:33:37

解决方案2
1 2011-11-29 05:40:25

解决方案3
0 2011-11-29 05:32:37

我需要一个正则表达式，它将从文本文档中提取URL

问题描述

3 个解决方案

解决方案1 2 已采纳 2011-11-29 05:33:37

解决方案2 1 2011-11-29 05:40:25

解决方案3 0 2011-11-29 05:32:37

解决方案1
2 已采纳 2011-11-29 05:33:37

解决方案2
1 2011-11-29 05:40:25

解决方案3
0 2011-11-29 05:32:37