繁体   English   中英

StackOverflow样式A正则表达式中的Href自动链接

[英]StackOverflow Style A Href Auto Linking in Regex

我使用以下函数来搜索文本链接并将它们转换为超链接。 首先是正确的吗? 它似乎工作,但你知道一个(可能是格式错误的)网址会破坏这个功能吗?

我的问题是是否有可能得到这个以支持端口号,例如stackoverflow.com:80/index将不会被转换,因为端口不被视为URL的有效部分。

总而言之,我正在寻找Stackoverflow风格的网址识别,我认为这是Markdown的一个自定义添加。

  /**
   * Search for and create links from urls
   */
  static public function autoLink($text) {
    $pattern = "/(((http[s]?:\/\/)|(www\.))(([a-z][-a-z0-9]+\.)?[a-z][-a-z0-9]+\.[a-z]+(\.[a-z]{2,2})?)\/?[a-z0-9._\/~#&=;%+?-]+[a-z0-9\/#=?]{1,1})/is";
    $text = preg_replace($pattern, " <a href='$1'>$1</a>", $text);
    // fix URLs without protocols
    $text = preg_replace("/href='www/", "href='http://www", $text);

    return $text;
  } 

谢谢你的时间,

您还应该看看这个问题的答案: 如何模仿StackOverflow自动链接行为


我最终结合了我在堆栈溢出和与同事交谈时得到的答案。 以下代码是我们能想到的最好的代码。

/**
   * Search for and create links from urls
   */
  static public function autoLink($text) {
    $pattern = "/\b((?P<protocol>(https?)|(ftp)):\/\/)?(?P<domain>[-A-Z0-9\\.]+)[.][A-Z]{2,7}(([:])?([0-9]+)?)(?P<file>\/[-A-Z0-9+&@#\/%=~_|!:,\\.;]*)?(?P<parameters>\?[A-Z0-9+&@#\/%=~_|!:,\\.;]*)?/ise";
$text = preg_replace($pattern, "' <a href=\"'.htmlspecialchars('$0').'\">$0</a>'", $text);

    // fix URLs without protocols
    $text = preg_replace("#href='www#i", "href='http://www", $text);
    $text = preg_replace("#href=['\"](?!(https?|ftp)://)#i", "href='http://", $text);

    return $text;
  } 

您可能希望使用开源标记引擎,而不是编写自己的自动循环例程(本质上是自定义标记引擎的开头),因为它不太可能容易受到跨站点脚本攻击。 用于PHP的开源标记引擎的一个示例是PHP Markdown ,它具有自动链接URL的能力,并且基本上使用Stack Overflow中使用的相同Markdown语法。

一个注意事项:在将文本粘贴到属性或元素的内部文本之前,应始终使用htmlspecialchars()来转义HTML特殊字符。

$pattern = "/\b(?P<protocol>https?|ftp):\/\/(?P<domain>[-A-Z0-9.]+)(([:])?([0-9]+)?)(?P<file>\/[-A-Z0-9+&@#\/%=~_|!:,.;]*)?(?P<parameters>\?[A-Z0-9+&@#\/%=~_|!:,.;]*)?/i";

将匹配:

http://www.scroogle.org/index.html

http://www.scroogle.org:80/index.html?source=library

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM