[英]extract specific links from a website in php
我想從網站中提取特定鏈接。
鏈接如下所示:
/topic/Funny/G1pdeJm
鏈接始終相同-除了最后一個隨機字符。
我很難組合這些部分
(preg_match("/^http:\/\//i",$str) || is_file($str))
和
(preg_match("/Funny(.*)/", $str) || is_file($str))
第一個代碼提取每個鏈接,第二個代碼僅從/ topic / Funny / *部分提取鏈接。
不幸的是,我無法將它們組合在一起,我也想屏蔽這些標簽:
/topic/Funny/viral
/topic/Funny/time
/topic/Funny/top
/topic/Funny/top/week
/topic/Funny/top/month
/topic/Funny/top/year
/topic/Funny/top/all
有任何想法嗎?
謝謝Chim
您可以嘗試使用否定的前行“過濾掉”您不喜歡的網址:
.*\/Funny\/(?!viral|time|top\/week|top\/month|top\/year|top\/all|top(\n|$)).*
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.