我想使用 PHP 腳本創建一個爬蟲

Question

我想為網站創建一個 PHP 腳本。 我只想從那個鏈接中找出鏈接。 例如，我有http://example.com鏈接，我的爬蟲應該在后台打開該鏈接並找到所有與http://example.com/[any name]/reviews 匹配的鏈接。 我試過正則表達式但不起作用，有人可以幫助我。

<?php
$url="https://clutch.co/it-services";
$contents =file_get_contents($url);
$pattern = "https://clutch.co/profile/".'/^[a-zA-Z ]*$/'."#review";
$pattern = preg_quote($pattern, '/');
if(preg_match_all($pattern, $contents, $matches)){
   echo "Found matches:\n";
   foreach ($matches[0] as $urls) {
    echo $urls;
  }
}
else{
   echo "No matches found";
}
?>

Answer 1

正則表達式模式有一些語法問題：

分隔符/需要在模式之外，並且該模式（“https://”）內的分隔符和特殊字符（ . ）需要被轉義（“https:\\/\\/”）

所以模式應該是：

/https:\/\/clutch\.co\/profile\/[a-zA-Z ]*#review/

正則表達式小提琴： https : //regex101.com/r/OEUQOU/1

我想使用 PHP 腳本創建一個爬蟲

問題描述

1 個解決方案

解決方案1
0 已采納 2019-04-09 06:20:05

我想使用 PHP 腳本創建一個爬蟲

問題描述

1 個解決方案

解決方案1 0 已采納 2019-04-09 06:20:05

解決方案1
0 已采納 2019-04-09 06:20:05