[英]How to get price value with regular expressions
我正在嘗試為在線商店編寫一個爬蟲,現在我需要獲取網頁的價格值。 這是我的嘗試:
$match = "";
$isMatched = preg_match('|<div class="c-product__seller-price-pure js-price-value".*\$(.*)<|',$html,$match);
echo "<pre>";
print_r($match);
echo "</pre>";
基本上$html
保存網頁的源代碼,價格值存儲在文檔中,如下所示:
<div class="c-product__seller-price-pure js-price-value">10,699,000</div>
但是當我運行它時,我得到了這個結果:
Array
(
)
這意味着,我使用的正則表達式不正確:
|<div class="c-product__seller-price-pure js-price-value".*\\$(.*)<|
那么我怎樣才能用正則表達式正確地得到這個價格值呢?
您當前正在將 js-price-value" 之后的任何字符.*
與美元符號 `$ 匹配。但源 HTML 中沒有美元符號。
刪除$
符號並匹配標簽的開頭和結尾之間的任何內容。
最簡單的方法是使用 NOT 運算符^
來匹配任何不是<
符號的字符,像這樣([^<]+)
完整代碼見下:
$match = "";
$isMatched = preg_match('|c-product__seller-price-pure js-price-value">([^<]+)|', $html, $match);
echo "<pre>";
print_r($match);
echo "</pre>";
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.