簡體   English   中英

獲取最后一個重定向 URL 的函數(Redirects made with javascript)

[英]Function that gets the last redirection URL (Redirects made with javascript)

我知道你在想什么“有很多類似的問題”,但不,你錯了。

確實有很多問題尋求能夠獲取最后一個 URL 的 PHP 代碼,我已經根據這些問題和答案來制作我的代碼,但它並不適用於所有情況。

我需要一個始終返回最后一個 url 的函數(即使有 1000 次重定向),即使重定向是使用 JavaScript、PHP、Apache 或其他技術完成的。

我想說的是,我的代碼不會在所有情況下都返回最后一個,僅在某些情況下。 我已經閱讀了很多關於此的內容,但我還沒有找到解決方案,我遇到這個問題已經一個月了,需要您的幫助。

我的代碼如下:

function get_real_url($comparator, $url){
$out = "";
    $final_url = get_final_url($url);
    if(strpos($final_url, 'url=') !== FALSE){ //Si devuelve un string
        parse_str($final_url, $out);
        if(!empty($out["url"]))
            return $out["url"];
        else
            return false;
    }else
        return $final_url; //Si devuelve una url completa
}

function get_final_url($url, $timeout = 5)
{
    //$url = str_replace( "&", "&", urldecode(trim($url)) );
    $cookie = tempnam ("/tmp", "CURLCOOKIE");
    $ch = curl_init();
    curl_setopt( $ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3) Gecko/20041001 Firefox/0.10.1" );
    curl_setopt( $ch, CURLOPT_URL, $url );
    curl_setopt( $ch, CURLOPT_COOKIEJAR, $cookie );
    curl_setopt( $ch, CURLOPT_FOLLOWLOCATION, true );
    curl_setopt( $ch, CURLOPT_ENCODING, "" );
    curl_setopt( $ch, CURLOPT_RETURNTRANSFER, true );
    curl_setopt( $ch, CURLOPT_AUTOREFERER, true );
    curl_setopt( $ch, CURLOPT_CONNECTTIMEOUT, $timeout );
    curl_setopt( $ch, CURLOPT_TIMEOUT, $timeout );
    curl_setopt( $ch, CURLOPT_MAXREDIRS, 10 );
    $content = curl_exec( $ch );
    $response = curl_getinfo( $ch );
    curl_close ( $ch );
    if ($response['http_code'] == 301 || $response['http_code'] == 302)
    {
        ini_set("user_agent", "Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3) Gecko/20041001 Firefox/0.10.1");
        $headers = @get_headers($response['url']);
        if(!$headers) return $url;
        $location = "";
        foreach($headers as $value)
        {
            if (substr(strtolower($value), 0, 9) == "location:")
                return get_final_url( trim( substr( $value, 9, strlen($value) ) ) );
        }
    }
    if(preg_match("/window\.location\.replace\('(.*)'\)/i", $content, $value) || preg_match("/window\.location\=\"(.*)\"/i", $content, $value))
    {
        return get_final_url($value[1]);
    }
    else
    {
        return $response['url'];
    }
}

我應該使用什么技術,以便我的代碼執行(如有必要)javascript 重定向代碼並獲取最后一個 url?

如果您還想檢查基於瀏覽器的重定向,則不應使用 PHP。 如果您不僅要解析和評估直接嵌入標記中的 JS 代碼,還要解析和評估僅在運行某些 JS 后加載的基於模塊的代碼,這將變得非常棘手。

為什么不為此使用 Selenium 或無頭瀏覽器之類的東西?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM