Web搜寻器遇到JavaScript

Question

我是网络爬虫的新手。 我正在尝试使用Java爬行网页，但是遇到问题。 我需要在href为JavaScript函数的“ HTML标记”中获取链接。 我不知道如何在javascript函数中获取链接。 这是html源和javascript源。

HTML

<a href='javascript:ShowPostGridUnique(205316,0);'>link</a>

JS ShowPostGridUnique

function ShowPostGridUnique(parentpostid, pageShow) {
    //alert(parentpostid);
    var divid;
    divid = 'divPostContent' + parentpostid;
    if (document.getElementById(divid).className == 'divGridShow') {
        document.getElementById(divid).className = 'divGridHide';
        document.getElementById(divid).innerHTML = '';
    }
    else {
        document.getElementById(divid).className = 'divGridShow';
        // call server side method
        PageMethods.divParentInnerHtml( parentpostid, pageShow, CallSuccessShowPost, CallFailedAlert, parentpostid);
        try {
            divid = 'TDtitle' + parentpostid;
            document.getElementById(divid).className = 'TDtitle';
            divid = 'TDPage' + parentpostid;
            document.getElementById(divid).className = 'TDtitle';
        }
        catch (err) {
            //Handle errors here
        }
    }
}

我如何获得href的链接？ 谢谢。

Answer 1

使用像Phantomjs这样的Headless浏览器。 http://phantomjs.org/
使用ghostdriver / selenium控制Phantomjs https://github.com/SeleniumHQ/selenium https://github.com/detro/ghostdriver

Web搜寻器遇到JavaScript

问题描述

1 个解决方案

解决方案1
0 2015-08-11 08:31:43

Web搜寻器遇到JavaScript

问题描述

1 个解决方案

解决方案1 0 2015-08-11 08:31:43

解决方案1
0 2015-08-11 08:31:43