[英]HtmlUnit webscraping Anchor tag with dropdown link that has JavaScript
当您将鼠标悬停在初始链接上时,当该链接具有链接下拉列表时,是否可以使用 HtmlUnit 单击该链接。 如果您单击初始链接,除了鼠标悬停时会下拉的链接列表之外,什么都不会发生。 我想单击下拉链接之一并抓取与该链接关联的网页。
问题似乎是 Anchor 有 JavaScript,而且它是一个下拉列表。 如果 Anchor 没有 JavaScript 并下拉,那么我不会有任何问题。
这是相关的 JavaScript 代码:
<script language='JavaScript' type='text/javascript'>
<!--
function mmLoadMenus(){
window.mm_menu_0805151542_0 = new Menu("root",211,23,"Arial, Helvetica, sans-serif",11,"#FFFFFF","#FFFFFF","#056CB9","#014D98","left","middle",3,0,1000,-5,7,true,false,true,2,true,false);
mm_menu_0805151542_0.addMenuItem("View Tax Sales","window.open('TCTaxSaleBrief.asp', '_blank','width=800,height=580,scrollbars=1,resizable=yes,top=50,left=100');");
mm_menu_0805151542_0.addMenuItem("Registration Renewal Reprint","window.open('vrRenewal.asp', '_blank','width=800,height=580,scrollbars=1,resizable=yes,top=50,left=100');");
mm_menu_0805151542_0.addMenuItem("Drivers License","window.open('http://www.dds.ga.gov/', '_blank');");
mm_menu_0805151542_0.addMenuItem("Online Tag Renewals","location='../TaxCommissioner/TagRenewal.html'");
mm_menu_0805151542_0.hideOnMouseOut=true;
mm_menu_0805151542_0.bgColor='#CCCCCC';
mm_menu_0805151542_0.menuBorder=0;
mm_menu_0805151542_0.menuLiteBgColor='#FFFFFF';
mm_menu_0805151542_0.menuBorderBgColor='#015BA7';
</script>
这是相关的锚点:
<a href="#" name="link11" class="nav" id="link10" onmouseover="MM_showMenu(window.mm_menu_0805151542_0,104,0,null,'link11')" onmouseout="MM_startTimeout();">Online Services</a><br />
这是我用来完成这项工作的 Java 代码片段。
WebClient webClient = new WebClient(BrowserVersion.FIREFOX_10);
String webPage="http://website.html";
try {
HtmlPage taxComPage = webClient.getPage(webPage);
HtmlElement htmlElement = taxComPage.getDocumentElement();
//HtmlAnchor anchor = taxComPage.getAnchorByText("View Tax Sales");
//HtmlAnchor htmlAnchor = taxComPage.getHtmlElementById("link10");
HtmlAnchor anchor = taxComPage.getAnchorByText("Online Services");
HtmlPage page = anchor.click();
}catch
如果 HtmlUnit 不适用于 JavaScript,请告诉我!
谢谢
我知道有一个名为:mmLoadMenus() 的函数,它具有鼠标悬停时显示的文本,但我对此函数与锚点的关联有疑问。 在锚点中有一个叫做 MM_showMenu 的东西。 创建它的 MM_showMenu 是什么,这是一个 JavaScript 关键字,我没有看到它在任何地方被定义。 我已经搜索了整个页面,唯一提到的地方是在锚点中。 它似乎是某种类型的函数,其参数为:window.mm_menu_0805151542_0,104,0,null,'link11' 被传递给它。 我可以在函数 mmLoadMenus() 和锚点之间建立的唯一联系是锚点中包含 mm_menu_0805151542_0。 我不太精通 JavaScript 也许这就是为什么我没有与 JavaScript 函数和锚点建立牢固的联系。
数据已经在页面上,所以为什么不从 JavaScript 函数本身抓取它。 只是解析文本的问题 - 比试图强制加载要容易得多。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.