[英]How can I extract text content only from root element - java, com.gargoylesoftware.htmlunit.html
[英]Can I extract information from linkedIn using java HtmlUnit library?
我试图找到一种方法从我的LinkedIn帐户中提取数据而不使用REST API但任何结果:/任何人都知道它是否可能以及如何? 当我在Eclipse中尝试此代码时,结果是NullPointerException或当我从响应html页面中选择一些字段时为null。 请注意,选择器路径在浏览器的控制台中运行良好。 非常感谢你。
String url = "https://www.linkedin.com/uas/login?goback=&trk=hb_signin";
final WebClient webClient = new WebClient();
webClient.getOptions().setJavaScriptEnabled(false);
webClient.getOptions().setCssEnabled(false);
HtmlPage loginPage = webClient.getPage(url);
final HtmlForm loginForm = loginPage.getFormByName("login");
final HtmlSubmitInput button = loginForm.getInputByName("signin");
final HtmlTextInput usernameTextField =
loginForm.getInputByName("session_key");
final HtmlPasswordInput passwordTextField =
loginForm.getInputByName("session_password");
usernameTextField.setValueAttribute("something@outlook.com");
passwordTextField.setValueAttribute("**************");
final HtmlPage response = button.click();
loginPage=webClient.getPage("https://www.linkedin.com/in/issa-hammoud-
0a2802114/");
System.out.println(loginPage.querySelector("#profile-wrapper > div.pv-
content.profile-view-grid.neptune-grid.two-column.ghost-animate-in >
div.core-rail > section div > div > button > img");
由于您正在建立安全连接(HTTPS),因此需要指定getOptions().setUseInsecureSSL(true);
还要确保启用cookie getCookieManager().setCookiesEnabled(true);
说过你应该真的使用Linkedin的REST API。
希望有所帮助
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.