繁体   English   中英

我可以使用java HtmlUnit库从linkedIn中提取信息吗?

[英]Can I extract information from linkedIn using java HtmlUnit library?

我试图找到一种方法从我的LinkedIn帐户中提取数据而不使用REST API但任何结果:/任何人都知道它是否可能以及如何? 当我在Eclipse中尝试此代码时,结果是NullPointerException或当我从响应html页面中选择一些字段时为null。 请注意,选择器路径在浏览器的控制台中运行良好。 非常感谢你。

String url = "https://www.linkedin.com/uas/login?goback=&trk=hb_signin";
final WebClient webClient = new WebClient();
webClient.getOptions().setJavaScriptEnabled(false);
webClient.getOptions().setCssEnabled(false);
HtmlPage loginPage = webClient.getPage(url); 
final HtmlForm loginForm = loginPage.getFormByName("login");
final HtmlSubmitInput button = loginForm.getInputByName("signin");
final HtmlTextInput usernameTextField = 
loginForm.getInputByName("session_key");
final HtmlPasswordInput passwordTextField = 
loginForm.getInputByName("session_password");
usernameTextField.setValueAttribute("something@outlook.com");
passwordTextField.setValueAttribute("**************");
final HtmlPage response = button.click();
loginPage=webClient.getPage("https://www.linkedin.com/in/issa-hammoud-
0a2802114/");
System.out.println(loginPage.querySelector("#profile-wrapper > div.pv-
content.profile-view-grid.neptune-grid.two-column.ghost-animate-in > 
div.core-rail > section div > div > button > img");

由于您正在建立安全连接(HTTPS),因此需要指定getOptions().setUseInsecureSSL(true);

还要确保启用cookie getCookieManager().setCookiesEnabled(true);

说过你应该真的使用Linkedin的REST API。

希望有所帮助

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM