![](/img/trans.png)
[英]How can I extract text content only from root element - java, com.gargoylesoftware.htmlunit.html
[英]Can I extract information from linkedIn using java HtmlUnit library?
我試圖找到一種方法從我的LinkedIn帳戶中提取數據而不使用REST API但任何結果:/任何人都知道它是否可能以及如何? 當我在Eclipse中嘗試此代碼時,結果是NullPointerException或當我從響應html頁面中選擇一些字段時為null。 請注意,選擇器路徑在瀏覽器的控制台中運行良好。 非常感謝你。
String url = "https://www.linkedin.com/uas/login?goback=&trk=hb_signin";
final WebClient webClient = new WebClient();
webClient.getOptions().setJavaScriptEnabled(false);
webClient.getOptions().setCssEnabled(false);
HtmlPage loginPage = webClient.getPage(url);
final HtmlForm loginForm = loginPage.getFormByName("login");
final HtmlSubmitInput button = loginForm.getInputByName("signin");
final HtmlTextInput usernameTextField =
loginForm.getInputByName("session_key");
final HtmlPasswordInput passwordTextField =
loginForm.getInputByName("session_password");
usernameTextField.setValueAttribute("something@outlook.com");
passwordTextField.setValueAttribute("**************");
final HtmlPage response = button.click();
loginPage=webClient.getPage("https://www.linkedin.com/in/issa-hammoud-
0a2802114/");
System.out.println(loginPage.querySelector("#profile-wrapper > div.pv-
content.profile-view-grid.neptune-grid.two-column.ghost-animate-in >
div.core-rail > section div > div > button > img");
由於您正在建立安全連接(HTTPS),因此需要指定getOptions().setUseInsecureSSL(true);
還要確保啟用cookie getCookieManager().setCookiesEnabled(true);
說過你應該真的使用Linkedin的REST API。
希望有所幫助
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.