Java-如何使用Jsoup提取Google新聞標題和鏈接？

Question

我對使用jsoup和html很陌生。 我想知道如何從Google新聞首頁上的故事中提取標題和鏈接（如果可能）。 這是我的代碼：

    org.jsoup.nodes.Document doc = null;
                try {
                    doc = (org.jsoup.nodes.Document) Jsoup.connect("https://news.google.com/").get();
                } catch (IOException e1) {
                    // TODO Auto-generated catch block
                    e1.printStackTrace();
                }
                Elements titles = doc.select("titletext");

                System.out.println("Titles: " + titles.text());


                //non existent
                for (org.jsoup.nodes.Element e: titles) {
                    System.out.println("Title: " + e.text());
                    System.out.println("Link: " + e.attr("href"));
                }

由於某種原因，我認為我的程序無法找到titletext ，因為這是代碼運行時的輸出： Titles:

非常感謝您的幫助，謝謝。

Answer 1

首先獲取所有以h2 html標記開頭的節點/元素

Elements elem = html.select("h2");

現在您有了一個具有一些子元素的元素（id，href，originalhref等）。 在這里您需要檢索這些所需的數據

 for(Element e: elem){
         System.out.println(e.select("[class=titletext]").text());
         System.out.println(e.select("a").attr("href"));
     }

Java-如何使用Jsoup提取Google新聞標題和鏈接？

問題描述

1 個解決方案

解決方案1
0 已采納 2016-08-29 19:39:30

Java-如何使用Jsoup提取Google新聞標題和鏈接？

問題描述

1 個解決方案

解決方案1 0 已采納 2016-08-29 19:39:30

解決方案1
0 已采納 2016-08-29 19:39:30