簡體   English   中英

使用jsoup get()函數時出現IndexOutOfBoundsException

[英]IndexOutOfBoundsException when using jsoup get() function

基本上,我的函數從https://meta.wikimedia.org/wiki/Table_of_Wikimedia_projects加載網頁,並獲取表格,以便在行中的某個單元格不為空時打印語言名稱。 這是代碼:

public static void getLanguagesFromProject(String project) {
    String html = "https://meta.wikimedia.org/wiki/Table_of_Wikimedia_projects";
    try {
        Document doc = Jsoup.connect(html).get();
        Elements tableElements = doc.select("table.wikitable.sortable");
        Elements rows = tableElements.select("tr");
        int column = 0;
        switch (project) {
            case "Wikipedia":
                column = 3;
                break;
            case "Wiktionary":
                column = 4;
                break;
            case "Wikibooks":
                column = 5;
                break;
            case "Wikinews":
                column = 6;
                break;
            case "Wikiquote":
                column = 7;
                break;
            case "Wikisource":
                column = 8;
                break;
            case "Wikiversity":
                column = 9;
                break;
            case "Wikivoyage":
                column = 10;
                break;
            default:
                break;
        }
        for (Element row : rows) {
            Elements cols = row.select("td");
            System.out.println(cols.get(column).text());
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
}

發生的是我得到一個IndexOutOfBoundsException錯誤,特別是在for循環的第二條語句中: System.out.println(cols.get(column).text()); 知道需要做什么嗎? 編輯:更詳細的錯誤:

java.lang.IndexOutOfBoundsException: Index 3 out-of-bounds for length 0 at java.base/jdk.internal.util.Preconditions.outOfBounds(Preconditions.java:64) at java.base/jdk.internal.util.Preconditions.outOfBoundsCheckIndex(Preconditions.java:70) at java.base/jdk.internal.util.Preconditions.checkIndex(Preconditions.java:248) at java.base/java.util.Objects.checkIndex(Objects.java:372) at java.base/java.util.ArrayList.get(ArrayList.java:440) at com.company.Main.getLanguagesFromProject(Main.java:76) at com.company.Main.main(Main.java:11)

請注意,您已選擇所有<tr>

Elements tableElements = doc.select("table.wikitable.sortable");
Elements rows = tableElements.select("tr");

包括標題中的內容。 然后,它的第一行將是不具有<td>的標頭,然后,在其第一次迭代中,當它嘗試獲取第三個元素<td>時,它出現了IndexOutOfBoundsException異常,因為它在那里不存在。

只排除標題的第一個<tr>

// start from 1, exclude 0 which is a header without td's
for (int i = 1; i < rows.size(); i++) {
    Elements cols = rows.get(i).select("td");
    System.out.println(cols.get(column).text());
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM