簡體   English   中英

從數據網格中抓取/檢索數據-DOM到CSV控制台輸出

[英]Scrape/Retrieve Data from Data Grid - DOM to CSV console output

我要在此頁面上抓取“單元小部件”->“數據網格”: http : //samples.gwtproject.org/samples/Showcase/Showcase.html#!CwDataGrid

理想情況下,我正在尋找csv樣式字符串輸出,例如(第一行和最后一行示例)

;Corey;Jenkins;63;Coworkers;438 Techwood St;
.... (many rows here)
;Yvonne;Morris;55;Family; 483 Third Pkwy;

(我正在使用Firefox)

不知道您是否要嘗試在gwt網站上構建網站刮板。 在以上示例中,每一行在由TR標簽表示的每個網格行上都有一個標識屬性。 對於第一個TR標簽,您將擁有__gwt_row="0" __gwt_subrow="0"

您還將擁有類型為__gwt_cell="cell-gwt-uid-29"單元格屬性

以上在row和cell上的兩個屬性應該使您能夠輕松地執行XPATH查找和迭代,以抓取頁面並將其輸出到csv文件中。

var jq = document.createElement('script');

jq.onload = function() {
    jQuery.noConflict();

    // Our stuff...
    (function ($) {
        $('table').find('tr')
            .each(function(j, rowitem) {
                var line = ''
                $(rowitem).find('div').each(function(i, item) {
                    var o = $(item).find('option[selected]');
                    if (o.length > 0) {
                        line += $(o).text();
                    } else {
                        line += $(item).text();
                    }
                    line += ';';
                });
                console.log(line);
            });
    })(jQuery);
}

// Load jQuery as per http://stackoverflow.com/a/7474386/22972
jq.src = "http://ajax.googleapis.com/ajax/libs/jquery/2.1.3/jquery.min.js";
document.getElementsByTagName('head')[0].appendChild(jq);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM