簡體   English   中英

regex從HTML字符串處理IDE(Java)

[英]regex Processing IDE( Java) from HTML string

讓我們給一點背景。 我正在嘗試從網頁(網頁抓取)中獲取動態值,以便在我解析/接收到它之后也能夠應用條件式。

這是頁面參考: http : //www.nba.com/gameline/heat/

我試圖在圖表中獲取團隊的“獲勝”變量的數量,然后應用條件。 我已經成功地在素描中加載了頁面的內容,但是由於我對如何編寫正則表達式的理解范圍有限,因此收到了PatternSyntaxException錯誤。

代碼如下:

String webpage = "";
String [] webpageArray = loadStrings("http://www.nba.com/gameline/heat/");


for(int i=0;i<webpageArray.length;i++){
  webpage += webpageArray[i];
}



webpage = webpage.replace("  "," ");
webpage = webpage.replace(" ","");

println(webpage);

//String[] m1 = match(webpage, "<div id=\"article\">(.*)</div></div>");

String[][] m1 = matchAll(webpage, "(?<=nbaTmOverStats.*?nbaTeamFG4\">)\\d+");

//String[] m1 = match(webpage, "NAKED (.*) - just two");

//println(webpage);
//println(m1[1]);

size(640,480);
background(255);
fill(0);

//String s = m1[1];
//text(s, 15, 20, width, height);

采用

<div id=.nbaTmOverStats.*id=.nbaTeamFG4.>(\\d+)</td>

這將提取id =“ nbaTeamFG4”的字段的數字值。 由於matchAll是與Processing 2.0+相對應的方法,因此取出數據看起來像這樣

    String m1[][] = matchAll(webpage, "<div id=.nbaTmOverStats.*id=.nbaTeamFG4.>(\\d+)</td>");
    //Print the first match
    println(m1[0][1])'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM