繁体 English 中英

Java-Jsoup，抓取HTML

[英]Java-Jsoup, scrape html

原文 2013-06-17 13:12:31 1 2 java/ html/ web-scraping/ jsoup

我正在将Jsoup与Java一起使用来解析HTML文件。 我的问题是我如何提取“小时费率：23,016个订单”这一行，因为我正在解析很多文件，因此“小时费率”旁边的数字将发生变化。

<html>
<head>
<title>Testing</title>
</head>
<body>
<p class=MsoNormal align=center style='background:#DEDEDF'>
<span style='font-size:18.0pt'><b>Testing</b></span></p>
Hourly Rate: 23,016 orders<br>
<table border=0 cellpadding=0>
<tr valign=top>
<td>

谢谢

2 个解决方案

我刚刚添加了以下代码：

 String HourlyRate = doc.body().ownText();
//String text = doc.body().text();

System.out.println(HourlyRate);

已打印输出：时薪：23,016订单

抓住MsoNormal类，然后使用正则表达式查找数字，即

Document doc = Jsoup.parse(htmlString);
Element msoNormal = doc.getElementsByClass("MsoNormal").first();
if(msoNormal!=null){
  Pattern p = Pattern.compile("[0-9]+,[0-9]+");
  Matcher m = pattern.matcher(msoNormal.text());
  if(matcher.find())
    System.out.println(m.get());
}

JSoup按属性值刮取HTML文档

[英]JSoup scrape HTML document by attribute value

使用 Jsoup 需要登录的 Java 抓取网站

[英]Java scrape website with login required using Jsoup

Java用JSoup刮擦动态网站

[英]Java-Scrape a dynamic website with JSoup

JSOUP从p和span抓取html文本

[英]JSOUP scrape html text from p and span

HTML + Java + jsoup中的响应

[英]html response in java + jsoup

提取数据java jsoup html

[英]extracting data java jsoup html

使用JAVA（Jsoup）解析html

[英]Parsing html using JAVA (Jsoup)

用jsoup为Java解析HTML的问题

[英]Issue on parsing Html with jsoup for java

使用Jsoup在Java中进行HTML解析

[英]Html parsing in Java using Jsoup

Java Jsoup遍历下拉列表并刮取动态添加的数据

[英]Java Jsoup iterate through drop downs and scrape dynamically added data

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 JSoup按属性值刮取HTML文档使用 Jsoup 需要登录的 Java 抓取网站 Java用JSoup刮擦动态网站 JSOUP从p和span抓取html文本 HTML + Java + jsoup中的响应提取数据java jsoup html 使用JAVA（Jsoup）解析html 用jsoup为Java解析HTML的问题使用Jsoup在Java中进行HTML解析 Java Jsoup遍历下拉列表并刮取动态添加的数据

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM