[英]Scraping a web page based on fonts and font-size
HTML文本搜索可以在Web中找到各種庫。 我試圖從各種HTML頁面解析網頁的最大標題(標題) - 僅限於此。
我試圖從幾百頁(它可以是產品頁面或文章頁面等)自動檢測項目的主標題。 如果有一種方法可以根據網頁中可用文本的字體和字體大小做出解析決定,那就太好了。 由於主標題幾乎總是網頁中字體最大的文本,因此這些信息可以讓我對如何找到標題提供很多見解。
所以問題是,有什么辦法可以實現這一目標嗎?
我想你可以做到這樣的 ,不過這是因為你遍歷體內所有的HTML元素一個非常耗費資源的任務。
var text,
size = 0;
$("body, body *").each(function() {
var f_size = parseInt($(this).css("fontSize"));
if (size<f_size) {
text = $(this).text();
size = f_size;
}
console.log(this.tagName + " " + f_size);
});
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.