简体   繁体   English

XIDEL将多个HTML文件中的提取数据(div)导出到新的HTML文件中

[英]XIDEL export extracted data (div) from multiple HTML files into new HTML files

I would like to scrap a website of multi pages and extract a particular div before exporting it to html pages with just the div as content. 我想抓取一个包含多个页面的网站并提取特定的div,然后再将其导出到仅包含div作为内容的html页面。

I am able to extract data from the content using Xidel with the following command 我可以使用Xidel通过以下命令从内容中提取数据

xidel http://someURl/ --extract //div[2]/div[2]/div -f "//a" -e //div[2]/div[2]/div

Is it possible to download the extracted data into a html file? 是否可以将提取的数据下载到html文件中?

添加参数:--output-format = html

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM