简体繁体 English

通过Ruby中的Nokogiri仅解析HTML节点中的内容

[英]Parsing just the content in HTML nodes via Nokogiri in Ruby

原文 2012-02-18 06:53:53 0 2 html/ ruby/ parsing/ nokogiri

Suppose I have parsed a line of HTML that is the following... 假设我已经解析了以下一行HTML ...

<a href="http://www.google.com" class="blah"><img src="logo.png" border="0"></img><br><span class="red">Go to google!</span></a>

This is just an example...but how would I go about stripping everything EXCEPT the following: 这只是一个示例...但是除了以下内容外，我将如何剥离所有内容：

http://www.google.com
logo.png
Go to google!

Also, is it possible to search for wildcards? 另外，是否可以搜索通配符？

2 个解决方案

If you could make use of some gems it will be a very simple job. 如果可以利用一些宝石，这将是一个非常简单的工作。 I would recommend you Mechanize gem . 我建议您Mechanize gem 。 Reference: http://mechanize.rubyforge.org/Mechanize.html 参考： http : //mechanize.rubyforge.org/Mechanize.html

Maybe like this: 也许是这样的：

doc = Nokogiri::HTML '<a href="http://www.google.com" class="blah"><img src="logo.png" border="0"></img><br><span class="red">Go to google!</span></a>'
doc.xpath('//*/@href|//*/@src|//*/text()').map(&:to_s)

RUBY Nokogiri CSS HTML解析 - RUBY Nokogiri CSS HTML Parsing

Ruby Nokogiri 解析 HTML 表三 - Ruby Nokogiri Parsing HTML table III

使用ruby和nokogiri使用HTML注释作为标记来解析HTML - Using ruby and nokogiri to parsing HTML using HTML comments as markers

Ruby，Nokogiri：我如何在整个nokogiri解析，erb模板和编码HTML文件中确保UTF8 - Ruby, Nokogiri: how do i ensure UTF8 throughout nokogiri parsing, erb template, and encoding HTML file

Nokogiri Ruby HTML解析器 - Nokogiri Ruby HTML Parser

Nokogiri从html提取节点 - Nokogiri extract nodes from html

Nokogiri获得所有HTML节点 - Nokogiri get all HTML nodes

Ruby Nokogiri 拍下所有内容 - Ruby Nokogiri take all the content

没有 html 元素的 Nokogiri 解析表 - Nokogiri parsing table with no html element

Nokogiri和xpath解析HTML表 - Nokogiri and xpath parsing an HTML table

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 RUBY Nokogiri CSS HTML解析 - RUBY Nokogiri CSS HTML Parsing Ruby Nokogiri 解析 HTML 表三 - Ruby Nokogiri Parsing HTML table III 使用ruby和nokogiri使用HTML注释作为标记来解析HTML - Using ruby and nokogiri to parsing HTML using HTML comments as markers Ruby，Nokogiri：我如何在整个nokogiri解析，erb模板和编码HTML文件中确保UTF8 - Ruby, Nokogiri: how do i ensure UTF8 throughout nokogiri parsing, erb template, and encoding HTML file Nokogiri Ruby HTML解析器 - Nokogiri Ruby HTML Parser Nokogiri从html提取节点 - Nokogiri extract nodes from html Nokogiri获得所有HTML节点 - Nokogiri get all HTML nodes Ruby Nokogiri 拍下所有内容 - Ruby Nokogiri take all the content 没有 html 元素的 Nokogiri 解析表 - Nokogiri parsing table with no html element Nokogiri和xpath解析HTML表 - Nokogiri and xpath parsing an HTML table

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM