紅寶石中的文件解析

Question

樣本文件內容：

 <DT><A HREF="http://www.cnn.com/" ADD_DATE="1299885544">CNN</A>
        <DT><A HREF="http://www.nytimes.com/" ADD_DATE="1299885544">The New York Times</A>
        <DT><A HREF="feed://news.google.com/?output=rss" ADD_DATE="1299885544">Google News</A>
        <DT><A HREF="http://www.news.com/" ADD_DATE="1299885544">CNET News.com</A>
        <DT><A HREF="http://espn.go.com/" ADD_DATE="1299885544">ESPN</A>

我正在使用的代碼：-

path = File.join(directory, bookmark.file_file_name)
 file = Nokogiri::HTML(open(path))
count = 1
file.search('//*[@href]').each do |m| 
    p m
    p m[:href]  
   rescue 
  next
end  
end

以上代碼的O / p：-

下午

 <Nokogiri::XML::Element:0x81dbed64 name="a" attributes=[#<Nokogiri::XML::Attr:0x81dbe120 name="href" value="http://maps.google.com/">, #<Nokogiri::XML::Attr:0x81dbe0e4 name="add_date" value="1299885544">] children=[#<Nokogiri::XML::Text:0x81db3590 "Google Maps">]>

pm [：href]

http://maps.google.com/

我想同時擁有URL及其值。 即“ feed：//news.google.com/？output = rss”和“ Google新聞”

Answer 1

m.text將返回值：

h = {} #=> {}


irb(main):021:0> file.search('//*[@href]').each do |m|
irb(main):022:1* h[m[:href]] = m.text
irb(main):023:1> end
=> 0
irb(main):024:0> h
=> {"http://www.cnn.com/"=>"CNN", "http://www.nytimes.com/"=>"The New York Times", "feed://news.google.com/?output=rss"=>"Google News", "http://www.news.com/"=>"CNET News.com", "http://espn.go.com/"=>"ESPN"}
irb(main):025:0>

紅寶石中的文件解析

問題描述

1 個解決方案

解決方案1
1 已采納 2011-04-26 11:42:20

紅寶石中的文件解析

問題描述

1 個解決方案

解決方案1 1 已采納 2011-04-26 11:42:20

解決方案1
1 已采納 2011-04-26 11:42:20