繁体   English   中英

Ruby / Rails-Scrapi gem在获取下一个div文本时出现问题

[英]Ruby/Rails - Scrapi gem issues grabbing next div text

我有以下HTML:

<div class="tvShow" align="left">
    <div class="clearfix" style="margin:0px 0px;">
        <h3 class="left" style="margin:0px 0px">FIRST TUESDAY BOOK CLUB WITH JENNIFER BYRNE</h3>
    </div>

    <div>Thursday 22nd December at 2.00 pm (60 minutes)</div>

    <div><b>Channel: </b>ABC1</div>
    ...
</div>

我正在使用scrapi gem scrapi内容物。

这是我到目前为止提取h3

channel_item = Scraper.define do
    process "h3", :name => :text
end

# let scrapi begin

listings = Scraper.define do
    array :programs
    process "div.tvShow", :programs => channel_item
    result :programs
end

# loop through the listings

listings.scrape(uri).each do |program|
    puts program.name.titleize # h3 text
end

我不确定如何提取12月22日(星期四)下午2.00(60分钟)Channel:ABC1文本。

任何帮助,将不胜感激。 提前致谢。

尝试这个:

channel_item = Scraper.define do
  process "h3", :name => :text
  process "div[2]", :time => :text
  process "div[3]", :channel => :text
end

http://saxon.sourceforge.net/saxon6.5.3/expressions.html#NodeSetExpressions

希望这可以帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM