
[英]Parsing a non-XML document with Nokogiri when the node names are/contain integers
当我跑步时:#!/usr/bin/env ruby require 'nokogiri' xml = <<-EOXML <pajamas> <bananas> <foo>bar</foo> <bar>bar ...
[英]Parsing a non-XML document with Nokogiri when the node names are/contain integers
当我跑步时:#!/usr/bin/env ruby require 'nokogiri' xml = <<-EOXML <pajamas> <bananas> <foo>bar</foo> <bar>bar ...
[英]space in classname is forcing table to be unselectable
在抓取 forexfactory 日历时, <table class="calendar__table ">中有一个空格,因此 nokogiri 无法找到该表。 该表存在于此 html 中,如屏幕截图所示。 那么我该如何抓取这张桌子呢? ...
[英]How to select a tag which contains another tag with a specific value in Nokogiri?
我有一个 xml 看起来像这样<list> <item> <id>1</id> <data>123</data> </item> <item> <id>2</id> ...
[英]Web-scraping with Ruby Mechanize
我尝试使用 ruby 机械化抓取 web 页面,但无法正常工作。 基本上那个网站有一些产品,我需要产品的链接。 HTML 我在下面测试了这段代码,我期待产品的链接,但 output 没有显示任何内容。 ` ` ...
[英]Nokogiri miss html inner text if it contains "<"
我正在编写一个将 HTML 字符串更改为 JSON 的 rake 任务,为此我使用 Nokogiri 来解析 HTML 字符串并构建 JSON,一切都很顺利,直到我注意到如果我有一个内部文本 要么 然后 nokogiri 返回“109”而不是“> 109”或“< 109” 如果我有一个 ...
[英]How to use Nokogiri to find all class elements in a webpage?
我正在使用 Nokogiri 来解析网页。 我能够成功获得第一个 bookTitle 类元素,但我正在尝试获取数组中的所有标题。 但我正在努力获得所有其他元素。 获得它们的最佳方法是什么? ...
[英]LoadError: incompatible library version - /home/ubuntu/.rvm/gems/ruby-2.3.1@lm5/gems/nokogiri-1.8.2/lib/nokogiri/nokogiri.so
尝试使用生产模式运行 rake assets 预编译如下。 它适用于 ubuntu 14.04(32 位)和 16.06(32 位)但在 aws ec2 中出现加载错误 16.04(64 位)。 这是我的完整堆栈跟踪: ...
[英]Github Dependabot recommending Gemfile.lock PLATFORMS change from ruby to x86_64-linux. Nokogiri 1.13.1 -> 1.13.9
# Gemfile.lock - nokogiri (1.13.1) - mini_portile2 (~> 2.7.0) + nokogiri (1.13.9-x86_64-linux) ... PLATFORMS - ruby + x86_64-linux 你好。 Depe ...
[英]Why am I getting a nokogiri and mini_portile2 dependency error when deploying to new Heroku server?
我正在尝试更新我的 RoR 应用程序以在新的 Heroku 服务器上运行。 我继续收到错误: mini_portile2 和 nokogiri 都出现在 Gemfile 和 Gemfile.Lock 中。 它在旧服务器上使用旧版本运行良好。 新版本适用于我在家使用 rails server,没有 ...
[英]Capybara RSpec empty html - Nokogiri::CSS::SyntaxError: unexpected '$' after ''
我有一个简单的 web 测试场景,其中 Capybara 运行 webrick 和 poltergeist,但它让我发疯: let(:person) { create(:person) } scenario 'works with their password', js: true do ...
[英]Nokogiri : find all the anchors that match a name
我正在尝试仅保存本网站MusicRadar中示例页面的链接require 'open-uri' require 'nokogiri' link = 'https://www.musicradar.com/news/tech/free-music-samples-royalty-free-loops- ...
[英]Rspec/Rails/Nokogiri: Undefined namespace prefix
这是node.to_xml的node.to_xml 下面是对应的 rspec 测试: 但我收到了这个错误: ...
[英]Parsing an XML file with Nokogiri to determine the path (Ruby)
我的代码应该“猜测”位于我的 XML 文件中相关文本节点之前的路径。 在这种情况下,相关意味着:嵌套在重复出现的产品/人/某物标签内的文本节点,但不是在它之外使用的文本节点。 这段代码: 适用于简单的 XML 文件,例如: 但是当它变得更加复杂时,我应该如何应对挑战? 例如这个: ...
[英]Can't use Nokogiri gem on M1 processor
我在使用 M1 处理器和 Nokogiri gem 时遇到问题。 宝石文件 当我运行bundle install时,一切似乎都很好,但是当我尝试运行规范时,例如,我看到了错误: 我尝试使用gem install nokogiri -v 1.13.6 --platform arm64-darwin ...
[英]MacOs (M1 Arm64) unable to load Nokogiri - Using system default Ruby
我可以在这里使用一些帮助。 我正在设置新的 2020 Macbook Pro M1。 我已经完成了在 Mac 上安装 ruby/rails 的所有常规步骤,但是我无法完成rails new 。 在点击安装的以下部分时,我收到此错误: 随后出现此错误: 我正在使用 Rbenv,它有正确的路径并且从医 ...
[英]Ruby - Nokogiri xml search with 2 conditions
我有一个 xml 文件。 如果 <generic:Value id=" <generic:ObsValue value="x"/> <generic:Value id="TIME_PERIOD" value="2020"/>和<generic:Obs> &l ...
[英]Parsing an XML file using nokogiri to create \index fields for LaTeX
我是 Ruby 和 nokogiri 的新手,我需要一些帮助。 我正在研究一组宏,这些宏将允许我从我的索引软件中获取 XML 文件 output,并将其解析为有效的\index{}命令,以包含在 Z5766DEA037E9097AC686FEZZ 源文件9424B中每个 XML <record ...
[英]Nokogiri next element by type
说我有 如何从h3到p节点现在我只能从不带任何 arguments 并返回h2标签doc.css('h3').next_element获取。 有没有一种方法可以递归检查节点类型,或者有一种方法可以调用例如doc.css('h3').next('p') PS 当然,我正在解析的 HTML 并不像上 ...
[英]how to use nokogiri to parse xml file for specific values?
我有一个 xml 文件,我需要从中提取所有包含https://www.example.com/a/b的值: 鉴于上述情况,这应该返回两个结果。 我已经打开了文件并使用 Nokogiri 对其进行了解析,但我不明白如何访问//loc键的值。 上面的代码放置了整个 xml 文件,但我希望它配对,以便我 ...
[英]Custom function for class check in Nokogiri
如何将 class 的自定义 XPath function 检查添加到 Nokogiri? 即类似于https://gist.github.com/knu/087b7f89bb31de4f419c的东西,但执行 谢谢:) ...