标签[nokogiri]

用于Ruby的HTML,XML,SAX和Reader解析器,能够通过XPath或CSS3选择器搜索文档……等等

0
1回复
27

如何使用nokogiri gem获得cookie传递的URL标题的值

我想获取Cookie传递的URL的标题。 如果我只使用普通的URL,它就可以工作。 (请参见下面的代码) 但是,当通过cookie将url作为参数给出时,它就无法工作。 我收到“ Net
2
2回复
46

如何使用Ruby on Rails纠正Nokogiri的加载错误?

我很确定我已经用尽了所有其他资源,以弄清楚为什么我总是收到加载错误。 关于nokogiri,bootsnap和spring的事情不断出现。 我正在使用ruby on rails,当我尝试启动服务器或控
0
0回复
17

如何解决Rails中Ruby上宝石的加载错误,特别是nokogiri / bootsnap

我找不到这个问题的答案,所以... 我在Mac上使用Rails 6.1.1和ruby 2.2.5 我也尝试过更改这些版本,但未成功... 输入“ rails c”放入Rails控制台时,我不断收
1
1回复
55

Ruby open-uri无法打开URL(M1 Mac)

我开始学习红宝石和刮擦,我尝试用open打开一个URL,我得到了 lib/scrapper.rb:7:in `initialize': No such file or directory @ rb_s
0
1回复
23

使用Nokogiri在XML中循环并获取一个子元素

我在XML / GPX文件中苦苦挣扎,在这里我需要获取一些特定的数据: 到目前为止,我正在尝试这样做 但是我没有成功从ns4:hr获取值 我仔细阅读了https://nokogiri.org/
2
1回复
36

Nokogiri在带.empty的空字符串上返回False?

我正在尝试使用基于Nokogiri的gem, ruby- readability从文档中删除空的<p>标记。 使用.strip.empty? 在控制台中可以正常工作,如下所示: 在ru
0
2回复
34

使用Ruby的Nokogiri解析XML文档时出错

我想使用Ruby的Nokogiri库,如下解析XML文档,并从中提取一些元素(例如“ tsn”或“ kingdom”): 用打开文件后 如果我用 我得到一个零值,如果我使用 我收到错误
-1
0回复
10

如何在Ruby中读取xml节点并替换其他节点

我有一个下面的XML。 我需要阅读节点Bus并替换Transport to ROAD WAYS和Flight to Air Ways
0
0回复
33

收到错误“错误:错误的参数数量(给定0,应为1;必填关键字:url)”

我正在构建基本的Rails Web刮板,并且遇到了此错误。 这也是我的刮板方法和刮板模型。 https://gyazo.com/d866cd8def5ac107ea8c13515faac989
0
1回复
62

如何从中获取字符串

我正在使用nokogiri并刮了整个 大十会议 我怎样才能只参加十大大会?
1
1回复
493

无法在macOS Big Sur上安装ruby gem Nokogiri 1.8.5 [关闭]

关闭。 这个问题需要调试细节。 它当前不接受答案。
0
0回复
09

当子节点为文本节点时,XML到哈希的转换Nori会丢弃属性值

试过这个 结果是 我也想检索ResBookDesigCode值
-1
2回复
34

Ruby:如何在XML上映射模型

在Ruby-on-Rails 6.0中,我想创建一个名为services的资源,其中包含模型,视图和控制器。 每个服务都有一个ID,一个名称,一个类型和一个ImageIndex 但是我
0
2回复
26

如何使用Nokogiri获取倒数第二个脚本结束标记

我需要使用Nokogiri获取倒数第二个脚本结束标记。 示例代码: 我尝试了像doc.css('/html/head/script')[-2] 。 但是,它将代码放置在标签内。
2
2回复
55

当ID使用Nokogiri包含特殊字符时,如何抓取URL /文本

我正在尝试从https://webcat.schaeffler.com/web/schaeffler/pl/PKW/applicationSearch.xhtml抓取一些数据。 我开始构建应
1
2回复
33

Nokogiri :: HTML(html_content)与Nokogiri :: HTML.parse(html_content)有什么区别

我在互联网上搜索,找不到它们之间的区别。
0
2回复
36

如何分别从两个相同的节点获取内容?

我有带有产品名称和价格列表的HTML文件 并且需要分别从每个<label>获取名称和价格。 我正在使用Nokogiri解析HTML文件并尝试 但是,您可能已经猜到了,
-2
2回复
33

如何在Nokogiri中解析图像href

我正在使用Nokogiri解析网页,并想解析出图像URL。 这是我的设置: 目标网站包含以下代码: 但是,当我运行时: 我得到以下内容: 为什么我不获取img类,
0
1回复
18

`initialize':使用Nokogiri打开网站时,没有这样的文件或目录@ rb_sysopen

我创建了一个使用Scraper类刮取站点的CLI程序。 我正在使用Nokogiri和Open-URI。 上面的错误正在弹出。 我在网上查看,没有找到帮助。 我确保该网站没有错字。
0
0回复
18

如何刮取角度元素

我正在尝试抓取内置Angular的网页。 我需要的信息格式如下所示: 我想在链接“ Federer,Roger”中获得名称,所以我尝试: 一无所有。 我还尝试使用以下方法从

1 2 3 4 5 6 7 8 9 10 下一页