繁体 English 中英

机器人如何获取WordPress类别列表中后续页面的内容？

[英]How can a bot get the contents of subsequent pages in a category listing in WordPress?

原文 2012-08-05 13:49:44 9 1 wordpress/ http/ bots

我正在编写一个自动从WordPress博客下载页面的机器人。 该漫游器可以毫无问题地获取大部分页面。 例如，它可以轻松获取给定标签的文章列表的首页： http : //example.com/myblog/index.php/archives/tag/mytag 。 但是，由于某种原因，它无法获得后续页面，例如http://example.com/myblog/index.php/archives/tag/mytag/page/2 。

我试图弄清楚发生了什么，这就是我发现的结果：尽管服务器通常对大多数请求进行响应，但在此类请求中，服务器将使用301永久重定向进行响应。 奇怪的是，Location标头设置为与请求完全相同的URL！ 基本上，服务器告诉我将页面http://example.com/myblog/index.php/archives/tag/mytag/page/2的请求重定向到同一页面：P

尝试从浏览器访问页面时，我得到的页面没有问题。 我以为浏览器可能会发送一些我的机器人无法发送的标头（包括cookie），所以我从浏览器的网络控制台复制了标头（包括cookie），但是行为没有改变。

对于可能引起这种奇怪行为的任何建议，我将不胜感激，我可以做些什么以便更好地了解正在发生的事情，当然我可以做些什么以便自动获取这些页面，就像我获取其兄弟一样。

谢谢！

1 个解决方案

似乎该帖子并未引起太多公众兴趣。 但是，如果有人遇到相同的问题并找到这篇文章，这是我使用的解决方案。 重要说明：我仍然不了解我亲眼所见的行为，如果有人可以解释的话，我将不胜感激。

因此，我找到的解决方案基本上是使用URL http://example.com/myblog/archives/tag/mytag?paged=2而不是http://example.com/myblog/index.php/archives/ tag / mytag / page / 2 。 有趣的是，从浏览器浏览到该URL时，该URL被重定向到原始URL！ 但是，当漫游器请求它时，它获得的页面没有重定向或任何内容。 （所以我设法做了自己想做的事，但我不知道发生了什么，一开始为什么有问题，为什么这个解决方案起作用：对于一个URL，机器人会获得无限重定向，而浏览器只是获取页面，而其他浏览器[有限地]重定向，而机器人获取了页面。我还没有弄清楚这一点...）

如何在 Wordpress 中自定义类别页面？

[英]How can I customize category pages in Wordpress?

为什么我的WordPress类别帖子未在其类别页面上列出？

[英]Why aren't my WordPress category posts listing on their category pages?

如何使用wordpress（包括索引和类别页面）获取当前URL

[英]How to get the current URL using wordpress (including index and category pages)

Wordpress get_pages 基于页面类别

[英]Wordpress get_pages based on page category

WordPress：列出类别时，获取属于该类别的最新帖子

[英]Wordpress: get last post belonging to a category, when listing categories

如何在Wordpress的类别页面中添加.php扩展名

[英]How to Add .php extension to Category pages in Wordpress

如何根据页面中的类别显示wordpress帖子

[英]How to display wordpress post according to category in pages

如何在WordPress中显示四级页面类别

[英]How to display four level pages category in WordPress

如何在wordPress中按分类法类别ID或分类法类别名称获取所有分类法类别的帖子？

[英]How can i get all post of taxonomy category post by taxonomy category id or taxonomy category name in wordPress?

Wordpress 更新后无法在页面列表中看到页面

[英]Can't see pages on page listing after Wordpress update

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在 Wordpress 中自定义类别页面？为什么我的WordPress类别帖子未在其类别页面上列出？如何使用wordpress（包括索引和类别页面）获取当前URL Wordpress get_pages 基于页面类别 WordPress：列出类别时，获取属于该类别的最新帖子如何在Wordpress的类别页面中添加.php扩展名如何根据页面中的类别显示wordpress帖子如何在WordPress中显示四级页面类别如何在wordPress中按分类法类别ID或分类法类别名称获取所有分类法类别的帖子？ Wordpress 更新后无法在页面列表中看到页面

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM