繁体   English   中英

无法访问 Python Selenium 中的 Instagram 帖子标题

[英]Trouble accessing Instagram post caption in Python Selenium

下午好:我目前正在尝试使用 python selenium 访问某些 Instagram 帖子的描述(标题)部分。 例如,在下图中,它指的是以“谢谢”开头的部分,一直到主题标签。

在此处输入图像描述

好吧,它引起了我的注意以下几点:

考虑这篇文章( https://www.instagram.com/p/CNYQkxADO8p/ )。 检查检查器时,我们可以看到注释在 class 调用“已编辑”内,因此我们可以使用以下代码检索所有文本:

desc = driver.find_element_by_xpath("//span[@title='Edited']").text

上面的代码适用于提到的帖子。 但是,请考虑第二篇文章:( https://www.instagram.com/p/CN5dOopjNEk/ )。 该描述似乎位于不同的 HTML class 中,并且上面的代码行抛出了 NoSuchElementException。 因此,我想知道如何访问该帖子的标题,因为它不在标题为“已编辑”的部分中。 我怎样才能访问帖子的上述部分?

感谢您的关注

对于该特定帖子,您可以尝试使用:

desc = driver.find_element_by_xpath("//div[@class='C4VMK']/h2/following-sibling::span")

print(desc.text)

由于没有直接访问该元素的方法,我们从class向下钻取到h2 ,然后获取span的下一个元素兄弟,这是文本所在的位置。

我不确定为什么它与其他具有//span[@title='Edited']的帖子不同,但似乎是。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM