[英]Parsing json Objects From Text File With Much Other Stuff - Python
我有一個html
頁面。
我閱讀了requests
並使用beautifulsoup
解析了一個腳本標簽,現在該標簽包含大量文本,其中一些是json對象。
如何從此文本讀取所有json對象?
我想要實現的是從亞馬遜的日常交易中獲得具有價格的產品,這就是我現在寫的內容:
from bs4 import BeautifulSoup
import json
import requests
def FindRightScriptTag(soup):
for tag in soup.find_all('script', type="text/javascript"):
if 'sortedDealIDs' and 'dealDetails' in tag.text:
return tag
url = "https://www.amazon.co.uk/gp/deals/"
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data,"html.parser")
tag = FindRightScriptTag(soup)
print (tag)
如果您共享一些代碼,那將會很好。 通常,如果您知道如何瀏覽美麗的湯XML樹,則可以將您知道是json的字符串傳遞到json模塊中 。
您正在尋找json.loads(),因為它需要一個json字符串將其轉換為Python對象字典供您使用。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.