Python：當我使用request.get（'url'）並打印r.text時，返回什么？

Question

我正在嘗試抓取此網頁。 此代碼有效：

import requests
header = {
   'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:32.0) Gecko/20100101 Firefox/32.0',
}
r = requests.get('http://www.machinefinder.com/ww/en-US/categories/used-drawn-planters', headers=header)
print r.text

但是我不確定它返回的文本到底是什么。 我希望它是JSON，以便我可以復制發現解析JSON的其他示例。

注意：我的工作安全性會阻止該網頁，並在我使用時顯示“非法Web瀏覽器”

header={ 
            'Content-Type': 'application/json;charset=UTF-8', 
        }

這就是為什么我改用Firefox的原因。

Answer 1

你不能得到一個任意網站返回一個JSON格式的數據，除非它提供了一個WWAY要求（並取回..）一個JSON格式的數據。

r.text通常將保留網站的源代碼，除非再次明確指出，它特別返回了JSON數據。

因此，您將不得不訴諸其他方法來解析網站，例如BeautifulSoup。

Answer 2

>>>>type(r.text) 
<type 'unicode'>

看起來是該頁面的html。 您可以使用美麗湯來解析它： https : //www.crummy.com/software/BeautifulSoup/bs3/documentation.html

Python：當我使用request.get（'url'）並打印r.text時，返回什么？

問題描述

2 個解決方案

解決方案1
0 2016-05-11 16:15:36

解決方案2
0 已采納 2016-05-11 16:16:09

Python：當我使用request.get（&#39;url&#39;）並打印r.text時，返回什么？

問題描述

2 個解決方案

解決方案1 0 2016-05-11 16:15:36

解決方案2 0 已采納 2016-05-11 16:16:09

Python：當我使用request.get（'url'）並打印r.text時，返回什么？

解決方案1
0 2016-05-11 16:15:36

解決方案2
0 已采納 2016-05-11 16:16:09