[英]requests.get returns <!doctype> instead <Response>
我對request.get()有問題。 如果我將網址手動粘貼到代碼中,如下所示:
r = requests.get('https://berlin.kauperts.de/Strassen/Igelsteig-12557-Berlin.html')
print(r)
我得到: <Response [200]>
。 哪個效果很好。 相反,如果我嘗試從文件列表中請求請求,如下所示:
indir = '/home/d/Desktop/civiv_hacking/Streetnames/dump/berlin.kauperts.de/Strassen'
for root, dirs, filenames in os.walk(indir):
for z in filenames:
x = urlparse.urljoin('https://berlin.kauperts.de/Strassen/', z+'/'),
[t[0] for t in x],
print(t),
for r in requests.get(t):
print(r),
我得到: https://berlin.kauperts.de/Strassen/Igelsteig-12557-Berlin/ <!DOCTYPE html> <html lang="de" xml:lang="de" xmlns="http://www.w3.org/1999/xhtml">
: https://berlin.kauperts.de/Strassen/Igelsteig-12557-Berlin/ <!DOCTYPE html> <html lang="de" xml:lang="de" xmlns="http://www.w3.org/1999/xhtml">
如何使request.get()返回<Response [200]>
而不是僅僅返回文檔類型信息?
如果要查看Response
字符串表示形式 ,則不應該對其進行迭代,只需打印:
url = urlparse.urljoin('https://berlin.kauperts.de/Strassen/', z)
response = requests.get(url)
print(response) # would print "<Response [200]>"
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.