[英]Images crawled by python from website cannot be open by photoshop
該網頁類似於:
<img data-s="300,640" data-type="jpeg" data-src="http://mmbiz.qpic.cn/mmbiz/2ibL1hUwSYSJO5BkyCQMicnPL5y1yAkcKh3YCITccD4IxWibI2wKpgYatDXgBBvOW01oOnGZGPVmfMDR0cQKSjeew/0?wx_fmt=jpeg" data-ratio="1.7613636363636365" data-w="440" width="auto" style="margin: 0px; padding: 0px; box-sizing: border-box !important; word-wrap: break-word !important; width: auto !important; visibility: visible !important; height: auto !important;" _width="auto" src="http://mmbiz.qpic.cn/mmbiz/2ibL1hUwSYSJO5BkyCQMicnPL5y1yAkcKh3YCITccD4IxWibI2wKpgYatDXgBBvOW01oOnGZGPVmfMDR0cQKSjeew/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1">
所以我的腳本下載圖像:
imgs = soup.find_all('img')
for img in imgs:
if img != None and img['data-type']=="jpeg":
count += 1
link = img['data-src']
piccode = urllib2.urlopen(link).read()
picname = "pic"+str(count)+".jpg"
with open(picname,'wb') as code:
code.write(piccode)
但是我下載的jpg文件無法用photoshop打開或編輯。 我以某種方式填補了我下載的圖片很煩的原因,為什么?
第一
確保已使用正確的權限設置了保存的文件。
然后
我無法回答“為什么Photoshop無法打開您的圖片”的問題。 但我可以提供一種對我有用的選擇。 在下面
似乎urllib
具有一個內置功能,該功能可以在一行中下載和保存文件。 不知道urllib2是否可以,但是我找不到任何東西。
更換
piccode = urllib2.urlopen(link).read()
用
urllib.urlretrieve(link, pic_filename)
您還可以擺脫此行之后的代碼,因為urlretrieve
在一行中完成了所有這些操作。
讓我知道這是否有效以及您是否需要更多幫助!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.