readlines函数应用于应用于作为网页响应的文件时抛出错误

Question

我有以下代码与我上一个问题中的代码几乎相似：

import sys , os
import requests, webbrowser,bs4
from PIL import Image
import pyautogui
from bs4 import BeautifulSoup
ab = "Ozil is the best"

ff = ab.find("zil")

print (ff) 
print( ab[1:len(ab)])


p = requests.get('http://www.goal.com/en-ie/news/ozil-agent-eviscerates-jealous-keown-over-stupid-comments/1javhtwzz72q113dnonn24mnr1')
j = "                                                                                                                                                          "
n = open("exml.txt" , 'wb')
for i in p.iter_content(1000) :
    n.write(i)


n.close()
n = open("exml.txt",'rb')
lis_lines = n.readlines()
#print (lis_lines[0])
#print(yy.encode("ascii"))
yy = lis_lines[0]
k = yy.find(".png")
#print(yy.decode("ascii"))
#yy = lis_lines[0].split(".png" , lis_lines[0].count(".png"))
#print(yy.encode("ascii"))
soupy= bs4.BeautifulSoup(p,"lxml")
#print(yy.encode("ascii"))
#print(yy)

我打算做的是拥有一个脚本，该脚本会将所有图像保存在系统中的网页中。

在最后一个问题的脚本中，我着手使用beautifulSoup的“ select”属性进行此操作。

但是，我遇到了一些错误，因为我以为我会阅读xml文件并找到存在“ .png”的所有位置，然后从那里我一次移回一个字符，直到到达“ WWW”。 这样，我将形成一个字符串列表，其中将包含指向网页中图像的链接的列表。 然后一个接一个地，我将使用webbrowser模块打开这些链接，并将截屏并将其保存到计算机的某个目录中。

但是。 我在以下行中遇到错误：

 k = yy.find(".png")

它指出：

文件“ C：\\ perl \\ webscratcher.py”，第27行，在k = yy.find（“。png”）中TypeError：需要类似字节的对象，而不是'str'

我需要深入了解此错误。 我想我正在以二进制模式读取它，这就是为什么它希望在字符串中搜索字节类型数据。 那么，如何避免这种情况呢？ 我需要深入了解这个概念，以便对此非常清楚。

Answer 1

读取文件时不要使用rb模式。 将n = open("exml.txt",'rb')替换为n = open("exml.txt",'r') 。

顺便说一句，当在Stack Overflow上发布问题时，请尽量减少您的问题。 例如，删除注释行并使用更多描述性变量名。

readlines函数应用于应用于作为网页响应的文件时抛出错误

问题描述

1 个解决方案

解决方案1
0 2018-06-10 10:23:12

readlines函数应用于应用于作为网页响应的文件时抛出错误

问题描述

1 个解决方案

解决方案1 0 2018-06-10 10:23:12

解决方案1
0 2018-06-10 10:23:12