[英]How do I strip off “Results for ” in string “Results for 27th July 2019” using bs4?
我需要剥离“ Results for”文本,以便以后将其格式化为特定的dateformat。
问题是
当我运行不带.strip的代码时,我得到:
'Results for 27th July 2019'
当我尝试剥离文本时,出现以下错误:
TypeError: a bytes-like object is required, not 'str'
python3:
date = res.parent.find("span", {"class": "standard-headline"}).text.encode('utf8').strip("Results for ")
TypeError: a bytes-like object is required, not 'str'
有解决方法吗? 我一直在研究正则表达式,但是当没有分隔符时,似乎无法解决我的问题。
最好的祝福
错误的原因是encode('utf8')
返回bytes
。 您需要decode('utf-8')
。 它返回一个可以剥离的str()
。
在encode('utf-8')之后,您将获得二进制字符串,因此它也希望将二进制字符串(更精确的字符列表)作为参数。 您可以使用
text.encode('utf-8').decode().strip("Results for ")
要么
text.encode('utf-8').strip(b"Results for ")
请记住,剥离不是从字符串开头删除特定文本的最佳选择,因为这还会从尾部剥离所有R,e,s,空格等。
我认为您需要的是替换方法。 只需将Results for
替换Results for
空字符串即可。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.