繁体   English   中英

如何从文件中读取的每行字符串的开头删除 b?

[英]How to remove b from the beginning of each line of string read from file?

我正在阅读 csv 如下。

data = pd.read_csv('news.csv')

它包含newscategory作为列。 我需要标记新闻专栏中的单词。 问题是news栏目的每一行文字都以b开头。

b'世界各地的寿命增加:世卫组织'
b'基孔肯雅热传播,蚊媒病毒......

我试过如何在 python 中去掉字符串中的 b 前缀? 但这是针对字节编码的字符串。 所以,

line = data['news'][0]
line.decode('utf-8')

会导致:

AttributeError: 'str' object has no attribute 'decode'

这些行中的每一行都是str类型。 我如何删除那些 b ?

这个b''可能指向可以被解码为字符串''字节类型,但也可以是内容为b'...'的字符串本身。

对于第一种情况,您需要line.decode() ,第二种情况需要line[2:-1]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM