繁体   English   中英

需要帮助提取人名

[英]Need help to extract the name of person

我正在从网站中提取数据,我想以正确的形式获取学生的姓名。

我如何将\\xa0 RAJAT KUMAR\\r\\n '更改为RAJAT KUMAR

您可以使用 strip() 来帮助您。

string = '\xa0  RAJAT KUMAR\r\n                                '
print(string.strip())
# RAJAT KUMAR

如果尝试使用此功能失败,它将有所帮助。

def RemoveMeta(string):
    import re
    string = re.sub('\s+',' ',string)
    string = re.sub('\n|\t|^\s+\|\s+$','',string)
    string = string.strip()
    return string
print(RemoveMeta(string))
# RAJAT KUMAR

此外,如果您有任何编码或文本问题,您可以在下面提供帮助,

import ftfy
string = ftfy.fix_text(string)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM