[英]Designing a regex to exclude parts of a string with a backslash
我正在嘗試從具有額外字符的 csv 文件中清理一列字符串。 我正在嘗試在諸如'Robert Johnson\xa0'
類的字符串上使用以下正則表達式: (r'([A-Za-z0-9\s]+)')
以僅提取'Robert Johnson'
,但結果字符串不變。 不確定如何修改正則表達式以使'\xa0'
不包含在最終字符串中。
如果您需要在字符串中提取的所有內容都不包括數字。 那么這應該工作
(r'([A-Za-z]+)\b')
試試這個(r'(^[A-Za-z\s]+))
這給出
羅伯特·約翰遜
任何名字
比賽詳情
[
[
{
"content": "Robert Johnson",
"isParticipating": true,
"groupNum": 0,
"groupName": null,
"startPos": 0,
"endPos": 14
}
],
[
{
"content": "Any Name",
"isParticipating": true,
"groupNum": 0,
"groupName": null,
"startPos": 19,
"endPos": 27
}
]
]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.