簡體   English   中英

設計一個正則表達式以排除帶有反斜杠的字符串部分

[英]Designing a regex to exclude parts of a string with a backslash

我正在嘗試從具有額外字符的 csv 文件中清理一列字符串。 我正在嘗試在諸如'Robert Johnson\xa0'類的字符串上使用以下正則表達式: (r'([A-Za-z0-9\s]+)')以僅提取'Robert Johnson' ,但結果字符串不變。 不確定如何修改正則表達式以使'\xa0'不包含在最終字符串中。

如果您需要在字符串中提取的所有內容都不包括數字。 那么這應該工作

(r'([A-Za-z]+)\b') 

試試這個(r'(^[A-Za-z\s]+))這給出

羅伯特·約翰遜

任何名字

比賽詳情

[
  [
    {
      "content": "Robert Johnson",
      "isParticipating": true,
      "groupNum": 0,
      "groupName": null,
      "startPos": 0,
      "endPos": 14
    }
  ],
  [
    {
      "content": "Any Name",
      "isParticipating": true,
      "groupNum": 0,
      "groupName": null,
      "startPos": 19,
      "endPos": 27
    }
  ]
]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM