使用decode（）與regex來解除此字符串的轉換

Question

我有以下字符串，我正在試圖找出解決它的最佳做法。

解決方案必須有點靈活，因為我從API接收此輸入並且我不能完全確定當前字符結構（ \\n而不是\\r ）將始終相同。

'"If it ain\\'t broke, don\\'t fix it." \\nWent in for a detailed car wash.\\nThe attendants raved-up my engine when taking the car into the tunnel. NOTE: my car is...'

這個正則表達式似乎應該工作：

text_excerpt = re.sub(r'[\s"\\]', ' ', raw_text_excerpt).strip()

我已經讀過decode()可能會起作用（並且通常會是一個更好的解決方案）。

raw_text_excerpt.decode('string_unescape')

嘗試了這些方面的東西，它沒有奏效。 有什么建議？ 正則表達式在這里最好嗎？

Answer 1

您正在尋找的編解碼器是string-escape ：

>>> print "\\'".decode("string-escape")
'

我不確定他們添加了什么版本，但是...可能是你正在使用的舊版本沒有它。 我在跑：

Python 2.6.6 (r266:84292, Mar 25 2011, 19:36:32) 
[GCC 4.5.2] on linux2

使用decode（）與regex來解除此字符串的轉換

問題描述

1 個解決方案

解決方案1
16 2012-05-03 08:18:15

使用decode（）與regex來解除此字符串的轉換

問題描述

1 個解決方案

解決方案1 16 2012-05-03 08:18:15

解決方案1
16 2012-05-03 08:18:15