帶有日文字符的 re.sub

Question

我有以下字符串：

s = u'アガサ・クリスティー　奧さまは名探偵　～パディントン発4時50分～（字幕版）'

但是，當我嘗試刪除字符（及其后的所有內容時，它不匹配：

>>> print re.sub(r'\（.+$', '', s)
アガサ・クリスティー　奧さまは名探偵　～パディントン発4時50分～（字幕版）

我將如何讓字符串只是：

アガサ・クリスティー　奧さまは名探偵　～パディントン発4時50分～

?

Answer 1

您應該確保re.sub()所有參數都是相同的類型—— str或unicode 。 嘗試這個：

# encoding: utf-8

import re
s = u'アガサ・クリスティー　奧さまは名探偵　～パディントン発4時50分～（字幕版）'
print re.sub(ur'\（.+$', u'', s)