带有日文字符的 re.sub

Question

我有以下字符串：

s = u'アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～（字幕版）'

但是，当我尝试删除字符（及其后的所有内容时，它不匹配：

>>> print re.sub(r'\（.+$', '', s)
アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～（字幕版）

我将如何让字符串只是：

アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～

?

Answer 1

您应该确保re.sub()所有参数都是相同的类型—— str或unicode 。 尝试这个：

# encoding: utf-8

import re
s = u'アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～（字幕版）'
print re.sub(ur'\（.+$', u'', s)