[英]How to split a sentence string into words, but also make punctuation a separate element
[英]how to make punctuation a separate item when using split()
我正在編寫一個程序,該程序通過使用數字序列復制文本來壓縮文本-但我不知道如何使該程序將標點符號識別為列表中的單獨項。
例如,在帶逗號的句子中,逗號表示使用split()
時單詞'comma,'
和'comma'
是不同的。 我想改用'comma' ',' 'comma'
。
我不想刪除標點符號-我希望將其作為列表中的單獨項目使用
您可以這樣使用re.split
:
>>> re.split('([{}])'.format(re.escape(string.punctuation)), "comma,comma")
['comma', ',', 'comma']
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.