簡體   English   中英

用於匹配 python 中的德語字符的正則表達式

[英]regex for matching german characters in python

有人可以幫助我使用正則表達式來匹配 python 中的德語單詞/句子嗎? 它不適用於 jupyter 筆記本。 我在 jsfiddle 中嘗試了同樣的方法,它工作正常。 我嘗試使用下面的腳本但不起作用

import re
pattern = re.compile(r'\[^a-zA-Z0-9äöüÄÖÜß]\\', re.UNICODE)

print(pattern.search(text))

你的表達將永遠失敗:

\[^a-zA-Z0-9äöüÄÖÜß]\\

分解,你需要

[   # literally
^   # start of the line / text
a-z # literally, etc.

問題是你需要一個[從字面上看就在一行的開始之前,這永遠不會是真的(沒有任何東西或換行符)。 所以最后,要么刪除反斜杠以獲得正確的字符 class ,如:

[^a-zA-Z0-9äöüÄÖÜß]+

但這肯定與您要查找的單詞不匹配(恰恰相反)。 所以要么使用像\w+這樣簡單的東西,要么使用@Wiktor在評論部分提出的解決方案。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM