[英]Select string which contains punctuation
所以我試圖從一組教授的名字中刪除標題。 像Dr.Eng, Dr.rer.nat, MS, Dr., S.Si
等等。 基本上任何包含多個點的字符串。
這是我根據“,”分割名稱和標題后的示例列表
2 [CHOTIMAH, Dr., M.S., RINTO ANUGRAHA NQZ, S...
3 [HARSOJO, S.U., M.Sc., Dr., SUDARMAJI, S.S...
4 [IKHSAN SETIAWAN, S.Si., M.Si., ARI SETIAWAN...
5 [EKO SULISTYA, Dr., M.Si., YOSEF ROBERTUS UT...
6 [SUNARTA, Drs., M.S., WAGINI R., Drs., M.S.]
7 [BAMBANG MURDAKA EKA JATI, Drs., M.S., KAMSU...
8 [AHMAD KUSUMA ATMAJA, S.Si., M.Sc., Dr.Eng....
9 [MOH. ALI JOKO WASONO, M.S., Dr.]
我嘗試過r'\\S*[^\\w\\s]\\S'
但返回了
CHOTIMAH, INTO ANUGRAHA NQZ, .
HARSOJO, UDARMAJI, i.
IKHSAN SETIAWAN, RI SETIAWAN, ng.
EKO SULISTYA, OSEF ROBERTUS UTOMO, Dr.
SUNARTA, AGINI .
BAMBANG MURDAKA EKA JATI, AMSUL ABRAHA, Prof.
AHMAD KUSUMA ATMAJA, ITRAYANA, Dr.
MOH. ALI JOKO WASONO, Dr.
一些教授的名字簡稱為XXX。 例如: MOHAMMAD TO MOH.
而且我不希望被刪除。
任何幫助表示贊賞!
\\w{0,}\\.(\\w{0,}\\.)?
此正則表達式測試字符串將獲取任意長度的單詞,后跟一個句點,並可選地查找任意長度的另一個單詞,后跟一個句點。 這捕獲了Dr.
, MS
等。我很確定這就是您要的內容,如果沒有讓我知道的話。
將來,您可以使用regexr.com輕松測試regex匹配項。 另外,您已使用Python
和Pandas
標記了此帖子,但這些並不是真正相關的標記。 請添加更多代碼以使標簽相關,或避免使用不相關的標簽
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.