簡體   English   中英

選擇包含標點符號的字符串

[英]Select string which contains punctuation

所以我試圖從一組教授的名字中刪除標題。 Dr.Eng, Dr.rer.nat, MS, Dr., S.Si等等。 基本上任何包含多個點的字符串。

這是我根據“,”分割名稱和標題后的示例列表

2      [CHOTIMAH,  Dr.,  M.S., RINTO ANUGRAHA NQZ,  S...
3      [HARSOJO,  S.U.,  M.Sc.,  Dr., SUDARMAJI,  S.S...
4      [IKHSAN SETIAWAN,  S.Si.,  M.Si., ARI SETIAWAN...
5      [EKO SULISTYA,  Dr.,  M.Si., YOSEF ROBERTUS UT...
6       [SUNARTA,  Drs.,  M.S., WAGINI R.,  Drs.,  M.S.]
7      [BAMBANG MURDAKA EKA JATI,  Drs.,  M.S., KAMSU...
8      [AHMAD KUSUMA ATMAJA,  S.Si.,  M.Sc.,  Dr.Eng....
9                    [MOH. ALI JOKO WASONO,  M.S.,  Dr.]

我嘗試過r'\\S*[^\\w\\s]\\S'但返回了

CHOTIMAH,  INTO ANUGRAHA NQZ,   .
HARSOJO,   UDARMAJI,  i.
IKHSAN SETIAWAN,  RI SETIAWAN,   ng.
EKO SULISTYA,  OSEF ROBERTUS UTOMO,  Dr.
SUNARTA,  AGINI   .
BAMBANG MURDAKA EKA JATI,  AMSUL ABRAHA,   Prof.
AHMAD KUSUMA ATMAJA,   ITRAYANA,   Dr.
MOH. ALI JOKO WASONO,  Dr. 

一些教授的名字簡稱為XXX。 例如: MOHAMMAD TO MOH. 而且我不希望被刪除。

任何幫助表示贊賞!

\\w{0,}\\.(\\w{0,}\\.)? 此正則表達式測試字符串將獲取任意長度的單詞,后跟一個句點,並可選地查找任意長度的另一個單詞,后跟一個句點。 這捕獲了Dr.MS等。我很確定這就是您要的內容,如果沒有讓我知道的話。

將來,您可以使用regexr.com輕松測試regex匹配項。 另外,您已使用PythonPandas標記了此帖子,但這些並不是真正相關的標記。 請添加更多代碼以使標簽相關,或避免使用不相關的標簽

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM