簡體   English   中英

使用正則表達式提取對話

[英]Extract conversations using regex

我有這樣的文字:

[代理]:歡迎來到ABC銀行。我叫Asif。 我可以如何幫助您[cust]:我的信用卡上有額外的費用,我將不支付這筆費用,請刪除它[agent]:好的,我可以保留通話嗎[cust]:這是一種非常無響應的行為銀行方面

對話不是行分隔的。 我只需要提取客戶所說的內容,而忽略代理商在分析客戶情緒時所說的內容。 請幫助此正則表達式。

要么:

\\[cust\\]:((?:(?!\\[\\w+\\]:).)*)

要么

(?s)\\[cust\\]:(.*?)(?=\\[\\w+\\]:|$)

https://regex101.com/r/RT2O4y/1

基准測試:

Regex1:   \[cust\]:((?:(?!\[\w+\]:).)*)
Options:  < none >
Completed iterations:   50  /  50     ( x 1000 )
Matches found per iteration:   2
Elapsed Time:    1.37 s,   1372.69 ms,   1372693 µs
Matches per sec:   72,849


Regex2:   (?s)\[cust\]:(.*?)(?=\[\w+\]:|$)
Options:  < none >
Completed iterations:   50  /  50     ( x 1000 )
Matches found per iteration:   2
Elapsed Time:    0.92 s,   918.17 ms,   918175 µs
Matches per sec:   108,911

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM