[英]Extract conversations using regex
我有這樣的文字:
[代理]:歡迎來到ABC銀行。我叫Asif。 我可以如何幫助您[cust]:我的信用卡上有額外的費用,我將不支付這筆費用,請刪除它[agent]:好的,我可以保留通話嗎[cust]:這是一種非常無響應的行為銀行方面
對話不是行分隔的。 我只需要提取客戶所說的內容,而忽略代理商在分析客戶情緒時所說的內容。 請幫助此正則表達式。
要么:
\\[cust\\]:((?:(?!\\[\\w+\\]:).)*)
要么
(?s)\\[cust\\]:(.*?)(?=\\[\\w+\\]:|$)
https://regex101.com/r/RT2O4y/1
基准測試:
Regex1: \[cust\]:((?:(?!\[\w+\]:).)*)
Options: < none >
Completed iterations: 50 / 50 ( x 1000 )
Matches found per iteration: 2
Elapsed Time: 1.37 s, 1372.69 ms, 1372693 µs
Matches per sec: 72,849
Regex2: (?s)\[cust\]:(.*?)(?=\[\w+\]:|$)
Options: < none >
Completed iterations: 50 / 50 ( x 1000 )
Matches found per iteration: 2
Elapsed Time: 0.92 s, 918.17 ms, 918175 µs
Matches per sec: 108,911
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.