簡體   English   中英

解析波斯語單個句子的正則表達式是什么?

[英]What is a regular expression for parsing out persian individual sentences?

我正在尋找一個好的.NET正則表達式,可用於從波斯語文本中解析出單個句子。
所以我想到了使用模式來進行分割,就像一個. ؟ ! ؛跟隨一個空格,然后進行分割。
波斯語沒有大寫字母,問號是؟ 以及從右到左的語言。 看這個例子,它有4個句子:

راهیکهبرایتهموارنیستوتوازمیانتمامدغدغه‌هایریزودرشتاینشهرانتخابمی‌ینکترور。 برویبهدقیقه91؛ به‌جاییکهباتمامشنیده‌هایتفرقدارد。 برویبهمرزبیندنیاوآخرت,به‌جاییکهعروجیانراتطهیرمی‌کنند,آرایشمی‌کنندبرای

我發現這個問題很有用。解析單個句子的正則表達式是什么? 這是英語的正則表達式

    Regex rx = new Regex(@"(\S.+?[.!?])(?=\s+|$)");
foreach (Match match in rx.Matches(str)) {
    int i = match.Index;
    Console.WriteLine(match.Value);
}

怎么樣: DEMO

([^!؟.؛]+[؟.؛!])

哪個匹配不包含這些字符的所有內容,然后是標點符號?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM