正則表達式以匹配不同的單詞以及減號后的所有內容

Question

我有幾種鼻塞線的變體，我需要弄清楚它的中間部分。 幸運的是，該模式只有幾個變體，但我無法使其適用於所有變體。

1 INT. HIGH SCHOOL - DAY 1
EXT. HOUSE - NIGHT
2A INT. HOSPITAL - NIGHT 2A
3. EXT. AIRPORT - DAY 3.
4B. INT. MALL - NIGHT 4B.

我想要實現的是使字符串從INT或EXT一直到最后一個單詞，不包括數字/字母或點組合。 我想要這個：

INT. HIGH SCHOOL - DAY 
EXT. HOUSE - NIGHT
INT. HOSPITAL - NIGHT
EXT. AIRPORT - DAY
INT. MALL - NIGHT

正則表達式中有沒有一種干凈的方法

我得到的最好的是使用此：

@"(?:INT|EXT:).*$")

不幸的是，它僅返回從INT開始直到結尾的字符串，但不適用於EXT，也不會刪除結尾的數字/字母或點。

Answer 1

您不需要使用Regex-一種有效的linq解決方案：

var str = "1 INT.HIGH SCHOOL -DAY 1";
var newStr = String.Join(" ",str.Split().Where(s => !s.Any(c => Char.IsDigit(c)))).Trim();
Console.WriteLine(newStr);  // INT.HIGH SCHOOL -DAY

Answer 2

你可以試試這個：

((?:INT|EXT).*?)\s*\S*$

(?:INT|EXT) ：匹配INT或EXT
.*? ：匹配一切
\\s*\\S*$ ：匹配行的最后一個字符（但是不包含在de匹配部分內）

例

Answer 3

這可以正常工作並提供您所需的結果：

@".*((?:INT. |EXT. )[A-Za-z\\. \\-]+).*$"

使用方法如下：

var vMatch = Regex.Match("1 INT. HIGH SCHOOL - DAY 1", @".*((?:INT. |EXT. )[A-Za-z\. \-]+).*$");
var extracted = vMatch.Groups[1].Value.Trim();

extracted包含INT. HIGH SCHOOL - DAY INT. HIGH SCHOOL - DAY根據要求的天數

Answer 4

https://regex101.com/r/zC8mG5/9

replace: (\d\w?\.? ?)(.*)\1
     to: \2

這適合你嗎？

Answer 5

這是一種非正則表達式方法，可以按預期工作：

 string[] prefixes = { "INT", "EXT" };
 for (int i = 0; i < list.Count; i++)
 {
    string oldS = list[i].Trim();
    int indexOflastSpace = oldS.LastIndexOf(' ');
    int endIndex = oldS.Length - 1;
    if(indexOflastSpace >= 0)
    {
        string rest = oldS.Substring(indexOflastSpace).TrimStart();
        // starts the last token with a digit?
        if(char.IsDigit(rest[0]))
            endIndex = indexOflastSpace;
    }
    int start = 0;
    int indexOfAnyPrefix = prefixes
        .Select(p => oldS.IndexOf(p, StringComparison.InvariantCultureIgnoreCase))
        .Where(index => index >= 0)
        .DefaultIfEmpty(-1)
        .First();
    if(indexOfAnyPrefix > 0)
        start = indexOfAnyPrefix;
    string newS = oldS.Substring(start, endIndex - start);
    list[i] = newS;
}

Answer 6

Regex和Linq的替代方法（在線嘗試）：

string s = @"1 INT. HIGH SCHOOL - DAY 1
EXT. HOUSE - NIGHT
2A INT. HOSPITAL - NIGHT 2A
3. EXT. AIRPORT - DAY 3.
4B. INT. MALL - NIGHT 4B.";

const string startWithNum = @"^\d";
foreach (var line in s.Split('\r', '\n').Select(item => new List<string>(item.Split(' '))))
{
    if (Regex.IsMatch(line[0], startWithNum))
        line.RemoveAt(0);
    if (Regex.IsMatch(line[line.Count - 1], startWithNum))
        line.RemoveAt(line.Count - 1);
    Console.WriteLine(String.Join(" ", line));
}

輸出：

INT. HIGH SCHOOL - DAY
EXT. HOUSE - NIGHT
INT. HOSPITAL - NIGHT
EXT. AIRPORT - DAY
INT. MALL - NIGHT

Answer 7

這就是我的方法。 我喜歡使用IgnorePatternWhitespace選項來提高表達式的可讀性。

我將數據顯示為一個塊，但是如果逐行處理它也可以使用。

var text = "1 INT. HIGH SCHOOL - DAY 1" + Environment.NewLine;
text += "EXT. HOUSE - NIGHT" + Environment.NewLine;
text += "INT. HOSPITAL - NIGHT 2A" + Environment.NewLine;
text += "3. EXT. AIRPORT - DAY 3." + Environment.NewLine;
text += "4B. INT. MALL - NIGHT 4B." + Environment.NewLine;

var options = RegexOptions.IgnoreCase | RegexOptions.Multiline | RegexOptions.IgnorePatternWhitespace;
var regex = new Regex("^ .*? (?<slug> (?:INT|EXT)\\. .*?) (?:\\s+?\\d.*?)? $", options );

var matches = regex.Matches( text );

foreach( Match m in matches ){
    Console.WriteLine( "|" + m.Groups["slug"].Value + "|" );
}

產生：

|INT. HIGH SCHOOL - DAY|
|EXT. HOUSE - NIGHT |
|INT. HOSPITAL - NIGHT|
|EXT. AIRPORT - DAY|
|INT. MALL - NIGHT|

正則表達式以匹配不同的單詞以及減號后的所有內容

問題描述

7 個解決方案

解決方案1
1 2015-06-11 10:10:28

解決方案2
0 2015-06-11 10:02:04

解決方案3
0 2015-06-11 10:09:29

解決方案4
0 2015-06-11 10:11:34

解決方案5
0 2015-06-11 10:17:40

解決方案6
0 2015-06-11 10:40:41

解決方案7
0 2015-06-11 16:26:37

正則表達式以匹配不同的單詞以及減號后的所有內容

問題描述

7 個解決方案

解決方案1 1 2015-06-11 10:10:28

解決方案2 0 2015-06-11 10:02:04

解決方案3 0 2015-06-11 10:09:29

解決方案4 0 2015-06-11 10:11:34

解決方案5 0 2015-06-11 10:17:40

解決方案6 0 2015-06-11 10:40:41

解決方案7 0 2015-06-11 16:26:37

解決方案1
1 2015-06-11 10:10:28

解決方案2
0 2015-06-11 10:02:04

解決方案3
0 2015-06-11 10:09:29

解決方案4
0 2015-06-11 10:11:34

解決方案5
0 2015-06-11 10:17:40

解決方案6
0 2015-06-11 10:40:41

解決方案7
0 2015-06-11 16:26:37