正則表達式：賽后采取一切措施

Question

我在數據框中有很多字符串，一個例子是：

adrianos ristorante 2930 beverly glen circle los angeles 310475 9807 italian

我想在電話號碼后輸入所有的單詞/字符。 我有用於獲取電話號碼和（ ([0-9]{6}\\s[0-9]{4})\\s ）之后的空格的正則表達式。 我想要的是這之后的所有角色。 在這種情況下，它是italian但可能是asian fusion或indian and thai這樣的東西。

Answer 1

在熊貓中，您可以使用

[0-9]{6}\s[0-9]{4}\s+(.+)
                    ^^^^^

代碼看起來像

df['col'].str.extract('[0-9]{6}\s[0-9]{4}\s+(.+)')

請注意，應使用捕獲組(...)包裝需要提取的部分。 參見熊貓參考：

pat ： 字符串

具有捕獲組的正則表達式模式

Answer 2

您可以執行（在Notepad ++中）：

查找內容：（。 ）（[0-9] {6} \\ s [0-9] {4}）\\ s（。 ）替換為：$ 3

$ 3給出第三個參數，它是匹配電話號碼之后的所有內容。

Answer 3

使用以下正則表達式：/([ /([0-9]{6}\\s[0-9]{4})\\s(.*$)/m

在第二個捕獲組中，您將在電話號碼之后直到行尾為止有任何內容（如果要在字符串末尾之前得到所有內容，則可以省略m標志）。

Answer 4

您可以使用正向后面：

(?<=[0-9]{6}\s[0-9]{4}\s).*

正則表達式101 。

正則表達式：賽后采取一切措施

問題描述

4 個解決方案

解決方案1
2 已采納 2018-07-03 13:41:46

解決方案2
0 2018-07-03 12:41:23

解決方案3
0 2018-07-03 12:42:28

解決方案4
0 2018-07-03 12:48:28

正則表達式：賽后采取一切措施

問題描述

4 個解決方案

解決方案1 2 已采納 2018-07-03 13:41:46

解決方案2 0 2018-07-03 12:41:23

解決方案3 0 2018-07-03 12:42:28

解決方案4 0 2018-07-03 12:48:28

解決方案1
2 已采納 2018-07-03 13:41:46

解決方案2
0 2018-07-03 12:41:23

解決方案3
0 2018-07-03 12:42:28

解決方案4
0 2018-07-03 12:48:28