需要 Hive 相當於 oracle 的 regexp_extract 來提取模式之間的文本

Question

我的數據如下所示：

bizunit
nam-bu1-us-credit
nam-bu2-us-debit
latam-bu3-mx-debit

現在我想將nam & latam提取到一個名為region的單獨列中， bu2 bu1 、 bu2 、 bu3提取到一個名為business unit的單獨列中，並將us , mx提取到一個名為country的單獨列中。

我將使用什么 hive 函數和 SQL？ 請分享一個示例 hive SQL 將上述數據拆分為 3 列以按上述方式提取。

Answer 1

CREATE TABLE myTably(
  myText string
  )
INSERT INTO TABLE concat_test VALUES 
  ('nam-bu1-us-credit'), 
  ('nam-bu2-us-debit'), 
  ('latam-bu3-mx-debit');

這是提取地區、業務單位和國家的查詢

select 
regexp_extract(myText, '([^-]+)-([^-]+)-([^-]+)-', 1),
regexp_extract(myText, '([^-]+)-([^-]+)-([^-]+)-', 2),
regexp_extract(myText, '([^-]+)-([^-]+)-([^-]+)-', 3) from MyTable

需要 Hive 相當於 oracle 的 regexp_extract 來提取模式之間的文本

問題描述

1 個解決方案

解決方案1
0 2021-10-14 18:44:34

需要 Hive 相當於 oracle 的 regexp_extract 來提取模式之間的文本

問題描述

1 個解決方案

解決方案1 0 2021-10-14 18:44:34

解決方案1
0 2021-10-14 18:44:34