在 BigQuery 中提取 Substring

Question

身體
/tpt/TpScaning-ScaningRoad-PERSIVEE-202301020730327429-1567651.tp
/tpt/TpScaning-BaliResortsInterns-PERSIVEE-202205300341154744-909890.tp
/tpt/TpScaning-RXX-PERSIVEE-202108210412090110-000989.tp
/tpt/TpScaning-Backnationnotecom-PERSIVEE-202112201229124214-783672.tp
/tpt/TpScaning-DBZ-PERSIVEE-202109131129036172-908954.tp
/tpt/TpScaning-DBZ-PERSIVEE-202109131129036172-17892578.tp

我在 BigQuery 表 xyz 中有一列“正文”，其中包含在我們的內部應用程序上請求的掃描。 正文字段包含其中的日期部分，即（202301020730327429、202205300341154744 ...）18 位數字。

我想在名為 date 的單獨列中提取這個 18 位序列，以了解掃描請求的創建時間。

我嘗試使用 substr function 但它無法正常工作，因為 Body 字段的長度在變化。 有沒有更好的方法來實現這個？

預計 output：

日期
202301020730327429
202205300341154744
202108210412090110
202112201229124214
202109131129036172
202109131129036172

Answer 1

您可以考慮以下。

WITH sample_table AS (
  SELECT '/tpt/TpScaning-ScaningRoad-PERSIVEE-202301020730327429-1567651.tp' body UNION ALL
  SELECT '/tpt/TpScaning-BaliResortsInterns-PERSIVEE-202205300341154744-909890.tp' body UNION ALL
  SELECT '/tpt/TpScaning-RXX-PERSIVEE-202108210412090110-000989.tp' body UNION ALL
  SELECT '/tpt/TpScaning-Backnationnotecom-PERSIVEE-202112201229124214-783672.tp' body UNION ALL
  SELECT '/tpt/TpScaning-DBZ-PERSIVEE-202109131129036172-908954.tp' body UNION ALL
  SELECT '/tpt/TpScaning-DBZ-PERSIVEE-202109131129036172-17892578.tp' body
)
SELECT *, PARSE_TIMESTAMP('%Y%m%d%H%M%E4S', LEFT(date, 14) || '.' || RIGHT(date, 4)) ts 
  FROM (
    SELECT *, REGEXP_EXTRACT(body, r'\d{18}') AS date FROM sample_table
  );

一些解釋

正則表達式解釋 -> https://regex101.com/r/fiB4mD/1
\d匹配 1 個數字（相當於 [0-9]）
{18}恰好與前一個標記匹配 18 次
REGEXP_EXTRACT function 將從給定的字符串數據中找到上面正則表達式中描述的模式。
%E4S格式元素用小數精度的數字解析秒，即00.0000 for %E4S 。 請注意，它在字符串數據中需要一個點 (.)。

查詢結果

Answer 2

還請考慮以下方法

select body, regexp_extract(body, r'\d{18}') as date,
  timestamp(regexp_replace(body, r'(^.*?)(\d{4})(\d{2})(\d{2})(\d{2})(\d{2})(\d{2})(\d{4})(.*?$)', r'\2-\3-\4 \5:\6:\7.\8')) as ts
from your_table

如果應用於您問題中的樣本數據 - output 是

在 BigQuery 中提取 Substring

問題描述

2 個解決方案

解決方案1
1 2023-01-05 14:18:28

一些解釋

解決方案2
1 已采納 2023-01-05 15:43:13

在 BigQuery 中提取 Substring

問題描述

2 個解決方案

解決方案1 1 2023-01-05 14:18:28

一些解釋

解決方案2 1 已采納 2023-01-05 15:43:13

解決方案1
1 2023-01-05 14:18:28

解決方案2
1 已采納 2023-01-05 15:43:13