繁体   English   中英

如何使用Google Data Studio中的REGEXP_EXTRACT从URL路径中提取年份?

[英]How to extract the year from a URL path using REGEXP_EXTRACT in Google Data Studio?

我正在构建一个Google Data Studio仪表板,我需要为发布的年份创建一个计算字段。 年份位于URI路径中,但是我不确定如何使用REGEXP_EXTRACT提取REGEXP_EXTRACT 我尝试了此处提出的许多解决方案,但似乎都无法在Data Studio上使用。

简而言之,我有一个像这样的URI: /theme/2019/jan/blog-post-2019/

如何使用REGEXP_EXTRACT函数获取theme//jan之前的第一个2019?

尝试这个:

REGEXP_EXTRACT(Page, 'theme\/([0-9]{4})\/[a-z]{3}\/') 

哪里:

  • theme\\/字面意思是“ theme /”;
  • ([0-9]{4})是一个捕获组,包含从0到9的4个字符(即四位数);
  • \\/[az]{3}\\/表示一个斜杠,后跟3个小写字母(假设您希望正则表达式与所有月份匹配),再跟一个斜杠。 如果您想要更严格的限制,请在最后一部分尝试使用\\/(?:jan|feb|mar|...)\\/

参见演示

正如您提到的,我认为您只想提取字符串之间的年份。 以下将为您实现。

根据您的需求适合查询

 SELECT * 
 FROM Sample_table
 WHERE REGEXP_EXTRACT(url, "(?<=\/theme\/)(?<year>\d{4})(?=\/[a-zA-Z]{3})")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM