簡體   English   中英

如何在Hive中提取子字符串

[英]How to extract substring in Hive

我在嘗試在Hive中提取子字符串時遇到麻煩。 我正在處理的表格有一個名為Referee_dict的列,其中顯示了排名和相應的玩家ID。 例如,一條記錄可能如下所示:

[('Bronze1', [2738653, 2738652, 2738655]), ('Bronze2', [2738653, 2738652]), ('Bronze3', []), ('Silver1', []), ('Silver2', []), ('Silver3', [])

我試圖找到獲得銅牌2的球員,所以我想從列表中提取[2738653,2738652]。 我知道在Python中這很容易,但是,我查閱了Hive的文檔,但仍然不知道如何在sql / Hive中做到這一點。 任何幫助,將不勝感激!

好吧,我想我想出了一種方法..但是我不知道這是否是最簡單的方法。 由於它是一個字符串,因此我將使用正則表達式來捕獲“ Bronze1'[”之后和下一個“]”之前的子字符串。 我要使用的功能是
regexp_extract(字符串主題,字符串模式,int索引)。 如果有人有類似問題,希望這對您有所幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM