簡體   English   中英

在PySpark的數據框中獲得價值

[英]Getting value in a dataframe in PySpark

我有下面的數據框,我試圖獲取值3097作為一個整數,例如,將其存儲在python變量中以對其進行操作,然后將其乘以另一個int等。

在此處輸入圖片說明

我已經成功地獲得了成功,但是即使這是一個很好的方法,但我現在還是不知道,我仍然無法擁有作為整數的價值。

data.groupBy("card_bank", "failed").count().filter(data["failed"] == "true").collect()

在此處輸入圖片說明

您需要從序列中獲取row (用於循環或映射功能),然后根據https://spark.apache.org/docs/1.4.0/api/java/org/apache row.getInt(2) /spark/sql/Row.html

嘗試從spark數據框選擇值:-

df =data.groupBy("card_bank", "failed").count().filter(data["failed"] == "true").collect()
value = df.select("count").as[int].collect()

在這里,值將是一個列表。

使用索引0從Row對象獲取第一條記錄,並使用索引“ count”獲取值

from pyspark.sql.functions import col
data.groupby("card_bank", "failed").count().filter(col("failed") == "true").collect()[0]["count"]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM