簡體   English   中英

如何在python數據幀中查找列的最大值

[英]How to find maximum value of a column in python dataframe

我在pyspark有一個數據框。 在這個數據框中,我有一個名為id列是唯一的。

現在我想在數據框中找到列idmaximum

我嘗試過如下

df['id'].max()

但得到以下錯誤

TypeError: 'Column' object is not callable

請告訴我如何在數據框中找到列的maximum

在@Dadep的回答中,鏈接給出了正確的答案

如果您使用pandas .max()將起作用:

>>> df2=pd.DataFrame({'A':[1,5,0], 'B':[3, 5, 6]})
>>> df2['A'].max()
5

否則,如果它是spark數據幀:

獲取Spark數據幀列中最大值的最佳方法

我來自scala,但我相信這也適用於python。

val max = df.select(max("id")).first()

但您首先導入以下內容:

import org.apache.spark.sql.functions.max

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM