![](/img/trans.png)
[英]find index of a value before the maximum for each column in python dataframe
[英]How to find maximum value of a column in python dataframe
我在pyspark
有一個數據框。 在這個數據框中,我有一個名為id
列是唯一的。
現在我想在數據框中找到列id
的maximum
。
我嘗試過如下
df['id'].max()
但得到以下錯誤
TypeError: 'Column' object is not callable
請告訴我如何在數據框中找到列的maximum
在@Dadep的回答中,鏈接給出了正確的答案
如果您使用pandas .max()
將起作用:
>>> df2=pd.DataFrame({'A':[1,5,0], 'B':[3, 5, 6]})
>>> df2['A'].max()
5
否則,如果它是spark
數據幀:
我來自scala,但我相信這也適用於python。
val max = df.select(max("id")).first()
但您首先導入以下內容:
import org.apache.spark.sql.functions.max
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.