簡體 English 中英

如何用 lambda function 為 pyspark 數據幀編寫 reduce？

[英]How to write reduce with lambda function for pyspark data-frame?

原文 2020-08-20 14:14:35 4 1 python/ dataframe/ lambda/ pyspark

我想用 lambda 實現 reduce function。例如，如果有 pyspark 數據框並且在某個列上，我想獲取那些列值長度在某個范圍之間的所有記錄。 這是如何使用 reduce function 和 lambda 來實現的。我嘗試用下面的代碼來實現它，但我不太確定。

bad_df = reduce(lambda x, (min < f.col(x) < max for x in df.columns if x in col_list))

col_list有我想檢查列值是否在范圍內的列列表。

1 個解決方案

從問題和方法來看，我了解到您想驗證col_list中的所有列是否都具有(min, max)內的值。

解決方案


total = df.count
ans = True

for col_name in col_list:
    
    #check if all values of that column lie within the range
    match_count = df.where(min < col(col_name) < max).count

    
    ans = count == match_count
    
    #if not then no need to go further
    if not ans:
         break

如何將 pyspark 數據幀中的時間戳列值減少 1 毫秒

[英]how to reduce timestamp column value in pyspark data-frame by 1 ms

如何將一個數據幀的連接值插入Pyspark中的另一個數據幀？

[英]How to insert concatenated values from a data-frame into another data-frame in Pyspark?

如何遍歷 pyspark 中未知數據幀的列的行

[英]How to iterate through rows of a column of a unknown data-frame in pyspark

如何用另一個數據框替換部分數據框

[英]How to replace part of the data-frame with another data-frame

如何將變量值分配為 pyspark 數據框中的新列值？

[英]How to assign variable value as new column value in pyspark data-frame?

使用 function 創建數據框列

[英]Using a function to create a data-frame column

應用 function 不適用於數據框列

[英]Apply function is not working on a data-frame column

將年齡函數應用於數據框列

[英]Applying age function to data-frame column

如何將數據幀記錄到輸出文件

[英]How to log a data-frame to an output file

如何刪除數據框列的標題

[英]how to drop the title for data-frame columns

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何將 pyspark 數據幀中的時間戳列值減少 1 毫秒如何將一個數據幀的連接值插入Pyspark中的另一個數據幀？如何遍歷 pyspark 中未知數據幀的列的行如何用另一個數據框替換部分數據框如何將變量值分配為 pyspark 數據框中的新列值？使用 function 創建數據框列應用 function 不適用於數據框列將年齡函數應用於數據框列如何將數據幀記錄到輸出文件如何刪除數據框列的標題

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM