簡體 English 中英

如何計算pyspark數據框中一列中每個分類變量的頻率？

[英]How to count frequency of each categorical variable in a column in pyspark dataframe?

原文 2018-03-20 05:27:07 5 1 python/ pyspark/ spark-dataframe

假設我有一個pyspark數據框：

df.show()
+-----+---+
|  x  |  y|
+-----+---+
|alpha|  1|
|beta |  2|
|gamma|  1|
|alpha|  2|
+-----+---+

我想計算x欄中有多少個alpha ， beta和gamma出現。 如何在pyspark中做到這一點？

1 個解決方案

使用pyspark.sql.DataFrame.cube() ：

df.cube("x").count().show()

如何為多列在pyspark數據框中的一列中計算每個分類變量的頻率？

[英]How do I count frequency of each categorical variable in a column in pyspark dataframe for multiple columns?

Pyspark DataFrame - 如何將一列從分類值轉換為整數？

[英]Pyspark DataFrame - How to convert one column from categorical values to int?

自動計算python pandas中分類變量每列有多少個類別

[英]Count how many categories each column of categorical variable in python pandas automatically

每個分類變量的計數圖

[英]count plot for each categorical variable

dataframe 列中字符串的計數頻率

[英]dataframe count frequency of a string in a column

如何獲取列值的頻率計數，按另一列中的分類值排序

[英]How to get frequency count for a column value, sorted by aa categorical value in another column

查找 dataframe 中所有分類列中每個值的頻率

[英]Finding frequency of each value in all categorical columns across a dataframe

如何計算dataframe列中重復值的頻率？

[英]How can I count the frequency of repeated values in dataframe column?

如何從具有頻率計數的值創建數據框列？

[英]How to create a dataframe column from values with frequency count?

如何計算 pyspark dataframe 中多個分類列中出現的唯一數據

[英]How to count unique data occuring in multiple categorical columns from a pyspark dataframe

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何為多列在pyspark數據框中的一列中計算每個分類變量的頻率？ Pyspark DataFrame - 如何將一列從分類值轉換為整數？自動計算python pandas中分類變量每列有多少個類別每個分類變量的計數圖 dataframe 列中字符串的計數頻率如何獲取列值的頻率計數，按另一列中的分類值排序查找 dataframe 中所有分類列中每個值的頻率如何計算dataframe列中重復值的頻率？如何從具有頻率計數的值創建數據框列？如何計算 pyspark dataframe 中多個分類列中出現的唯一數據

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM