簡體   English   中英

二進制數據上的熊貓Datframe sort_values

[英]Pandas Datframe sort_values on binary data

我是熊貓的新手,我有一個數據框,可以對二進制數據進行排序,以便將數據分隔為0和1。 我正在使用df.sort_valuesdf.sort_values每次都會以相同的方式對數據進行排序嗎?

編輯:這是我使用的數據框架的示例: 在此處輸入圖片說明

我想從第二列的數據框中進行排序。

這是我使用的代碼:

sort_data = df.sort_values(['Diagnosis'],axis=0,ascending=True)

快速回答者是:它取決於您的排序算法。

存在穩定不穩定的排序算法。 sort_values支持穩定的合並排序,但是具有不穩定的默認算法( quick sort )。 穩定的排序算法可以使具有相同鍵的元素的輸出保持與輸入相同的順序。

docs

kind:{'quicksort','mergesort','heapsort'},默認為'quicksort'

選擇排序算法。 有關更多信息,請參見ndarray.np.sort。 mergesort是唯一穩定的算法 對於DataFrames,僅在對單個列或標簽進行排序時才應用此選項。

因此,如果你選擇一個穩定的算法,它以同樣的方式將數據每一次排序。 但是,很高興知道您使用的排序算法的局限性。 在線上有一些不錯的資源

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM