簡體   English   中英

如何在pydatatable中的數據框列上設置鍵?

[英]How to set a key on dataframe column in pydatatable?

我正在練習如何對pydatatable 的數據幀執行連接操作。

第一個 DT 創建如下,

DT_1=dt.Frame({"title": np.array(['stat','math','stat','math','esp']),
               "score": np.array([23,43,21,50,16])})

第二個 DT 創建如下,

DT_2=dt.Frame({"title": np.array(['stat','esp','math','stat']),
               "price": np.array([350,450,530,430])})

我在DT_2.key = "title"上設置一個鍵,因為它有重復的標題,它給出了一個鍵值錯誤: ValueError: Cannot set a key: the values are not unique

我想知道在 python 數據表中是否對密鑰強制執行唯一性? 而在R 數據表中不強制執行唯一性,並且允許重復的鍵值。

有沒有相關的參考文檔?

鍵列中的值必須是唯一的,請參閱此處的文檔: https : //datatable.readthedocs.io/en/latest/api/frame.html#datatable.Frame.key

您可以將鍵列視為將 Frame 轉換為行式字典,其中字典的“鍵”部分位於鍵列中,“值”部分位於所有其他列中. “鍵”可能由多列組成,在這種情況下,每行的鍵值是來自每個鍵列的值的元組。

因此,數據表的鍵相當於熊貓的索引(通過.set_index() ),或 SQL 主鍵。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM