簡體   English   中英

熊貓找到具有唯一值的列

[英]Pandas find columns with unique values

我有兩個數據庫(每個數據庫都有1000個表),它們應該反映相同的數據,但是它們來自兩個不同的來源。 我比較了兩個表,以了解有什么區別,但是為此,我將兩個表加入了一個公共ID密鑰。 我手動檢查了表以查看ID密鑰是什么,但是當我必須檢查1000個表時,這樣做是不實際的。

在熊貓中,有沒有一種方法可以找到表中哪些列(或多個列)僅具有唯一值?

使用允許您查詢數據庫的Python庫(pymysql,psycopg2等)。 以編程方式使用數據庫中可用的元數據來遍歷表和列。 動態創建SQL查詢以比較“從表中選擇count(field)-count(distinct field)”。

或者,您也可以潛在地使用元數據查看每個表中的哪些列已建立索引。

提取相關元數據的SQL查詢將根據DBMS的類型而有所不同。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM