簡體 English 中英

如何在兩個 CSV 文件中找到所有可能的列集作為主鍵和外鍵候選者？

[英]How to find all possible column sets as primary key & foreign key candidates in two CSV files?

原文 2022-12-11 22:07:34 0 1 python/ sql/ sql-server/ pandas/ python-itertools

我有 2 個 CSV 文件，PAYMENT 和 CUSTOMER（未規范化，例如，真實文件每個最多 100 列）：

ID, CUST_NAME, CUST_NUM, CLIENT_NAME, PAYMENT_NUM, START_DATE,  END_DATE
1,     CUST1,   A001,    CLIENT1,       10,        2018-04-01, 2018-04-02
2,     CUST1,   A001,    CLIENT1,       10,        2018-04-01, 2018-05-30
3,     CUST2,   A002,    CLIENT1,      101,        2018-04-02, 2018-04-03
4,     CUST2,   A002,    CLIENT1,      102,        2018-04-02, 2018-04-03

ID, CUST_NAME, CUST_NUM, AGE, GENDER, COUNTRY
1,     CUST1,   A001,     32,   M,       US
2,     CUST2,   A002,     34,   F,       CA
3,     CUST3,   A003,     45,   M,       US
4,     CUST4,   A004,     31,   F,       CA

如何在兩個 CSV 文件中找到所有可能的列集作為主鍵和外鍵候選者？

所需的 output：

CUSTOMER.CUST_NAME (PK), PAYMENT.CUST_NAME (FK)
CUSTOMER.CUST_NUM（PK），PAYMENT.CUST_NUM（FK）
CUSTOMER.CUST_NAME (PK)、CUSTOMER.CUST_NUM (PK)、PAYMENT.CUST_NAME (FK)、PAYMENT.CUST_NUM (FK)

我發現這個答案使用 pandas 和 itertools 來解決主鍵問題的第一部分。 如何進一步解決第二部分查找外鍵然后進行匹配呢？

1 個解決方案

嘗試遍歷從itertools.product()方法生成的所有組合。 使用df.isin()檢查第一個 csv 列中的值是否存在於第二個 csv 文件的相應列中。為了能夠匹配它們，請使用 Pandas 庫中的merge() function。

如何在兩個數據框中使用不同的主鍵和外鍵列名稱在 pandas 中進行 vlookup？

[英]How to do a vlookup in pandas with different primary key and foreign key column names in two dataframes?

合並列1中的鍵上的兩個csv文件

[英]Merging two csv files on the key in column 1

查詢保持外鍵關系的CSV文件？這可能嗎？

[英]Query CSV files maintaining foreign key relationship? Is this possible?

如何在CSV文件中查找為主鍵候選集設置的列？

[英]How to find a columns set for a primary key candidate in CSV file?

如何使用主鍵和外鍵約束？

[英]How to use primary and foreign key constraints?

SQLAlchemy：可以聲明性地將列聲明為主鍵嗎？

[英]SQLAlchemy: Possible to declare a column as primary key declaratively?

如何找出模型的列是否是外鍵？

[英]How to find out whether a model's column is a foreign key?

如何查找實例的所有Django外鍵引用

[英]How to find all Django foreign key references to an instance

需要 Django 多列主鍵和外鍵使用示例

[英]Django Multi Column Primary and Foreign Key usage example needed

如何插入表一個主鍵和兩個外鍵？

[英]How do I insert into a Table one Primary Key and Two Foreign Keys?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在兩個數據框中使用不同的主鍵和外鍵列名稱在 pandas 中進行 vlookup？合並列1中的鍵上的兩個csv文件查詢保持外鍵關系的CSV文件？這可能嗎？如何在CSV文件中查找為主鍵候選集設置的列？如何使用主鍵和外鍵約束？ SQLAlchemy：可以聲明性地將列聲明為主鍵嗎？如何找出模型的列是否是外鍵？如何查找實例的所有Django外鍵引用需要 Django 多列主鍵和外鍵使用示例如何插入表一個主鍵和兩個外鍵？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM