繁体   English   中英

根据另一个CSV中的列过滤一个CSV

[英]Filtering one CSV based on a Column in another CSV

我有2个CSV文件。

第一个CSV是一个小型数据集,看起来像:

CSV ONE.csv`

COLUMN A    COLUMN B    COLUMN C    COLUMN D    COLUMN E
    1          XYZ          A            B           D
    2          YZX.12       E            F           G
    3          ZYX.567      H            I           J 

第二个CSV是一个更大的数据集,看起来像:

CSV TWO.csv

COLUMN A   COLUMN B   COLUMN C   COLUMN D   COLUMN E   COLUMN F   COLUMN G
   1        ZYX.567       A          B          D         AAA        ABB
   2        SAMPLE A      E          F          G         BBB        ACA  
   3        SAMPLE B      H          I          J         CCC        BBC 
   4        XYZ           A          B          D         ABA        BBA
   5        SAMPLE C      E          F          G         ABC        BAB
   6        YZX.12        H          I          J         CCA        CAC

我希望我的输出是CSV CSV 2,但仅使用CSV ONE的COLUMN B:

COLUMN A   COLUMN B   COLUMN C   COLUMN D   COLUMN E   COLUMN F   COLUMN G
   1        ZYX.567       A          B          D         AAA        ABB
   4        XYZ           A          B          D         ABA        BBA
   6        YZX.12        H          I          J         CCA        CAC

我正在使用Pandas数据框...非常感谢您提供的帮助。 谢谢。

这是一个merge问题,仅从正确的数据框中选择相关列。

df_merged = pd.merge(df1, df2[['COLUMN B', 'COLUMN F', 'COLUMN G']], on='COLUMN B', how='inner')

print(df_merged)
   COLUMN A COLUMN B COLUMN C COLUMN D COLUMN E COLUMN F COLUMN G
0         1      XYZ        A        B        D      ABA      BBA
1         2   YZX.12        E        F        G      CCA      CAC
2         3  ZYX.567        H        I        J      AAA      ABB

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM