繁体   English   中英

如何根据另一个数据框的完整字符串列过滤 pandas dataframe 子字符串?

[英]How can I filter a pandas dataframe of substrings based on another dataframe's column of full strings?

我有两个 pandas 数据帧,我需要过滤 df2 并获得一个新的 df,其中只有基于 substring 匹配的匹配行。 我可以通过完全匹配来做到这一点,但不是部分匹配。 我已经尝试了一些事情,但无法弄清楚我错过了什么。

df1 看起来像:

      LEVEL    SO#     LI# BOMITEM              PRTNO  
0         1  00000  000000    0000     123-456789-001  
1         2  00000  000000    0000     123-456019-002 
2         3  00000  000000    0000     123-456029-003  
3         4  00000  000000    0000     123-456039-004  
4         5  00000  000000    0000     123-456049-005  

df2 看起来像:

                          name  test_table_id   pk version       Key_PN
0                Somename                  48   48     1.0
1                Somename                  48   49     1.1  123-456789-
2                Somename                  48  201     1.2  000-000000-000
3                Somename                  48  202     1.3  123-984560-000
4                Antoher name              193 194     1.0  123-984560-321

我正在寻找一个看起来像这样的 dataframe:

                          name  test_table_id   pk version       Key_PN
0                Somename                  48   48     1.1  123-456789-

这是我使用的代码,仅适用于完全匹配:

df 2= df2[pd.Series(list(df2['Key_PN']), index=df2.index).isin(list(df1['PRTNO']))]

使用正则表达式删除 df.PRTNO 中的最后 2 位数字,然后使用 .isin() 检查相似性

df2[df2.Key_PN.isin(df['PRTNO'].str.replace("\d+$",""))]



    name  test_table_id  pk  version       Key_PN
1  Somename             48  49      1.1  123-456789-

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM