繁体   English   中英

根据Python中的单元格值合并两个数据集

[英]Merge two datasets according to cell value in Python

我有两个数据集。 一个有多个观察结果如下图所示:

Name | Obs 1 | Obs 2 | Obs 3 | AX 0.04 ... ... BX 1.2 ... ... CX 0.5 ... ... DX ... ... ... EX ... ... ... FX ... ... ... GX 0.05 ... ...

我有第二个数据集,可以用比上面的数据集更少的行数来调用它,我想在上面的数据集中创建一个新列,并填写相应列的值,同时将其余列保留为黑色或 n/a,如图所示以下。

Name | Obs 1 | Obs 2 | Obs 3 | x | AX 0.04 ... ... 0.02 BX 1.2 ... ... n/a CX 0.5 ... ... n/a DX ... ... ... n/a EX ... ... ... -0.5 FX ... ... ... .004 GX 0.05 ... ... n/a

我如何用 Python 和 Pandas 管理这个? 我想 Python 可以搜索 name 列的相似性,这是相当直接的,但我不太确定如何创建适当的新列。

您可以将合并函数与您需要的第二个 df 列的子集一起使用:

df_merged = df_1.merge(df_2[['Name','X']], on='Name')

您可以在文档中找到更详细的帮助: https : //pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM