[英]Pandas: Filling column in dataset with data from another dataset based on matching columns in the two datasets
[英]Loaded two datasets into python and want to take a column from second dataset and put into first dataset
[在此处输入图像描述][1][在此处输入图像描述][2]我想将第二个数据集中的一列添加到第一个数据集中。 基本上我在 python 中加载了两个数据集,并想从第二个数据集中添加年龄列,并将其作为第一个数据集的列,它没有年龄列。 我的最终目标是没有年龄列的第一个数据集,现在拥有第二个数据集具有的年龄列。 有没有办法做到这一点? 当我尝试使用合并 function 时,我的代码出现错误。 我应该怎么办?
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
pd.set_option('display.max_columns', 100) #2443
df= pd.read_csv('genedata.csv')
df
df1=pd.read_csv('traits.csv')
df1
df2= pd.merge(df,df1)
MergeError : No common columns to perform merge on. Merge options: left_on=None, right_on=None, left_index=False, right_index=False
No common columns to perform merge on. Merge options: left_on=None, right_on=None, left_index=False, right_index=False
简短的回答:
df = pd.read_csv('genedata.csv')
df1 = pd.read_csv('traits.csv')
df['age'] = df1['age_column_from_second_source']
请注意,这假设您的 dataframe 尺寸长度相等
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.