[英]How Python pandas data-frame merge works in this case?
我正在尝试使用熊猫合并2个Excel工作表。
但是在内部合并中,它会丢失两个数据帧上的1条记录。 并在左侧合并给出一半的数据。
df1=pd.read_excel('output_may_tv.xlsx',sheet_name='Sheet2',index_col=None, header=None,names=['url'])
df2=pd.read_excel('output_may_2.xlsx',sheet_name='metadata',index_col=None, header=None,names=['title','synopsis','rs','rh','bs','bh','url','n','e','site'])
result1=df1.merge(df2,on='url')
最初,结果1在执行后减少了1个网址
result1=df1.merge(df2,how='left')
它显示了url,但该合并的行上缺少其他列数据
请任何人向我解释如何解决此问题。
缺少的网址是完全一样的,还是大写和非大写字母或空格不同? 将您的列转换为大写并删除空格:
df1['url'] = df1['url'].str.upper().str.strip()
并对df2执行相同操作。 然后尝试再次合并
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.