繁体   English   中英

熊猫加入具有不同索引级别/日期时间的数据框?

[英]Pandas joining dataframes with different index levels/datetime?

嗨,我有两个看起来像这样的DataFrames:

-------------------------------------------------
|      | dineType | menuName | unique | columns |
-------------------------------------------------
| date |          |          |        |         |
-------------------------------------------------
|%y%m%d|          |          |        |         |
-------------------------------------------------
...


-------------------------------------------------
|   | dineDate | dineType | menuName |         |
-------------------------------------------------
| 0 |  %Y%m%d  |          |          |         |
-------------------------------------------------
| 1 |          |          |          |         |
-------------------------------------------------
...

我想将两个数据框合并为一个输出。 如您所见,主要问题是每个表的索引都不同。 我希望输出遵循第二张表格的格式。 每个表的起始日期也不同。 我将如何加入这两个数据框?

如果看一下文档 ,它说您可以使用left_onright_onleft_indexright_index属性基于数据框中的列和索引进行连接。

pd.merge(df1, df2, left_index=True, right_on='dineDate')

可以使用pd.datetime类型代替日期使用特定格式的string datedineDate列转换为pd.datetime类型后,加入任务将无需进行其他工作即可工作。 你能做到这一点,假设数据来自CSV文件, parse_dates的选项pd.read_csv 要格式化输出,可以设置pd.DataFrame.to_csv`的date_format='%Y%m%d' of选项。

如果您需要更多详细信息,请提供示例代码。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM