根据来自另一个熊猫数据框的列在熊猫数据框中创建新行

Question

我有一个数据框 DF1，它看起来像这样：

帐户名称	任务类型	旗帜	成本
账户 1	修理	真的	100 美元
账户 2	修理	真的	200 美元
账户 3	修理	错误的	300 美元

DF2 看起来像这样：

国家	百分比
我们	30%
加拿大	20%
印度	50%

我想通过执行以下操作基于 DF1 和 DF2 创建 DF3：

过滤标志 = True 的行
创建一个新列“Calculated_Cost”，它将 DF1 中的“Cost”列与 DF2 的百分比列相乘，并根据 DF2 中的行数创建多行

最终输出如下所示：

帐户名称	任务类型	旗帜	成本	国家	计算成本
账户 1	修理	真的	100 美元	我们	30 美元
账户 1	修理	真的	100 美元	加拿大	20 美元
账户 1	修理	真的	100 美元	印度	50 美元
账户 2	修理	真的	200 美元	我们	60 美元
账户 2	修理	真的	200 美元	加拿大	40 美元
账户 2	修理	真的	200 美元	印度	100 美元
账户 3	修理	错误的	300 美元	楠	楠

Answer 1

利用：

df1['Cost'] = df1['Cost'].str.lstrip('$').astype(int)
df2['Percentage'] = df2['Percentage'].str.rstrip('%').astype(int).div(100)

df = pd.concat([df1[df1['Flag']].merge(df2, how='cross'), df1[~df1['Flag']]])
df['Calculated_Cost'] = df['Cost'].mul(df.pop('Percentage'))
print (df)
  Account Name Task Type   Flag  Cost Country  Calculated_Cost
0    Account 1    Repair   True   100      US             30.0
1    Account 1    Repair   True   100  Canada             20.0
2    Account 1    Repair   True   100   India             50.0
3    Account 2    Repair   True   200      US             60.0
4    Account 2    Repair   True   200  Canada             40.0
5    Account 2    Repair   True   200   India            100.0
2    Account 3    Repair  False   300     NaN              NaN

Answer 2

我确信有一种更有效的方法可以做到这一点......但我使用以下代码完成了它：

import pandas as pd

df1 = pd.DataFrame(
    {
     'Account Name': ['Account 1', 'Account 2', 'Account 3'],
     'Task Type': ['Repair', 'Repair', 'Repair'],
     'Flag': ['True', 'True', 'False'],
     'Cost': ['$100', '$200', '$300']
       }
    )

df2 = pd.DataFrame(
    {
     'Country': ['US', 'Canada', 'India'],
     'Percentage': ['30%', '20%', '50%']
       }
    )

df1['Cost'] = df1['Cost'].str.lstrip('$').astype(int)
df2['Percentage'] = df2['Percentage'].str.rstrip('%').astype(int).div(100)
filtered_df_true = df1.loc[df1['Flag'] == 'True'] 
filtered_df_false = df1.loc[df1['Flag'] == 'False']
df3 = filtered_df_true.assign(key=1).merge(df2.assign(key=1), how = 'outer', on='key')
df3['Calculated Cost'] = df3['Cost']*df3['Percentage']
frames = [df3, filtered_df_false]
result = pd.concat(frames)
result.pop('key')
result.pop('Percentage')
print(result)

根据来自另一个熊猫数据框的列在熊猫数据框中创建新行

问题描述

2 个解决方案

解决方案1
1 2022-05-10 05:35:41

解决方案2
0 2022-05-11 10:02:44

根据来自另一个熊猫数据框的列在熊猫数据框中创建新行

问题描述

2 个解决方案

解决方案1 1 2022-05-10 05:35:41

解决方案2 0 2022-05-11 10:02:44

解决方案1
1 2022-05-10 05:35:41

解决方案2
0 2022-05-11 10:02:44