使用另一個pandas DF的min值中的id填充pandas列

Question

我正在尋找迭代orders列表並為每個訂單分配所有者id 。 id在一個單獨的pandas dataframe （我也嘗試將其更改為Series和OrderedDict 。我想從df找到min值並將其用於order中的第一個orders ，然后將1添加到計數中id count ，並重復直到所有訂單都被填滿。

可重復的例子：

df = pd.DataFrame({'Id':['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'], 'count':[2, 3, 5, 6, 8, 9, 12, 13, 15, 55]})
orders = pd.DataFrame({'order_id':['a1', 'a2', 'a3', 'a4', 'a5', 'a6', 'a7', 'a8', 'a9', 'a10', 'a11', 'a12', 'a13']})
orders['newowner'] = ""

擁有者：

df
  Id  count
0  a      2
1  b      3
2  c      5
3  d      6
4  e      8
5  f      9
6  g     12
7  h     13
8  i     15
9  j     55

命令：

   order_id newowner
0        a1         
1        a2         
2        a3         
3        a4         
4        a5         
5        a6         
6        a7         
7        a8         
8        a9         
9       a10         
10      a11         
11      a12         
12      a13

預期結果：

   order_id newowner
0        a1       a    # brings a up to 3 records
1        a2       a    # a and b are tied with 3, so it goes to a again (doesn't matter which gets it first)
2        a3       b    # now b has 3, and a has 4, so it goes to b
3        a4       a    # both have 4 so a
4        a5       b    # etc.
5        a6       a
6        a7       b
7        a8       c
8        a9       a
9       a10       b
10      a11       c
11      a12       a
12      a13       b

我已經嘗試找到df.count的min，並嘗試遍歷每個，但我很難隔離每個訂單。

for order in orders.iteritems():
    order['newowner'] = df.count.min()

for order in orders.iteritems():
    for name in df.iteritems:
        idx = df[df.count == df.count.min()]['Id']
    order['newonwer'] = idx

Answer 1

這是通過df.apply一種方式：

def set_owner(order_id):
    min_idx = df['count'].idxmin()
    df.loc[min_idx, 'count'] += 1
    return df.loc[min_idx, 'Id']

orders['newowner'] = orders['order_id'].apply(set_owner)

orders
#    order_id newowner
# 0        a1        a
# 1        a2        a
# 2        a3        b
# 3        a4        a
# 4        a5        b
# 5        a6        a
# 6        a7        b
# 7        a8        c
# 8        a9        a
# 9       a10        b
# 10      a11        c
# 11      a12        d
# 12      a13        a

df
#   Id  count
# 0  a      8
# 1  b      7
# 2  c      7
# 3  d      7
# 4  e      8
# 5  f      9
# 6  g     12
# 7  h     13
# 8  i     15
# 9  j     55

Answer 2

我不確定這是我做的方式。 如果可能的話，我可能會尋找一種方法來使用df.apply 。 但我認為這段代碼會給你預期的結果。

for idx, order in orders.iterrows():
    idxmin = df['count'].idxmin()
    df.loc[idxmin, 'count'] += 1
    order['newowner'] = df.loc[idxmin,'Id']

使用另一個pandas DF的min值中的id填充pandas列

問題描述

2 個解決方案

解決方案1
2 已采納 2018-02-04 00:23:52

解決方案2
1 2018-02-04 00:08:01

使用另一個pandas DF的min值中的id填充pandas列

問題描述

2 個解決方案

解決方案1 2 已采納 2018-02-04 00:23:52

解決方案2 1 2018-02-04 00:08:01

解決方案1
2 已采納 2018-02-04 00:23:52

解決方案2
1 2018-02-04 00:08:01