繁体   English   中英

获取2个熊猫列的范围列表

[英]Getting a list of the range of 2 pandas columns

我有以下DataFrame(重新格式化了一下):

    f_name  l_name      n   f_bought  l_bought
0   Abraham Livingston  24  1164      1187
1   John    Brown       4   1188      1191
2   Samuel  Barret      16  1192      1207
3   Nathan  Blodget     4   1208      1212
4   Bobby   Abraham     1   1212      1212

我想创建一个列, bought ,这是一个列表range(df[f_bought], df[l_bought])

我试过了:

def getRange(l1,l2):
    r = list(range(l1, l2))
df.apply(lambda index: getRange(df['f_bond'], df['l_bond']),axis=1)

但它导致TypeError:

"cannot convert the series to <type 'int'>", u'occurred at index 0'

我已经尝试过df.info(),并且两列的类型都是int64。

我想知道是否应该使用类似df.loc[]或类似的东西? 还是完全其他?

您应该能够使用apply来执行此操作, apply将功能应用于数据帧的每一行或每一列。

def bought_range(row):
    return range(row.f_bought, row.l_bought)

df['bought_range'] = df.apply(bought_range, axis=1)

结果是:

f_name      l_name   n  f_bought  l_bought  \
0  Abraham  Livingston  24      1164      1187   
1     John       Brown   4      1188      1191   
2   Samuel      Barret  16      1192      1207   
3   Nathan     Blodget   4      1208      1212   
4    Bobby     Abraham   1      1212      1212   

                                        bought_range  
0  [1164, 1165, 1166, 1167, 1168, 1169, 1170, 117...  
1                                 [1188, 1189, 1190]  
2  [1192, 1193, 1194, 1195, 1196, 1197, 1198, 119...  
3                           [1208, 1209, 1210, 1211]  
4                                                 []

一个警告是Python的range不包括上限:

In [1]: range(3, 6)
Out[1]: [3, 4, 5]

这并不难处理( return range(row.f_bought, row.l_bought + 1) ),但确实需要考虑在内。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM