[英]Replace multiple values in Pandas column without loop
我有Pandas数据帧,想要在df的特定列上替换很多值。
如何在没有循环的情况下实现以下代码?
for i in range(len(data.loc[:, 'CityID'])):
if data.loc[:, 'CityID'][i] == 1:
data.loc[:, 'CityID'][i] = 1
elif data.loc[:, 'CityID'][i] in (2, 3, 4, 21):
data.loc[:, 'CityID'][i] = 2
elif data.loc[:, 'CityID'][i] in (33, 34):
data.loc[:, 'CityID'][i] = 4
else:
data.loc[:, 'CityID'][i] = 3
采用:
m1 = data['CityID'] == 1
m2 = data['CityID'].isin([2, 3, 4, 21])
m3 = data['CityID'].isin([33, 34])
data['CityID'] = np.select([m1, m2, m3], [1,2,4], default=3)
您可以在pd.Series.map
使用字典:
d = {1: 1, 2: 2, 3: 2, 4: 2, 21: 2, 33: 4, 34: 4}
data['CityID'] = data['CityID'].map(d).fillna(3)
如果字典结构很费力,你可以使用解包:
d = {1: 1, **dict.fromkeys((2, 3, 4, 21), 2), **dict.fromkeys((33, 34), 4}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.