
[英]How to add zero values to datetime-indexed Pandas dataframe, e.g. for subsequent graphing
[英]Pandas Dataframe: Finding entries that share values (e.g. all games that contain a player)
我有一个关于我的羽毛球俱乐部的CSV文件的游戏历史。 我希望能够找到有关包含给定玩家的游戏的信息(例如,“Bill”最常玩的人是谁?)。 以下是两轮三场比赛的示例:
import pandas as pd
player_data = player_data = pd.DataFrame(data=[
('2018-06-12', 1, 1, 1, 'Adam'),
('2018-06-12', 1, 1, 2, 'Bill'),
('2018-06-12', 1, 1, 3, 'Cindy'),
('2018-06-12', 1, 1, 4, 'Derek'),
('2018-06-12', 1, 2, 1, 'Edward'),
('2018-06-12', 1, 2, 2, 'Fred'),
('2018-06-12', 1, 2, 3, 'George'),
('2018-06-12', 1, 2, 4, 'Harry'),
('2018-06-12', 1, 3, 1, 'Ian'),
('2018-06-12', 1, 3, 2, 'Jack'),
('2018-06-12', 1, 3, 3, 'Karl'),
('2018-06-12', 1, 3, 4, 'Laura'),
('2018-06-12', 2, 1, 1, 'Karl'),
('2018-06-12', 2, 1, 2, 'Cindy'),
('2018-06-12', 2, 1, 3, 'Bill'),
('2018-06-12', 2, 1, 4, 'Derek'),
('2018-06-12', 2, 2, 1, 'Max'),
('2018-06-12', 2, 2, 2, 'George'),
('2018-06-12', 2, 2, 3, 'Fred'),
('2018-06-12', 2, 2, 4, 'Ian'),
('2018-06-12', 2, 3, 1, 'Nigel'),
('2018-06-12', 3, 3, 2, 'Edward'),
('2018-06-12', 3, 3, 3, 'Harry'),
('2018-06-12', 3, 3, 4, 'Adam')],
columns=['Date', 'Round #', 'Court #', 'Space', 'Name'])
但是,由于每一行都是单个玩家的条目,因此只需按名称进行定位即可
player_data.loc[player_data['Name'] == 'Bill']
只会返回Bill的个人条目,如下所示:
Date Round # Court # Space Name
1 2018-06-12 1 1 2 Bill
14 2018-06-12 2 1 3 Bill
...当我想要的是一个新的数据框,其中包含Bill所玩的所有游戏条目,这样在这种情况下它将显示为:
Date Round # Court # Space Name
0 2018-06-12 1 1 1 Adam
1 2018-06-12 1 1 2 Bill
2 2018-06-12 1 1 3 Cindy
3 2018-06-12 1 1 4 Derek
12 2018-06-12 2 1 1 Karl
13 2018-06-12 2 1 2 Cindy
14 2018-06-12 2 1 3 Bill
15 2018-06-12 2 1 4 Derek
我认为将原始数据帧转换为一个单独的游戏可能更容易,其中每个条目都是一个单独的游戏,该游戏的所有玩家名称都列在元组中,因此检查“名称中的名称是否相对简单” “? 例如
Date Round # Court # Names
0 2018-06-12 1 1 (Adam, Bill, Cindy, Derek)
......但也许这会导致其他问题。
使用merge
后的过滤器
s1=player_data.loc[player_data['Name'] == 'Bill',['Date','Round #','Court #']]
s2=s1.merge(player_data,how='left')
s2
Out[12]:
Date Round # Court # Space Name
0 2018-06-12 1 1 1 Adam
1 2018-06-12 1 1 2 Bill
2 2018-06-12 1 1 3 Cindy
3 2018-06-12 1 1 4 Derek
4 2018-06-12 2 1 1 Karl
5 2018-06-12 2 1 2 Cindy
6 2018-06-12 2 1 3 Bill
7 2018-06-12 2 1 4 Derek
我的方法是:
bill_player_data = player_data.loc[player_data['Name'] == 'Bill']
ro = bill_player_data['Round #']
co = bill_player_data['Court #']
bill = player_data.loc[player_data['Round #'].isin(ro)]
bill = bill.loc[bill['Court #'].isin(co)]
bill
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.