[英]Pandas Iterate over dataframe columns
對於字典格式的數據到熊貓,如果任何值超出68和72的范圍,如何標記數據集(熊貓數據框中的列)?
df = pd.DataFrame(dict(a=[71.5,72.8,79.3],
b=[70.2,73.3,74.9],
c=[63.1,64.9,65.9],
d=[70.1,70.4,70.9]))
我要嘗試做的是,如果任何數據不在68和72的范圍內,則創建一個單獨的列名稱的pandas數據框。
df_OutOfRange=df[(df.columns<68) | (df.columns>72)]
df_OutOfRange
采用
In [48]: ((df < 68) | (df > 72)).any()
Out[48]:
a True
b True
c True
d False
dtype: bool
要么,
In [49]: (df.lt(68) | df.gt(72)).any()
Out[49]:
a True
b True
c True
d False
dtype: bool
要么,
In [62]: df.apply(lambda x: ~x.between(68, 72).all())
Out[62]:
a True
b True
c True
d False
dtype: bool
細節
In [50]: df
Out[50]:
a b c d
0 71.5 70.2 63.1 70.1
1 72.8 73.3 64.9 70.4
2 79.3 74.9 65.9 70.9
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.