按行切片 Pandas DataFrame

Question

我正在處理從 h5 文件作為hdf = pandas.HDFStore('Survey.h5')到 pandas package 加載的調查數據。在這個DataFrame中，所有行都是單個調查的結果，而列是答案針對單個調查中的所有問題。

我的目標是將此數據集縮減為較小的DataFrame ，其中僅包含對某個問題具有特定描述答案的行，即此列中的所有值都相同。 我能夠確定具有這種情況的所有行的索引值，但我找不到如何刪除這些行或僅使用這些行創建新的 df。

Answer 1

In [36]: df
Out[36]:
   A  B  C  D
a  0  2  6  0
b  6  1  5  2
c  0  2  6  0
d  9  3  2  2

In [37]: rows
Out[37]: ['a', 'c']

In [38]: df.drop(rows)
Out[38]:
   A  B  C  D
b  6  1  5  2
d  9  3  2  2

In [39]: df[~((df.A == 0) & (df.B == 2) & (df.C == 6) & (df.D == 0))]
Out[39]:
   A  B  C  D
b  6  1  5  2
d  9  3  2  2

In [40]: df.ix[rows]
Out[40]:
   A  B  C  D
a  0  2  6  0
c  0  2  6  0

In [41]: df[((df.A == 0) & (df.B == 2) & (df.C == 6) & (df.D == 0))]
Out[41]:
   A  B  C  D
a  0  2  6  0
c  0  2  6  0

Answer 2

如果您已經知道索引，則可以使用.loc ：

In [12]: df = pd.DataFrame({"a": [1,2,3,4,5], "b": [4,5,6,7,8]})

In [13]: df
Out[13]:
   a  b
0  1  4
1  2  5
2  3  6
3  4  7
4  5  8

In [14]: df.loc[[0,2,4]]
Out[14]:
   a  b
0  1  4
2  3  6
4  5  8

In [15]: df.loc[1:3]
Out[15]:
   a  b
1  2  5
2  3  6
3  4  7

Answer 3

如果您只需要獲得最top的行； 你可以使用df.head(10)

Answer 4

使用query來搜索特定條件：

In [3]: df
Out[3]: 
   age family   name
0    1      A   john 
1   36      A  jason 
2   32      A   jane 
3   26      B   jack 
4   30      B  james 

In [4]: df.query('age > 30 & family == "A"')
Out[4]: 
   age family   name
1   36      A  jason 
2   32      A   jane

按行切片 Pandas DataFrame

問題描述

4 個解決方案

解決方案1
40 已采納 2012-08-09 11:26:08

解決方案2
8 2016-12-11 03:14:24

解決方案3
0 2022-03-24 12:07:42

解決方案4
0 2022-06-10 20:00:15

按行切片 Pandas DataFrame

問題描述

4 個解決方案

解決方案1 40 已采納 2012-08-09 11:26:08

解決方案2 8 2016-12-11 03:14:24

解決方案3 0 2022-03-24 12:07:42

解決方案4 0 2022-06-10 20:00:15

解決方案1
40 已采納 2012-08-09 11:26:08

解決方案2
8 2016-12-11 03:14:24

解決方案3
0 2022-03-24 12:07:42

解決方案4
0 2022-06-10 20:00:15