[英]Selecting a dataframe column without dropping the label
如何选择数据框列df ['col'],而不删除列名?
df
index colname col1 col2 col3
1 0 1 2
2 3 4 5
3 6 7 8
4 9 10 11
所需的输出:
df['col1']
index colname col1
1 0
2 3
3 6
4 9
编辑:作为正确答案,df [['col1']]完成了工作...现在更加棘手。 如果列是多索引的怎么办?
df grpname A B ... Z
index colname cA1 ... cAN cB1 ... cBN ... cZ1 ... cZN
1 a11 ... a1N b11 ... b1N ... z11 ... z1N
2 a21 ... a2N b21 ... b2N ... z21 ... z2N
3 a31 ... a3N b31 ... b3N ... z31 ... z3N
4 a41 ... a4N b41 ... b4N ... z41 ... z4N
我想得到
df grpname A
index colname cA1 cA2
1 a11 a12
2 a21 a22
3 a31 a32
4 a41 a42
看起来.xs()仅允许我检索某个列,即df.xs(('A','cAi'),level =('grpname','colname'),axis = 1,drop_level = False) ),而df [[''A']] ['cA1':'cAi']也不起作用?
对于单列选择,然后df['col']
将返回一个序列,如果要保留列名,则需要双下标,这将返回一个数据帧:
In [2]:
import pandas as pd
pd.set_option('display.notebook_repr_html', False)
import io
temp = """index col1 col2 col3
1 0 1 2
2 3 4 5
3 6 7 8
4 9 10 11"""
df = pd.read_csv(io.StringIO(temp), sep='\s+',index_col=[0])
df
Out[2]:
col1 col2 col3
index
1 0 1 2
2 3 4 5
3 6 7 8
4 9 10 11
In [4]:
df[['col1']]
Out[4]:
col1
index
1 0
2 3
3 6
4 9
与此形成对比:
In [5]:
df['col1']
Out[5]:
index
1 0
2 3
3 6
4 9
Name: col1, dtype: int64
编辑 @joris指出,您可以看到名称显示在输出的底部,该名称不会丢失,因为只是一个不同的输出
如果您确定每一列都占用了空间,则有一种方法可以做到这一点。 这是例子...
np.loadtxt("df.txt",
dtype={
'names': ('index', 'colname', 'col1', 'col2', 'col3'),
'formats': (np.float, np.string, np.float, np.float, np.float)},
delimiter= ' ', skiprows=1)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.