繁体   English   中英

从 pandas.dataframe 中提取特定列

[英]Extracting specific columns from pandas.dataframe

我正在尝试使用 python 读取我的 csv 文件将特定列提取到pandas.dataframe并显示该数据帧。 但是,我没有看到数据框,我收到 Series([], dtype: object) 作为输出。 以下是我正在使用的代码:我的文档包括:product sub_product issue sub_issue consumer_complaint_narrative
company_public_response 公司州邮政编码标签
consumer_consent_provided submit_via date_sent_to_company
company_response_to_consumer及时_响应consumer_disputed?
投诉号码

我想提取:sub_product issue sub_issue consumer_complaint_narrative

import pandas as pd

df=pd.read_csv("C:\\....\\consumer_complaints.csv")
df=df.stack(level=0)
df2 = df.filter(regex='[B-F]')
df[df2]
import pandas as pd

input_file = "C:\\....\\consumer_complaints.csv"
dataset = pd.read_csv(input_file)
df = pd.DataFrame(dataset)
cols = [1,2,3,4]
df = df[df.columns[cols]]

在此指定要选择的列号。 在数据框中,列从索引 = 0 开始

cols = []

您也可以按名称选择列。 只需使用以下行

df = df[["Column Name","Column Name2"]]

实现此目的的简单方法如下:

df = pd.read_csv("C:\\....\\consumer_complaints.csv")
df2 = df.loc[:,'B':'F']

希望有帮助。

这对我有用,使用切片:

df=pd.read_csv

df1=df[n1:n2]

其中 $n1<n2# 都是范围内的列,例如:如果您想要第 3-5 列,请使用:

df1=df[3:5]

对于第一列,使用 df1=df[0]

虽然不确定如何选择不连续的列范围。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM