從 dataframe 中刪除多列

Question

我有以下代碼片段

{數據集： https://www.internationalgenome.org/data-portal/sample }

genome_data = pd.read_csv('../genome')
genome_data_columns = genome_data.columns

genPredict = genome_data[genome_data_columns[genome_data_columns != 'Geuvadis']]

這會刪除 Geuvadis 列，有沒有辦法可以包含多個列？

Answer 1

你可以不讀它們嗎？

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

read_csv 中的“usecols”選項允許您指定要包含在 DataFrame 中的數據列。

Venkatesh-PrasadRanganath 是如何刪除多列的正確答案。

但是，如果您想避免將數據讀入您不會使用的 memory 中，則基因組數據 = pd.read_csv('../genome', usecols=["only", "required", "columns"] 是語法使用。

Answer 2

您可以使用DataFrame.drop像genome_data.drop(['Geuvadis', 'C2', ...], axis=1) 。

Answer 3

我認為@Venkatesh-PrasadRanganath 的答案更好，但是對您的嘗試采取類似的方法，這就是我的做法。：

用columns.to_list()標識所有列
創建要排除的列列表
用list(set() - set())減去要從完整列表中排除的列

Select 其余列。

 genome_data = pd.read_csv('../genome') all_genome_data_columns = genome_data.columns.to_list() excluded_genome_data_columns = ['a', 'b', 'c'] #Type in the columns that you want to exclude here. genome_data_columns = list(set(all_genome_data_columns) - set(excluded_genome_data_columns)) genPredict = genome_data[genome_data_columns]

從 dataframe 中刪除多列

問題描述

3 個解決方案

解決方案1
1 2020-06-15 22:46:22

解決方案2
1 2020-06-15 23:15:28

解決方案3
0 2020-06-15 22:46:37

從 dataframe 中刪除多列

問題描述

3 個解決方案

解決方案1 1 2020-06-15 22:46:22

解決方案2 1 2020-06-15 23:15:28

解決方案3 0 2020-06-15 22:46:37

解決方案1
1 2020-06-15 22:46:22

解決方案2
1 2020-06-15 23:15:28

解決方案3
0 2020-06-15 22:46:37