循环将创建新的Pandas.DataFrame列

Question

按照此处的scikit-learn教程进行操作后，如果我们有一个Pandas.DataFrame包含一个名为colors的列，那么我们如何创建一个循环以遍历DataFrame的所有列（或包含所需列的列表），以便所有分类变量（例如，可以具有blue ， red ， purple值的可变colors ）将替换为len(colors)个虚拟变量列colors#blue ， colors#red ， colors#purple ？

刚学过python，所以我将用一些伪代码编写我的想法。

尝试（伪代码）

cols_to_process = ['colors']

# Create new columns for dummy variables
// if listings.keyname in cols_to_process:
    // unique_values = list of unique values in listings[col]
    // listings = listings.join(unique_values, axis=1)

# Populate dummy variable columns

# Remove old columns that have dummy variable columns created

Answer 1

您可以使用pandas.get_dummies函数执行此操作：

>>> import pandas as pd
>>> pd.get_dummies(listings['color'], 'color')

Answer 2

因此，如果我了解您有一列具有一堆颜色的值，并且想要将这些值全部更改为该列的长度？ 这样可以做到：

df['column_name'] = len(df['column_name'])

如果那不是您想要的，请使您的问题更清楚

循环将创建新的Pandas.DataFrame列

问题描述

2 个解决方案

解决方案1
3 已采纳 2013-05-05 18:22:45

解决方案2
0 2013-05-05 13:41:14

循环将创建新的Pandas.DataFrame列

问题描述

2 个解决方案

解决方案1 3 已采纳 2013-05-05 18:22:45

解决方案2 0 2013-05-05 13:41:14

解决方案1
3 已采纳 2013-05-05 18:22:45

解决方案2
0 2013-05-05 13:41:14