如何在pyspark中重命名数据框的列名？

Question

I want to rename one column name from dataframe columns, So currently the Column name is rate%year .我想从数据框列中重命名一个列名，所以目前列名是rate%year 。 I want to rename it as rateyear in pyspark .我想将其重命名为rateyear在pyspark 。

Possibly, we can rename columns at dataframe and table level after registering dataframe as table, but at table level "%" will create problem so i want to rename at dataframe level itelf.可能，我们可以在将数据帧注册为表后在数据帧和表级别重命名列，但在表级别“%”会产生问题，所以我想在数据帧级别重命名 itelf。

I tried this- data.selectExpr("rate%year as rateyear")我试过这个- data.selectExpr("rate%year as rateyear")

but getting this error pyspark.sql.utils.AnalysisException: u"cannot resolve 'rate' given input columns但收到此错误pyspark.sql.utils.AnalysisException: u"cannot resolve 'rate' given input columns

Thanks.谢谢。

Answer 1

Try this:尝试这个：

sqlContext.registerDataFrameAsTable(data, "myTable")
data = sqlContext.sql("SELECT rate%year AS rateyear from myTable")

Answer 2

I wrote an easy and fast function for you to remove % from column names.我为您编写了一个简单快速的函数来从列名中删除 %。 Enjoy!享受！ :) :)

def rename_cols(rename_df):
    for column in rename_df.columns:
        new_column = column.replace('%','')
        rename_df = rename_df.withColumnRenamed(column, new_column)
    return rename_df

Answer 3

Possible way of renaming at dataframe level-在数据帧级别重命名的可能方法-

oldColumns=['rate%year']
newColumns = ["rateyear"]
df1 = reduce(lambda df, idx: df.withColumnRenamed(oldColumns[idx], newColumns[idx]), xrange(len(oldColumns)), df)

this is working fine at dataframe level.这在数据帧级别工作正常。 any suggestion how to resolve at table level?任何建议如何在表级别解决？

Answer 4

Simple and quick way to alter dataframe column names.更改数据框列名称的简单快捷的方法。

def format_col(df):    
    cols = [col.replace("%", "") for col in df.columns]
    res_df = df.toDF(*cols)
    return res_df

如何在pyspark中重命名数据框的列名？

问题描述

4 个解决方案

解决方案1
2 2018-10-23 07:10:36

解决方案2
2 2019-02-28 17:00:06

解决方案3
0 已采纳 2018-10-23 07:23:39

解决方案4
0 2020-06-04 17:07:40

如何在pyspark中重命名数据框的列名？

问题描述

4 个解决方案

解决方案1 2 2018-10-23 07:10:36

解决方案2 2 2019-02-28 17:00:06

解决方案3 0 已采纳 2018-10-23 07:23:39

解决方案4 0 2020-06-04 17:07:40

解决方案1
2 2018-10-23 07:10:36

解决方案2
2 2019-02-28 17:00:06

解决方案3
0 已采纳 2018-10-23 07:23:39

解决方案4
0 2020-06-04 17:07:40