[英]Python Pandas DataFrame User Defined Function Transformations
我有几个 DataFrame,我正在清理数据。 以下代码独立工作(在函数之外),但是,我必须将其应用于许多 DataFrame,并希望通过用户定义的 function 清理此过程。 您能否帮助解决以下问题,以便它可用于我的所有数据框。
def format_df(df):
df.columns = df.columns.str
df.dropna(thresh=1, axis='columns',inplace = True)
df.dropna(thresh=80,axis=0,inplace = True)
df.columns = df.iloc[0]
df = df.iloc[1:].reset_index(drop=True)
df.columns = df.columns.str.replace(' ','',regex=False)
df.columns = df.columns.str.replace('($)','',regex=False)
df.columns = df.columns.str.replace('(Y/N)','Flag',regex=False)
df.columns = df.columns.str.replace('(x)','',regex=False)
df.columns = df.columns.str.replace('-','',regex=False)
return df
df.columns = df.columns.str
行不会运行,因为 df.columns.str 是一个字符串方法,而 df.columns 是一个索引。 相反,您可以使用astype方法:
df.columns = df.columns.astype(str)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.