繁体   English   中英

创建 Pandas DataFrame 时向行和列名称添加“名称”属性

[英]Add 'name' properties to row and column names when creating a pandas DataFrame

我正在创建一个 Pandas 数据框来了解如何处理丢失的数据。 我想要的是在创建 DataFrame 时将 Row 和 Column 名称添加到 DataFrame 中,而不是稍后使用 'df.index.name =' 和 'df.columns.name =' 传递它们。 我怎样才能做到这一点?

# Program to generate a m x n DataFrame with random NaN values scattered in:
import random
def df_maker(m, n): 
    df = pd.DataFrame(np.random.randint(1, 100, (m*n)).reshape(m, n), index = [f'Row {i+1}' for i in range(m)], columns = [f'Col {j+1}' for j in range(n)] )
    for i in range(m):
        df.iloc[[i],[random.randrange(n)]] = np.nan
    return df
df = df_maker(10, 10) 
df.index.name = 'Rows'
df.columns.name = 'Columns'
df

我尝试查找pandas.DataFramepandas.DataFrame.rename_axis和其他一些方法的文档,但找不到我要找的内容。 那么如何在不使用df.index.name = 'Rows'df.columns.name = 'Columns'情况下用 1 行代码创建上述数据df.columns.name = 'Columns' 谢谢。

创建分别代表行和列的Index对象:

def df_maker(m, n):
    index = pd.Index([f'Row {i + 1}' for i in range(m)], name='Rows')
    columns = pd.Index([f'Col {i + 1}' for i in range(n)], name='Columns')
    df = pd.DataFrame(np.random.randint(1, 100, size=(m, n)), index=index, columns=columns)
    # rest of your code here

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM