[英]Add 'name' properties to row and column names when creating a pandas DataFrame
我正在创建一个 Pandas 数据框来了解如何处理丢失的数据。 我想要的是在创建 DataFrame 时将 Row 和 Column 名称添加到 DataFrame 中,而不是稍后使用 'df.index.name =' 和 'df.columns.name =' 传递它们。 我怎样才能做到这一点?
# Program to generate a m x n DataFrame with random NaN values scattered in:
import random
def df_maker(m, n):
df = pd.DataFrame(np.random.randint(1, 100, (m*n)).reshape(m, n), index = [f'Row {i+1}' for i in range(m)], columns = [f'Col {j+1}' for j in range(n)] )
for i in range(m):
df.iloc[[i],[random.randrange(n)]] = np.nan
return df
df = df_maker(10, 10)
df.index.name = 'Rows'
df.columns.name = 'Columns'
df
我尝试查找pandas.DataFrame 、 pandas.DataFrame.rename_axis和其他一些方法的文档,但找不到我要找的内容。 那么如何在不使用df.index.name = 'Rows'
和df.columns.name = 'Columns'
情况下用 1 行代码创建上述数据df.columns.name = 'Columns'
? 谢谢。
创建分别代表行和列的Index
对象:
def df_maker(m, n):
index = pd.Index([f'Row {i + 1}' for i in range(m)], name='Rows')
columns = pd.Index([f'Col {i + 1}' for i in range(n)], name='Columns')
df = pd.DataFrame(np.random.randint(1, 100, size=(m, n)), index=index, columns=columns)
# rest of your code here
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.