使用pandas在csv文件的同一行上填充下一列值的行中的空值

Question

我有这种类型的DataFrame

name     surname       middle

Frank    Doe           NaN
John     Nan           Wood
Jack     Putt          Nan
Frank    Nan           Joyce

我想在“姓氏”列上的NaN相同行值上移动“中间”值。 我怎样才能做到这一点？ 我尝试使用fillna方法，但没有得到任何结果。 这是我的代码：

import os
from pandas.io.parsers import read_csv


for csvFilename in os.listdir('.'):
   if not csvFilename.endswith('.csv'):
      continue
data=read_csv(csvFilename)
filtered_data["surname"].fillna(filtered_data["middle"].mean(),inplace=True)
filtered_data.to_csv('output.csv' , index=False)

Answer 1

条件列翻转

使用pd.isnull() ，可以有条件地重新排列列。

import pandas as pd
from cStringIO import StringIO

# Create fake DataFrame... you can read this in however you like
df = pd.read_table(StringIO('''
name     surname       middle
Frank    Doe           NaN
John     NaN           Wood
Jack     Putt          NaN
Frank    NaN           Joyce'''), sep='\s+')

print 'Original DataFrame:'
print df
print

# Assign the middle name to any surname with a NaN
df.loc[pd.isnull(df['surname']), 'surname'] = df[pd.isnull(df['surname'])]['middle']

print 'Manipulated DataFrame:'
print df
print

Original DataFrame:
    name surname middle
0  Frank     Doe    NaN
1   John     NaN   Wood
2   Jack    Putt    NaN
3  Frank     NaN  Joyce

Manipulated DataFrame:
    name surname middle
0  Frank     Doe    NaN
1   John    Wood   Wood
2   Jack    Putt    NaN
3  Frank   Joyce  Joyce

Answer 2

我认为有一种更简单的方法：

df['surname'] = df['middle'].combine_first(df['surname'])
print(df)

输出：

    name surname middle
0  Frank     Doe    NaN
1   John    Wood   Wood
2   Jack    Putt    NaN
3  Frank   Joyce  Joyce

使用pandas在csv文件的同一行上填充下一列值的行中的空值

问题描述

2 个解决方案

解决方案1
1 已采纳 2016-03-13 14:40:26

条件列翻转

解决方案2
0 2016-03-13 15:24:56

使用pandas在csv文件的同一行上填充下一列值的行中的空值

问题描述

2 个解决方案

解决方案1 1 已采纳 2016-03-13 14:40:26

条件列翻转

解决方案2 0 2016-03-13 15:24:56

解决方案1
1 已采纳 2016-03-13 14:40:26

解决方案2
0 2016-03-13 15:24:56