从整个 DataFrame 中删除空格

Question

我有一个 dataframe，22 列和 65 行。 数据来自 csv 文件。 每个带有 dataframe 的值都有一个额外的不需要的空格。 因此，如果我使用 Len() 在“年”列上进行循环，我会得到

这 1 个额外的空格出现在整个 DF 的每个值中。 我尝试在 DF 上运行 a.strip() 但不存在属性

我为每个 df[column].str.strip() 尝试了一个 ' 但每列中都有各种数据类型... dtypes：float64(6)、int64(4)、object(14)，所以这个错误。

关于如何为整个 dataframe 应用 function 的任何想法，如果是这样，什么功能/方法？ 如果不是，最好的处理方法是什么？

Answer 1

您应该使用apply() function 来执行此操作：

df['Year'] = df['Year'].apply(lambda x:x.strip() )

您可以分别在每列上应用此 function：

for column in df.columns:
    df[column] = df[column].apply(lambda x:x.strip() )

Answer 2

处理错误：

for col in df.columns:
    try:
        df[col] = df[col].str.strip()
    except AttributeError:
        pass

通常，我会说 select 和object dtypes，但如果数据足够混乱以将数字数据存储在 object 容器中，这仍然会出现问题。

import pandas as pd

df = pd.DataFrame({'foo': [1, 2, 3], 'bar': ['seven ']*3})
df['foo2'] = df.foo.astype(object)

for col in df.select_dtypes('object'):
    df[col] = df[col].str.strip()
#AttributeError: Can only use .str accessor with string values!

Answer 3

尝试这个：

for column in df.columns:
    df[column] = df[column].apply(lambda x: str(x).replace('  ', ' '))

Answer 4

为什么不试试这个？

for column in df.columns:
    df[column] = df[column].apply(lambda x: str(x).strip())

从整个 DataFrame 中删除空格

问题描述

4 个解决方案

解决方案1
1 已采纳 2019-10-09 19:45:18

解决方案2
1 2019-10-09 19:53:01

解决方案3
0 2019-10-09 20:20:23

解决方案4
0 2022-05-12 02:06:08

从整个 DataFrame 中删除空格

问题描述

4 个解决方案

解决方案1 1 已采纳 2019-10-09 19:45:18

解决方案2 1 2019-10-09 19:53:01

解决方案3 0 2019-10-09 20:20:23

解决方案4 0 2022-05-12 02:06:08

解决方案1
1 已采纳 2019-10-09 19:45:18

解决方案2
1 2019-10-09 19:53:01

解决方案3
0 2019-10-09 20:20:23

解决方案4
0 2022-05-12 02:06:08