如何在不指定列的情况下删除 Pandas 读取的任何 csv 文件中的所有多余空格？

Question

我的计划是显示一个有序字典，其中包含从任何 csv 读取的 dataframe 的 OrderedDict，有或没有过多空格（初始空格/非初始空格，单词之间的过多空格（双/三重空格））

这些是我在尝试摆脱过多空格时遇到的问题：

通过使用str.strip() ，需要指定列的字符串，它只能与特定的 csv 文件一起使用。
通过在pd.read_csv的参数中指定sep ，csv 文件中的某些项目将在有序字典中变为“无”。
skipinitialspace()不能删除其他多余的空格。

此代码的任何解决方法？：

file = input("Input any csv file or file path \nYour input: ")

df = pd.read_csv(file)

for i, row in df.iterrows():
      d = OrderedDict(zip(row.index.tolist(), row.tolist()))
      print(d)

编辑：

附加示例：

df = pd.DataFrame([[f'Ka te', f' Rose '], [f' Tim ', f'John  son'], [f'James  ', f'House  ']], columns=['First Name', 'Last Name'])

for i, row in df.iterrows():
      d = OrderedDict(zip(row.index.tolist(), row.tolist()))
      print(d)

Output：

OrderedDict([('First Name', 'Ka te'), ('Last Name', ' Rose ')])
OrderedDict([('First Name', ' Tim '), ('Last Name', 'John  son')])
OrderedDict([('First Name', 'James  '), ('Last Name', 'House  ')])

我想要的 Output：

OrderedDict([('First Name', 'Kate'), ('Last Name', 'Rose')])
OrderedDict([('First Name', 'Tim'), ('Last Name', 'John son')])
OrderedDict([('First Name', 'James'), ('Last Name', 'House')])

Answer 1

刚刚得到解决方案，可以通过使用str.replace()来实现：

df = pd.DataFrame([[f'Ka te', f' Rose '], [f' Tim ', f'John  son'], [f'James  ', f'House  ']], columns=['First Name', 'Last Name'])

for c in df:
  df[c] = df[c].str.replace(' ', '')

for i, row in df.iterrows():
  d = OrderedDict(zip(row.index.tolist(), row.tolist()))
  print(d)

如何在不指定列的情况下删除 Pandas 读取的任何 csv 文件中的所有多余空格？

问题描述

1 个解决方案

解决方案1
0 2021-11-20 15:36:22

如何在不指定列的情况下删除 Pandas 读取的任何 csv 文件中的所有多余空格？

问题描述

1 个解决方案

解决方案1 0 2021-11-20 15:36:22

解决方案1
0 2021-11-20 15:36:22