读取 csv 的分隔符在文本字段中

Question

我从服务器收到提取的数据，问题是提取有分隔符“;” 在 csv 文件中。

我使用以下命令读取文件夹：

files = glob.glob(r"path/*.csv")
dfs = [pd.read_csv(f, sep=";", engine='c') for f in files]
df2 = pd.concat(dfs,ignore_index=True)

output 是：


columnA    columnB .... columnT columnU
2000        A      ....  I wish  NaN
1000        B     ....   that    NaN
this ends   NaN   ....    NaN    NaN
3000        A     .....    I      DUU
...

第 3 行中的文本属于第二行中的 columnT。 到目前为止，我只能删除所有奇怪的行，如第 4 行，但我无法保留该信息。

df2.dropna(subset=['columnB'], how='all', inplace=True)

如何正确读取文件？ 问题是，在文本中的文本字段 columnT 中，它也使用“;” 作为正常角色。

Answer 1

我不知道解决这个问题的编程方法（见我的评论），但出于兴趣，快速搜索让我找到了 CSV 文件中的 Escaping 引号和分隔符，其中 Excel 文件。 也许你也可以试试。 即，手动或以编程方式，将所有单引号替换为双引号，然后再次尝试您的代码。

读取 csv 的分隔符在文本字段中

问题描述

1 个解决方案

解决方案1
0 2022-02-04 13:33:28

读取 csv 的分隔符在文本字段中

问题描述

1 个解决方案

解决方案1 0 2022-02-04 13:33:28

解决方案1
0 2022-02-04 13:33:28