如何在python中“写入新的.CSV文件”或“另存为新的.CSV文件”

Question

我有一个 CSV 文件，我想应用一个热编码，然后将新的数据帧（数据集）另存为一个新的 CSV 文件。 但是当新文件被保存时，它只写了 5 Rows dummy 和原始数据集的所有行！

我只想将所有行和列保存在新的 file.csv 中，数据集的最终形状是(237124, 417) 。

我的代码包含：

import numpy as np 
import pandas as pd
from sklearn.preprocessing import OneHotEncoder 
from sklearn.preprocessing import LabelEncoder 
import csv

dataset=pd.read_csv("C:/Users/User/Desktop/data.csv",encoding='cp1252')
dataset.shape
#output: (237124, 37)

dummies = pd.get_dummies(dataset, columns=["name","mark",....... ]).head()
dummies.shape
#output : (5, 380)

dataset = pd.concat([dataset, dummies], axis=1)
dataset.shape
#output: (237124, 417)
# i want this shape(original+dummies)

dataset.to_csv('OneHotEncodnig.csv', index=False)

Answer 1

你在这一行调用df.head() ：

dummies = pd.get_dummies(dataset, columns=["name","mark",....... ]).head()

这就是为什么你只能得到 5 个虚拟行。 删除.head()并获得所有行。

Answer 2

head()函数默认只返回 5 行。 请在没有head()函数的情况下应用get_dummies()

import numpy as np 
import pandas as pd
from sklearn.preprocessing import OneHotEncoder 
from sklearn.preprocessing import LabelEncoder 
import csv

dataset=pd.read_csv("C:/Users/User/Desktop/data.csv",encoding='cp1252')
dataset.shape
#output: (237124, 37)

dummies = pd.get_dummies(dataset, columns=["name","mark",....... ])
dummies.shape
#output : (5, 380)

dataset = pd.concat([dataset, dummies], axis=1)
dataset.shape
#output: (237124, 417)
# i want this shape(original+dummies)

dataset.to_csv('OneHotEncodnig.csv', index=False)

如何在python中“写入新的.CSV文件”或“另存为新的.CSV文件”

问题描述

2 个解决方案

解决方案1
1 已采纳 2019-12-08 14:25:27

解决方案2
1 2019-12-08 14:26:45

如何在python中“写入新的.CSV文件”或“另存为新的.CSV文件”

问题描述

2 个解决方案

解决方案1 1 已采纳 2019-12-08 14:25:27

解决方案2 1 2019-12-08 14:26:45

解决方案1
1 已采纳 2019-12-08 14:25:27

解决方案2
1 2019-12-08 14:26:45