簡體   English   中英

根據列拆分csv文件

[英]Split csv files based on columns

我有一個要根據列數拆分的csv文件。 原始文件大約有24000列,我想將其拆分為文件,每個文件具有固定的列數(例如1000)。 我想在weka上對單個文件進行功能選擇。 我在python中有以下代碼。

import pandas as pd
import numpy as np

i=0
df=pd.read_csv("glio.csv")
#row_split=int(input("Enter the Row Split: "))
row_split=6000
name ="temp_file_"
ext=".csv"
rows, columns = df.shape
df_temp=df.iloc[:,:row_split]
df_temp.to_csv(name+str(i)+ext)
i=i+1
while(row_split<columns):
    df_temp=df.iloc[:,row_split+1:row_split+100]
    df_temp.to_csv(name+str(i)+ext)
    i=i+1
    row_split+=1000

它正在按預期生成單個文件,但拆分后我無法在weka中加載單個文件。 我收到以下錯誤

在此處輸入圖片說明

我對此並不陌生,不知道為什么會這樣。 我無法在線找到答案。 如果有人可以解釋為什么會發生這種情況以及如何糾正這種情況,那將非常有幫助

首先將index = False添加到to_csv調用中:

df_temp.to_csv(name+str(i)+ext, index=False)

另外,當您在某些csv查看器應用程序(例如Excel)中打開csv文件的屏幕截圖時,請上傳該屏幕快照。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM