簡體   English   中英

使用pandas從python中的現有csv文件生成新csv文件的指定數字數據幀的方法

[英]way to generate a specified number dataframe of new csv file from existing csv file in python using pandas

我在Csv文件sample1中有大數據幀,我必須生成一個新的Csv文件只包含100個data-frame.i已為它生成代碼。但是我得到鍵錯誤標簽[100]不在指數? 我剛嘗試如下,任何幫助將不勝感激

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv")
data_frame1 = data_frame[:100]
data_frame.to_csv("C:/users/raju/sample.csv")`

`

正確的語法是iloc

data_frame.iloc[:100]

一種更有效的方法是使用nrows參數,其目的正是提取文件的一部分。 這樣可以避免浪費資源和時間來解析無用的行:

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv", nrows=101)  # 100+1 for header
data_frame.to_csv("C:/users/raju/sample.csv")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM