使用pandas从python中的现有csv文件生成新csv文件的指定数字数据帧的方法

Question

我在Csv文件sample1中有大数据帧，我必须生成一个新的Csv文件只包含100个data-frame.i已为它生成代码。但是我得到键错误标签[100]不在指数？ 我刚尝试如下，任何帮助将不胜感激

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv")
data_frame1 = data_frame[:100]
data_frame.to_csv("C:/users/raju/sample.csv")`

`

Answer 1

正确的语法是iloc ：

data_frame.iloc[:100]

一种更有效的方法是使用nrows参数，其目的正是提取文件的一部分。 这样可以避免浪费资源和时间来解析无用的行：

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv", nrows=101)  # 100+1 for header
data_frame.to_csv("C:/users/raju/sample.csv")

使用pandas从python中的现有csv文件生成新csv文件的指定数字数据帧的方法

问题描述

1 个解决方案

解决方案1
1 2017-01-31 20:15:22

使用pandas从python中的现有csv文件生成新csv文件的指定数字数据帧的方法

问题描述

1 个解决方案

解决方案1 1 2017-01-31 20:15:22

解决方案1
1 2017-01-31 20:15:22