用熊猫过滤Excel数据

Question

我正在尝试读取Excel文件并过滤Excel文件中的数据。 例如

Excel数据

我想用Python阅读。 此外，我想过滤直接从excel中获取的数据。 例如，我想为苹果定义范围，并将其分类为“最佳”和“最差”。 可以说，低于3的苹果是“最差”，高于5的苹果是“最佳”。

有人知道我该怎么做吗？

Answer 1

这是您需要的：

import numpy as np
import pandas as pd

df = pd.read_excel(filename) #read file
df = pd.DataFrame({'Apples':np.random.randint(0,10,size=10)}) #for demo
df['Apples_cat'] = (pd.cut(df['Apples'],bins=[-np.inf,2,5,np.inf],labels=['worst','ok','best']))
print(df)

输出：（由于df是在演示中随机生成的，因此输出会有些许差异）

   Apples Apples_cat
0       2      worst
1       2      worst
2       5         ok
3       2      worst
4       1      worst
5       5         ok
6       5         ok
7       6       best
8       4         ok
9       2      worst

Answer 2

你可以做

import pandas as pd

data = pd.read_excel ('fruits.xls')

data['apple_category'] = "medium"

data.loc[data['Apples'] < 3, 'apple_category'] = "worst"
data.loc[data['Apples'] > 5, 'apple_category'] = "best"

用熊猫过滤Excel数据

问题描述

2 个解决方案

解决方案1
0 已采纳 2017-02-17 08:29:19

解决方案2
0 2017-02-17 08:34:12

用熊猫过滤Excel数据

问题描述

2 个解决方案

解决方案1 0 已采纳 2017-02-17 08:29:19

解决方案2 0 2017-02-17 08:34:12

解决方案1
0 已采纳 2017-02-17 08:29:19

解决方案2
0 2017-02-17 08:34:12