Python 不会从 a.csv 文件中取值

Question

我有这个作业问题，我为此编写了以下代码。 但是 Python 一直告诉我“水库”不在 dataframe 中，尽管它是。 我该如何解决？ 如果需要，这里是 .CVS 文件的链接。 https://drive.google.com/file/d/1SZ639cUA3DdrlI_lG2Hq0vs6HiT8OAU3/view?usp=sharing

创建并显示一个条形图，按县显示井数：

类别：县
Y 轴：Total Clearfork Wells（在文件中命名为“Reservoir”）

我的代码如下：

df = pd.read_csv('CF Around Lubbock Production Table.CSV')

By_County = df.groupby(['County/Parish']).sum().Reservoir

x = By_County.index
y = By_County.values

plt.figure(figsize=(10, 8))

plt.bar(x,y)


for i, j in zip(x,y):
    plt.text(i, j+10, int(j), ha = 'center')


plt.xlabel('County', fontsize = 20)
plt.ylabel('Total Clearfork Wells', fontsize = 20)

plt.xticks(fontsize = 12)
plt.yticks(fontsize = 15)

plt.show()

Answer 1

Column Reservoir似乎是object类型（在您的情况下，值是字符串）。 因此，如果您对整个 dataframe 进行聚合，则 pandas 不会将列与字符串值相加，因此该列被忽略。

你可以尝试什么：

By_County = df.groupby(['County/Parish'])['Reservoir'].sum()

它适用于系列。 但是你真的想要连接字符串吗？

County/Parish
CROSBY (TX)     CLEAR FORKCLEAR FORKCLEAR FORKCLEAR FORKCLEAR ...
GARZA (TX)      CLEARFORKCLEARFORKCLEARFORKCLEARFORKCLEARFORKC...
HALE (TX)       CLEARFORKCLEARFORKCLEARFORKCLEARFORKCLEARFORKC...
HOCKLEY (TX)    CLEARFORKCLEAR FORKCLEARFORKCLEAR FORKCLEAR FO...
LAMB (TX)       CLEARFORKCLEARFORKCLEARFORKCLEARFORKCLEARFORKC...
Name: Reservoir, dtype: object

Answer 2

你在寻找这样的东西吗？

df_grouped=data.groupby(['County/Parish','Reservoir'])['Reservoir'].count()

Output：

County/Parish  Reservoir      
CROSBY (TX)    CLEAR FORK         1837
               CLEARFORK             2
GARZA (TX)     CLEAR FORK           22
               CLEARFORK            32
HALE (TX)      CLEAR FORK            2
               CLEARFORK           441
HOCKLEY (TX)   CLEAR FORK          485
               CLEARFORK           218
               CLEARFORK, LO         1
               L. CLEARFORK          1
               LOWER CLEARFORK      26
               UPPER CLEARFORK      13
LAMB (TX)      CLEAR FORK            3
               CLEARFORK           108
               L. CLEARFORK          1
               LOWER CLEARFORK      12
LUBBOCK (TX)   CLEAR FORK          726
               CLEARFORK           300
               CLEARFORK, LO        60
               CLEARFORK, LO.        4
               L. CLEARFORK          2
               LOWER CLEARFORK       1
               UPPER CLEARFORK       9
LYNN (TX)      CLEARFORK             1
TERRY (TX)     CLEAR FORK            3
               CLEARFORK             1
               CLEARFORK, LO         2
               CLEARFORK, LO.        2
               LOWER CLEARFORK       1
Name: Reservoir, dtype: int64

下面的代码将允许您获取特定组的计数：

df_grouped=data.groupby(['County/Parish','Reservoir'])
    CROSBY_TX_CLEAR_FORK_count= df_grouped.get_group(('CROSBY (TX)', 'CLEAR FORK'))['Reservoir'].count()

CROSBY_TX_CLEAR_FORK_count

您可以更改 get_group 中的参数以获取所需组的计数。

这将为所有县/教区类型的水库“CLEAR FORK”提供 plot 条形图。

CLEAR_FORK_Count={}

count=0

for cat in data['County/Parish'].unique():
    try:
        count = df_grouped.get_group((cat, 'CLEAR FORK'))['Reservoir'].count()  
    except:
        count=0
    
    CLEAR_FORK_Count[cat]=count

plt.bar(CLEAR_FORK_Count.keys(), CLEAR_FORK_Count.values())
plt.xticks(rotation=30)

解决方案：

def getUniqueReservoirs(x):
    return x.nunique()

rs=data.groupby(['County/Parish','Reservoir']).agg({'Entity ID':'count',
                                                    'Reservoir':getUniqueReservoirs
                                     })
rs

绘制图表：

import matplotlib.pyplot as plt

rs.plot()
plt.xticks(rotation=90)
plt.show()

Python 不会从 a.csv 文件中取值

问题描述

2 个解决方案

解决方案1
0 2020-11-29 18:31:01

解决方案2
0 2020-11-29 20:04:39

Python 不会从 a.csv 文件中取值

问题描述

2 个解决方案

解决方案1 0 2020-11-29 18:31:01

解决方案2 0 2020-11-29 20:04:39

解决方案1
0 2020-11-29 18:31:01

解决方案2
0 2020-11-29 20:04:39