如何分析python數據幀並計算字符串在列中出現的次數？

Question

我有一個Python DataFrame，我想對其進行分析。

columns=['User ID','Activity','Time Stamp','X-Axis','Y-Axis','Z-Axis']
input_data = pd.read_csv('walkingcupstairscdownstairs.txt',delimiter=',',names=columns)

輸出是這樣的：

“ Activity列中有幾種活動，例如慢跑，跑步等。我想知道慢跑或走路發生了多少次

Answer 1

嘗試value_counts ：

input_data.Activity.value_counts()

例：

input_data = pd.DataFrame({'Activity': np.random.choice(['Jogging', 'walking'], 10), 
                           'x':np.random.randn(10)})

>>> input_data
  Activity         x
0  walking -0.318043
1  walking -0.590098
2  walking -0.146811
3  Jogging  0.530030
4  Jogging  0.292955
5  walking  0.872765
6  walking  1.028513
7  Jogging -1.465817
8  Jogging  0.981183
9  walking -2.780214

>>> input_data.Activity.value_counts()
walking    6
Jogging    4
Name: Activity, dtype: int64

Answer 2

嘗試使用numpy的獨特功能：

import numpy as np
np.unique(input_data['Activity'].values, return_counts=True)

Answer 3

使用input_data.Activity.value_counts()獲得數據框的“活動”列中的每個唯一值及其出現的總次數。

如果您想要關於唯一值數量，最高值，最高值出現等的更一般性描述，則可以使用input_data.describe()並查看“活動”列的結果。

如何分析python數據幀並計算字符串在列中出現的次數？

問題描述

3 個解決方案

解決方案1
3 已采納 2018-05-09 17:44:18

解決方案2
1 2018-05-09 17:44:53

解決方案3
1 2018-05-09 17:45:00

如何分析python數據幀並計算字符串在列中出現的次數？

問題描述

3 個解決方案

解決方案1 3 已采納 2018-05-09 17:44:18

解決方案2 1 2018-05-09 17:44:53

解決方案3 1 2018-05-09 17:45:00

解決方案1
3 已采納 2018-05-09 17:44:18

解決方案2
1 2018-05-09 17:44:53

解決方案3
1 2018-05-09 17:45:00