我可以為這個大型 excel 文件數據集運行什么樣的分析？

Question

我在一家向客戶銷售桶的公司工作。 我正在為一個班級項目做這件事，但在 Python 方面我不是最好的。 該文件列出了 2015 年至 2019 年購買不同類型桶的數千名客戶。 我的財務部門想知道誰退回了他們，誰沒有退回，以什么速度退回？

我設法使用 python 僅使用與我的分析相關的選定列（請參閱此數據）。 一旦我導出到 csv 文件，我應該在 Python 中運行什么樣的分析來幫助回答我的問題？ 我已經做了一個數據透視表和圖表（計算有多少客戶退回桶和哪一年），但想使用 Python 使事情更容易閱讀和分析，以便我可以回答這個問題。

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)

Answer 1

請閱讀我關於發布帶有示例的可重現問題的評論，我們可能會復制和粘貼這些示例並努力提出解決方案。

話雖如此，如果我理解正確，我相信.groupby()函數可能有助於您的事業：

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)

即使您的問題非常模棱兩可，我希望這會有所幫助。

我可以為這個大型 excel 文件數據集運行什么樣的分析？

問題描述

1 個解決方案

解決方案1
0 2020-03-01 05:16:15

我可以為這個大型 excel 文件數據集運行什么樣的分析？

問題描述

1 個解決方案

解決方案1 0 2020-03-01 05:16:15

解決方案1
0 2020-03-01 05:16:15