簡體   English   中英

我可以為這個大型 excel 文件數據集運行什么樣的分析?

[英]What kind of analysis can I run for this large excel file dataset?

我在一家向客戶銷售桶的公司工作。 我正在為一個班級項目做這件事,但在 Python 方面我不是最好的。 該文件列出了 2015 年至 2019 年購買不同類型桶的數千名客戶。 我的財務部門想知道誰退回了他們,誰沒有退回,以什么速度退回?

我設法使用 python 僅使用與我的分析相關的選定列(請參閱此數據)。 一旦我導出到 csv 文件,我應該在 Python 中運行什么樣的分析來幫助回答我的問題? 我已經做了一個數據透視表和圖表(計算有多少客戶退回桶和哪一年),但想使用 Python 使事情更容易閱讀和分析,以便我可以回答這個問題。

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)

請閱讀我關於發布帶有示例的可重現問題的評論,我們可能會復制和粘貼這些示例並努力提出解決方案。

話雖如此,如果我理解正確,我相信.groupby()函數可能有助於您的事業:

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)

即使您的問題非常模棱兩可,我希望這會有所幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM