簡體   English   中英

我學習數據挖掘的路徑是否正確

[英]Is my path of learning data mining correct

有人剛剛告訴我的老板數據挖掘可以為公司帶來什么,比如推薦、預測建模。 基本上我們是一家網站公司。 我要休假6個月。 所以我的老板說我可以學習一些 DM 技術,這樣當我回來時我們可以訪問小商店或小公司,使用數據挖掘算法為他們提供預測數據。

商店將只為客戶或更多客戶提供 sql 文件或 csv 文件。

現在我只知道MYSQL,不知道什么是數據挖掘,不知道它是否像我上面想的那樣工作,我的意思是,如果有人有客戶、購物和我的數據庫,我可以應用數據挖掘技術。 我是說

(raw mysql or sql data) or (csv files) ----data mining--> (some useful result)
  • 1)上述系統是正確的還是我錯了
  • 2) 商店或企業會想要那個還是我錯過了什么

我的學習計划如下。 我想首先獲得一些 sql server 2008 證書,因為在我所在的地區大多數都在使用 microsoft,所以我可能需要了解 sql

1)MCTS: SQL Server 2008, Implementation and Maintenance
2)MCTS: SQL Server 2008, Database Development
3)MCTS: SQL Server 2008, Business Intelligence Development and Maintenance

(或者我應該去oracle和oracle data warehousiong ...我想先正確地做一些databse)

4)Data Mining with Microsoft SQL Server 2008 (2009)     
5)Python for dummies    
6)Programming Collective Intelligence: Building Smart Web 2.0 Applications

我的流程是否正確,或者我能否以更好的方式實現我的結果。 我做證書的原因是為了對 sql 有一些了解,如果我在 6 個月后沒有得到那份工作,我可以從事與數據挖掘或 BI 或至少 sql server 相關的新工作。

請幫我

好吧,這不是一個簡單的是/否答案。 你正在做一些正確的事。 這樣您就可以了解SQL Server數據挖掘工具集。 你將在哪里使用哪個算法。 (Naive Byes如何。與決策樹不同..等等)

一旦你知道這些東西,第二件事就是了解你的數據,以及如何制作將作為輸入的FLAT表。 這是最重要的,因為這是您將用於訓練模型的數據。 你不需要知道ANN算法背后的內部數學等等。 你應該知道如何使用它。 excel(2007年以后)有數據挖掘加載項,您可以使用它們來玩。

Rafal Luckawiski在http://channel9.msdn.com上有一些數據挖掘視頻。 它們有助於對如何開始有所了解。

在此之后,這是一個實踐問題,您使用新數據和制作新模型並分析結果越多,您將變得越好。

如果您需要有關PPT,樣品等的更多信息,請告訴我

呃,為了有效地進行數據挖掘,你需要了解大量的數學知識。 你的道路就像“我想成為一名外科醫生,所以我將學習如何用手術刀切割”。 是的,了解一些SQL並且可能是必要的(僅取決於數據的組織方式),但FAR足夠了。

好像你做錯了。

最重要的是學習數據挖掘,人工智能和預測科學主題,所有那些硬核數學和CS的東西。 不是數據庫技術雖然重要,但與數據挖掘領域無關。

我會推薦一本書,我認為它是根據您的需求量身定制的: 編程集體智慧

替代文字

從你所寫的內容來看,它接近於數據挖掘而不是數據抓取。

首先, Ngu Soon Hui回答正在轉移你一個完全錯誤的方向。
他建議你的是數據疤痕而不是數據挖掘
您將更好地理解數據挖掘與數據抓取之間的差異(也稱為網站/網絡抓取,也就是屏幕抓取,即數據收集):

“(原始mysql或sql數據)或(csv文件)----數據挖掘 - >(一些有用的結果)”

完全忘記MySql並且不要浪費你的時間,因為在MySql中絕對不支持數據挖掘。 僅用於數據抓取。 雖然你可能對后者感興趣。 你最好知道區別

“1)MCTS:SQL Server 2008,實施和維護2)MCTS:SQL Server 2008,數據庫開發3)MCTS:SQL Server 2008,商業智能開發和維護”

你為什么需要1)和2)? 甚至3)只包含20%的數據挖掘。

5)Python for dummies 6)編程集體智慧:構建Smart Web 2.0應用程序

你為什么需要Python?

6)不是數據挖掘。 它被稱為數據抓取,它再次成為DM完全錯誤方向的路徑

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM