簡體   English   中英

什么是機器學習的“預測”元素

[英]What is the 'predictive' element of machine learning

我希望有更多機器學習知識的人可以幫助我。 我一直在閱讀回歸和分類的例子,我似乎總是回到“這個算法正在做什么和標准統計分析將會做什么之間的真正區別”的問題。

具體來說,我讀過的所有例子似乎都沒有討論預測因素。 例如,在查看線性回歸時,文章通常會解釋嘗試創建“最佳擬合”的概念 - 線性方程的組合,然后迭代成本函數,直到達到最小值。 當然,很多重點都放在了“訓練數據集”上。 沒問題......但這通常是它結束的地方。 在這一點上,我看不出上述和標准方式之間的區別,在這種方式中,人們將對假定具有線性關系的數據集進行統計分析。 據推測,這里的未來值是從成本函數收斂到最小值時產生的等式“預測”的 - 再次,這里似乎沒有太多'學習',因為這正是通常情況下所做的。

經過長時間的介紹......我想問的是算法是如何從原始訓練數據中學到的? 這個培訓集如何幫助未來的數據集? (再次,這是我有點迷失的地方 - 對我而言,似乎你會給它一個新的數據集,並執行最小化成本函數的相同任務 - 但是,這次你有一個更好的'起點'但是你所有的知識都來自於你已經對數據集“已經知道”的東西,即一個假定為線性關系的東西。

我希望這是有道理的 - 顯然缺乏理解,但我希望有人可以把我推向正確的方向。

謝謝!

你是對的,沒有區別。 線性回歸純粹是一種統計方法,在這種情況下,“擬合”可能比“學習”更准確。 但同樣,這通常只是關於這一主題的第一次講座。 有許多方法可以使差異更加清晰,例如SVM。 還有一些方法可以使“學習”方面更加清晰,例如在游戲中使用強制學習,您可以實際看到您的系統通過經驗提高其性能。

無論如何,機器學習的主題是從實例中學習。 您將獲得100名患者的名單,以及血壓,年齡,膽固醇水平等,並且每名患者都被告知他們是否患有心臟病。 然后,給你一個你以前沒見過的病人。 他有心臟病嗎? 大多數人稱之為預測。 您可能更喜歡稱它為擬合或其他任何東西。 但事實是,它通常運作良好。

盡管如此,主題仍然與統計數據密切相關,實際上,您需要對基礎函數做出一些假設(在更大或更小的范圍內,取決於算法)。 它並不完美,但在很多情況下它是我們擁有的最好的東西,所以我認為它值得研究。 如果你現在開始,有一個很棒的在線課程,斯坦福大學的“統計學習”,從你的角度來處理這個問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM