簡體   English   中英

機器學習-過度擬合數據集

[英]Machine Learning - Overfitting The Dataset On Purpose

我最近學習了機器學習 ,並且正在開發一個Tic Tac Toe引擎,該引擎可以預測給定Tic Tac Toe位置(或板狀態)的最佳移動,這是我的第一個項目。 我用蠻力為3 x 3棋盤創建了所有可能的位置(不包括完成和重復的游戲),並獲得了4520個不同的可能位置。 然后,我使用MinMax找出這些位置中每個位置的最佳移動。 現在,我想對該數據擬合模型,以實現最大的准確性。 我想到的是:

由於我擁有所有可能的職位,所以為什么不對整個模型進行訓練(因此就不會有測試集),並使用復雜的neural network對數據進行過擬合並獲得100%的准確性,那么它將由於不會遇到任何新職位,因此在實際使用中也能100%准確。

問題是,我注意到人們總是將過擬合視為壞事, 所以我的問題是:這是一種好習慣嗎? 又為什么好呢?

當您希望模型推廣到新數據時,過度擬合是一個問題。 在您的情況下,沒有新數據,因此過擬合不是問題。

但是,這並不是機器學習通常用於的目的,在大多數情況下,泛化才是重點,這就是為什么我們不遺余力地竭盡全力。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM