簡體   English   中英

哪種機器學習算法合適?

[英]What Machine Learning algorithm would be appropriate?

我正在研究一個預測器,以根據天氣和葡萄的特性(即糖水平,酸鹼度,酸度)來學習最可能的葡萄收獲期。 我有兩個數據集,我正在考慮如何將它們合並在一起:一個是2003-2013年期間一些意大利葡萄園的收獲前分析數據,另一個是那十年的天氣。 我想做的就是從樣本中學習何時收獲,給出最佳糖水平,PH和酸度的范圍,並給出天氣預報。 我認為某些強化學習方法可以奏效。 由於收獲前的分析是在葡萄成熟期進行的大約5次,因此我認為這些狀態可能是我介入的狀態,而天氣狀況可能是從一種狀態過渡到另一種狀態的“可能性”。 但是我不確定哪種算法是最好的,因為每個狀態和每個“概率”都取決於幾個變量。 有人告訴我隱馬爾可夫模型可以工作,但是在我看來,我的問題並不完全適合該模型。 你有什么建議嗎? 提前Thx

這與實際算法無關,但是您將要遇到的問題是天氣是非常局部的。 信不信由你,一個葡萄園可能與另一葡萄園的天氣完全不同。 如果在每個葡萄園安裝雨量計,就會發現這一點。 為了獲得真正好的結果,您需要在每個葡萄園都設有一個迷你氣象站。 如果沒有,最好的選擇是僅在天氣測量值附近使用葡萄園。 例如,如果您的數據來自機場,則僅在機場旁邊使用葡萄園。

當您可以控制動作時,強化學習是適當的。 就像猴子在按按鈕。 您按下一個按鈕會感到震驚,因此不必再次按下該按鈕。 在這里,您有一個被動數據集,無法進行實驗性操作,因此強化學習不適用。

在這里,您有一組復雜的不受控制的輸入,天氣數據,一個受控制的輸入(收獲時間)以及幾個輸出參數,糖等。給定這些數據,您想預測在未來的未知天氣模式下要使用的收獲時間。

通常,您正在做的是敏感性分析 :試圖弄清楚您的因素如何影響所發生的結果。 棘手的是,結果可能是由某種非顯而易見的模式驅動的。 例如,可能是3周的干旱,然后是2周的大雨,這意味着最好的收成將是65天,或者類似的天數。

因此,您要做的是對數據進行特征化處理,以可能的方式對其進行表征,然后進行敏感性分析。 如果分析具有很強的相關性,那么您已經找到了解決方案。 如果沒有,那么您必須找到另一種方法來使數據特征化。 例如,您的成熟度可能是降雨超過2英寸的天數,或者可能是大多數時候沒有下雨的天數,或者可能是晴天下的總天數。 可能有多個功能可能組合在一起構成一個解決方案。 選項僅受您的想象力限制。

當然,就像我在上面說的那樣,美中不足的是,您的天氣數據只會大致逼近特定葡萄園的真實和實際天氣,因此數據中會有噪音,可能噪音很大,以至於無法好的結果是不可能的。

為什么您實際上不太在意天氣

回到數據上來,獲得不可靠的天氣信息實際上不是問題,因為您實際上並不十分在意天氣。 原因有兩個。 首先,您要回答的問題不是何時收獲葡萄,而是是否等待收獲 釀酒師可以隨時測量葡萄的糖分。 因此,他只需要決定:“我現在應該用X%的糖來收獲葡萄,還是我應該等待並稍后獲得更好的Z%的糖?要回答這個問題,您需要的實際數據不是天氣,而是隨時間變化的一系列糖/酸度讀數,您要預測的是,在特定情況下,葡萄會變好還是變壞。

其次,葡萄樹擁有自己喜歡的最佳水分。 如果藤蔓太干,那就不好了;如果藤蔓太濕了,那就不好了。 您無法從天氣中預測葡萄藤的濕潤程度。 有些土壤能很好地保持水分,有些則是沙質的。 具有相同水分含量的沙質葡萄園比粘土葡萄園需要更多的降雨。 此外,葡萄酒商可以給他的葡萄園澆水,使降雨模式完全無效。 因此,天氣幾乎不是一個因素。

我同意泰勒的觀點,從可行的角度來看,天氣可能會損害您的分析。 但是,我認為這是供您測試和發現的!-可能會得出一些有趣的數據。

我不確定您的測試確切是什么,但是一種簡單的開始方法可能是使用svm(甚至是邏輯回歸,因為您需要概率)將其變成分類問題,並將所有數據用作算法的輸入-假設您知道哪些年份是豐收年,或者不是。 您甚至可以單獨測試每個變量,並查看它如何影響您的性能。 我建議您盡量這樣做,因為網絡上有大量資源,SO上的人員可以幫助您調整算法。

當您對此有所了解時,正如您之前所建議的那樣,我將嘗試HMM,因為它將告訴您哪一天可能是最適合收獲的日子。 這是天氣可能會受到傷害的地方,但是您將通過更簡單的實驗來進一步了解數據。

我從機器學習中學到的想法是,盡管有一些指導原則可供選擇何時不總是選擇一成不變的算法,但是您可以根據需要的自由度來稍稍更改您的問題並嘗試新的方法來解決該問題。玩數據。 祝好運並玩得開心點!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM