[英]Sampling from a high dimensional function
我有一個函數f
,它接受N
實值輸入,並且計算起來非常昂貴。 N
輸入中的每個輸入(一個由n
調用)都有一個可以取值的范圍(n_min, n_max)
。 我對研究f
的性質感興趣,方法是在各種輸入上生成樣本並查看其產生的輸出。 (目標是使用ML為f
建立一個近似器。)
假設由於時間限制,我只能生成1000個樣本。 選擇我饋給f
的N
s的集合是否“更好”
(A)從迭代n_min
到n_max
用一個足夠大的步長大小對於每個n
,或
(B)在(n_min, n_max)
的范圍內均勻地采樣每個n
。
選擇(A)具有保持所有其他輸入固定同時一次僅更改一個值的理想特性,而選擇(B)具有可能探索輸入空間更多部分的理想特性。
當函數在所有輸入上的方差均不相等時, B可能更好。 在極端情況下,假設您有1000個樣本,3個輸入,但是其中只有一個實際會影響功能。 如果像A中那樣在10x10x10的常規網格上進行采樣,則最終只會得到10個相關輸入的采樣。 如果您以均勻分布抽樣,則所有1000個樣本將提供信息。
作為B的變體,請考慮使用輸入的准隨機序列,例如Sobol序列 。 相對於均勻分布的優勢在於,您的輸入空間覆蓋范圍不會出現簇或孔。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.