[英]Different microphones for machine learning dataset
這取決於您將來如何使用訓練有素的模型。 如果您希望該模型與不同類型的麥克風一起使用,並假設不同的麥克風會影響實際錄制的音頻,那么您可能希望使用各種麥克風進行錄制。
或者,您也可以表征由不同麥克風產生的差異,並修改數據集,使樣本包含在麥克風之間發現的差異。 這稱為數據增強,是一種非常普遍且推薦的做法,但是,這不一定是一件容易的事。 數據擴充通常特定於您使用的數據集和數據類型,因此,這可能只是您要使用的數據擴充的一個示例。 音頻的另一個典型示例是添加各種類型的背景噪聲,以產生更大的唯一數據集,在該數據集中必須選擇所需的信號。
另一方面,您將僅在特定的麥克風上使用模型,然后僅使用該麥克風進行訓練是有意義的,因為您不在乎使用其他麥克風的效果如何。
如果這只是學習中的一種練習,那么我完全不用擔心這個細節。 實際上,在我看來,不同的麥克風不會產生明顯不同的音頻配置文件。 但是,嘿,我很可能是錯的。
我喜歡從人類的角度思考這樣的問題。 問問自己:如果我要雇用一個數據輸入人員來執行此任務,並且我要給他們一些示例來教他們如何執行任務,如果這些樣本來自多個麥克風,對他們有好處嗎? 如果答案是肯定的,則將學習算法與人類一樣對待,並賦予他們相同的多樣性。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.