簡體   English   中英

機器學習數據集的不同麥克風

[英]Different microphones for machine learning dataset

我目前正在關注這里找到的Tensorflow簡單音頻識別教程並想知道數據集中不同麥克風記錄的音頻是否會對培訓結果產生負面影響。 是否所有音頻都應使用相同類型的麥克風錄制?

這取決於您將來如何使用訓練有素的模型。 如果您希望該模型與不同類型的麥克風一起使用,並假設不同的麥克風會影響實際錄制的音頻,那么您可能希望使用各種麥克風進行錄制。

或者,您也可以表征由不同麥克風產生的差異,並修改數據集,使樣本包含在麥克風之間發現的差異。 這稱為數據增強,是一種非常普遍且推薦的做法,但是,這不一定是一件容易的事。 數據擴充通常特定於您使用的數據集和數據類型,因此,這可能只是您要使用的數據擴充的一個示例。 音頻的另一個典型示例是添加各種類型的背景噪聲,以產生更大的唯一數據集,在該數據集中必須選擇所需的信號。

另一方面,您將僅在特定的麥克風上使用模型,然后僅使用該麥克風進行訓練是有意義的,因為您不在乎使用其他麥克風的效果如何。

如果這只是學習中的一種練習,那么我完全不用擔心這個細節。 實際上,在我看來,不同的麥克風不會產生明顯不同的音頻配置文件。 但是,嘿,我很可能是錯的。

我喜歡從人類的角度思考這樣的問題。 問問自己:如果我要雇用一個數據輸入人員來執行此任務,並且我要給他們一些示例來教他們如何執行任務,如果這些樣本來自多個麥克風,對他們有好處嗎? 如果答案是肯定的,則將學習算法與人類一樣對待,並賦予他們相同的多樣性。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM