如何为 RNN 输入多个时间序列数据（wave）

Question

I made the simple RNN model to learn and fit the one wave file.我制作了简单的 RNN 模型来学习和拟合一个波形文件。

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM,Dropout,Dense
from tensorflow.keras.layers import SimpleRNN
import librosa
import librosa.display
import numpy as np


a, sr = librosa.load("A.wav",sr=22050)
rawdata = librosa.stft(a, n_fft=512,hop_length= 512 // 4, window='hann') #make fourier transfered A.wav data.
rawdata = rawdata.transpose() # [Frame,Freq] => [Freq,Frame]

input_len = 10 # the frame number for learning to make next one
input=[]
target=[]
for i in range(0, len(rawdata) - input_len): 
    input.append( rawdata[i:i+input_len] ) # frames
    target.append( rawdata[i+input_len] )  # one step forward frame for answer.
 
X = np.array(input)
Y = np.array(target)

#Separate 8:2 for training and test
x, val_x, y, val_y = train_test_split(X, Y, test_size=int(X.shape[0] * 0.2), shuffle=False)

n_hidden = 512
epoch = 100
model = Sequential()

model.add(SimpleRNN(n_hidden, input_shape=(input_len, n_in), return_sequences=False))
model.add(Dense(n_hidden, activation="linear")) 
model.add(Dense(n_in, activation="linear"))

opt = Adam(lr=0.001)
model.compile(loss='mse', optimizer=opt)

model.summary()

history = model.fit(x, y, epochs=epoch, batch_size=10,validation_data=(val_x, val_y))

OK it works fine.好的，它工作正常。 It learns the one wave file A.wav它学习一个波形文件A.wav

However how can I learn multiple wave files??但是我怎样才能学习多个波形文件？

B.wav C.wav B.wav C.wav

For example,例如，

If I use model.fit() multiple times for each wav, does this model remember the past learning??如果我为每个 wav 多次使用 model.fit()，这个模型是否记得过去的学习？

Answer 1

yes, model does remember previous train during fit, you can use fit multiple times as well.是的，模型在拟合期间确实记得之前的训练，您也可以多次使用拟合。 but its better to use model.train_on_batch this is simple version of fit to be used on small batch of data.但最好使用model.train_on_batch这是适用于小批量数据的简单版本。

you can also modify your code to add other wav file feature to data.您还可以修改代码以将其他 wav 文件功能添加到数据中。

# second way
input_len = 10 # the frame number for learning to make next one
input=[]
target=[]

for f in ['A.wav','B.wav','C.wav']:
  a, sr = librosa.load(f,sr=22050)
  rawdata = librosa.stft(a, n_fft=512,hop_length= 512 // 4, window='hann') #make fourier transfered A.wav data.
  rawdata = rawdata.transpose() # [Frame,Freq] => [Freq,Frame]

  for i in range(0, len(rawdata) - input_len): 
    input.append( rawdata[i:i+input_len] ) # frames
    target.append( rawdata[i+input_len] )  # one step forward frame for answer.

如何为 RNN 输入多个时间序列数据（wave）

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-11-17 09:43:37

如何为 RNN 输入多个时间序列数据（wave）

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-11-17 09:43:37

解决方案1
1 已采纳 2020-11-17 09:43:37