簡體 English 中英

Long Sequence 在 seq2seq 模型中注意？

[英]Long Sequence In a seq2seq model with attention?

原文 2017-06-04 05:45:49 1 1 python/ lstm/ summarization/ pytorch

我正在關注這個 pytorch 教程，並嘗試將這一原則應用於總結，其中編碼序列約為 1000 個單詞，解碼器目標為 200 個單詞。

我如何將seq2seq應用於此？ 我知道一次遍歷整個 1000 個單詞的序列會非常昂貴且幾乎不可行。 因此，將 seq 分成 20 個 seq 並並行運行可能是一個答案。 但我不確定如何實現它； 我也想把注意力融入其中。

1 個解決方案

您無法及時並行化 RNN（此處為 1000），因為它們本質上是順序的。

您可以使用輕量級 RNN，例如QRNN或SRU作為更快的替代方案（仍然是順序的）。

另一個常見的序列處理模塊是TCN和Transformer ，它們都可以在時間上並行化。

另外，請注意，所有這些都可以謹慎使用，並且可以完美地處理文本。

對 keras seq2seq 模型的注意力層

[英]Attention layer to keras seq2seq model

在 Keras 上將注意力層與解碼器輸入 seq2seq 模型連接起來

[英]Concatening an attention layer with decoder input seq2seq model on Keras

應用編碼器-解碼器 (Seq2Seq) 推理 model 並注意

[英]Apply an Encoder-Decoder (Seq2Seq) inference model with Attention

NStepLSTM和Seq2Seq模型

[英]NStepLSTM and Seq2Seq model

Tensorflow：注意輸出與下一個解碼器輸入連接在一起，導致seq2seq模型中的尺寸不匹配

[英]Tensorflow: Attention output gets concatenated with the next decoder input causing dimension missmatch in seq2seq model

seq2seq模型中的BLSTM編碼器Tensorflow

[英]BLSTM encoder in seq2seq model Tensorflow

恢復keras seq2seq模型

[英]Restore keras seq2seq model

如何加載 Seq2Seq 模型並使用它？

[英]How to load a Seq2Seq Model and use it?

Seq2Seq 聊天機器人保存模型幫助

[英]Seq2Seq chatbot saving model assistance

這是一個有效的 seq2seq lstm model 嗎？

[英]Is this a valid seq2seq lstm model?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 對 keras seq2seq 模型的注意力層在 Keras 上將注意力層與解碼器輸入 seq2seq 模型連接起來應用編碼器-解碼器 (Seq2Seq) 推理 model 並注意 NStepLSTM和Seq2Seq模型 Tensorflow：注意輸出與下一個解碼器輸入連接在一起，導致seq2seq模型中的尺寸不匹配 seq2seq模型中的BLSTM編碼器Tensorflow 恢復keras seq2seq模型如何加載 Seq2Seq 模型並使用它？ Seq2Seq 聊天機器人保存模型幫助這是一個有效的 seq2seq lstm model 嗎？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM