cost 269 ms
將 Beam-scores 轉儲到 HDF 文件

[英]Dumping Beam-scores to an HDF File

我有一個翻譯 model (TM),它使用波束搜索綜合其假設。 出於分析目的,我想研究 TM 的ChoiceLayer發射的每個光束中的所有假設。 我可以使用HDFDumpLayer從 TM 的ChoiceLayer中獲取每個輸入序列的假設並將其寫入我的文件系統:'__SEARCH_dump_bea ...

2020-12-14 16:19:26   1   39    returnn  
加載地面事實和假設作為訓練目標

[英]Loading Ground Truth and Hypotheses as Training Target

在較早的問題( Teacher-Student System: Training Student With k Target Sequences for Each Input Sequence )中,我想要教師機器翻譯 (MT) model 在學生語音翻譯 (ST) model 訓練期間執行在線搜索 ...

2020-08-14 11:11:57   1   51    returnn  
用常數零添加額外損失 output 改變 model 收斂

[英]Adding additional loss with constant zero output changes model convergence

我已經為 NMT 設置了一個 Returnn Transformer Model,我想對每個解碼器層l上的每個編碼器/解碼器注意力頭h進行額外損失訓練(除了香草交叉熵損失),即: 對於一些標量lambda 。 我使用loss=as_is選項將注意力損失本身實現為eval -Layer,它為每個批次返 ...

師生系統:為每個輸入序列訓練具有 k 個目標序列的學生

[英]Teacher-Student System: Training Student With k Target Sequences for Each Input Sequence

這個問題與師生系統有關:Training Student with Top-k Hypotheses List 我想配置一個師生系統,其中教師 seq2seq model 生成一個前k個假設列表,用於訓練學生 seq2seq model。 我 select 來自教師的ChoiceLayer (或 o ...

2020-06-12 12:44:52   1   42    returnn  
師生系統:用 Top-k 假設列表訓練學生

[英]Teacher-Student System: Training Student with Top-k Hypotheses List

我想配置一個師生系統,其中教師 seq2seq model 生成一個前k個假設列表,用於訓練學生 seq2seq model。 我的計划是對教師的假設進行批處理,這意味着教師輸出一個批處理軸長度為k * B的張量,其中B是輸入批處理軸長度。 output 批張量現在包含輸入批張量中每個序列的k個假 ...

2020-06-08 09:29:01   1   93    returnn  
如何從檢查點加載圖層

[英]How to load a layer from checkpoint

我有這個配置: 我想從一些現有的檢查點加載層source_embed_raw的參數。 在該檢查點中, param 的調用方式不同( output/rec/target_embed_raw/W )。 我明白,我可以使用preload_from_files加載參數,但我不確定在我的情況下這樣做的確 ...

將參數從子網內的層重用到該子網外的層

[英]Reusing Parameters from a layer inside a subnetwork to a layer outside of that subnetwork

在我的網絡結構中,我有一層名為“輸出”的“rec”類。 在該層的“單元”中,我有幾個層,其中一個是“pivot_target_embed_raw”。 'pivot_target_embed_raw' 層將從另一個檢查點加載。 我現在也想將“pivot_target_embed_raw”的參數用於我 ...

無法使用 tf.train.import_meta_graph 導入元圖,名稱“”指的是不在圖中的操作

[英]Unable to import meta graph using tf.train.import_meta_graph, The name '' refers to an Operation not in the graph

我無法導入元圖。 即使我定義了 tf.placeholder(name="data", shape=(None,64), dtype=tf.float32),下一層也會出現錯誤。 我也嘗試使用 tf2.0。 但同樣的問題。 重現問題的代碼 檢查點文件附加在model.zip 中。 堆棧跟 ...

從 .meta 文件加載已保存的 Tensorflow 模型

[英]Loading a saved Tensorflow model from its .meta file

我正在嘗試使用 Tensorflow 1.15 版從保存的檢查點加載 tensorflow 元圖,以將其轉換為 SavedModel 以供 tensorflow 服務。 它是一個帶有局部注意力和單向 LSTM 的語音識別模型,使用帶有 Tensorflow 后端的 Returnn 工具包實現。 我正 ...

你如何提取模型中使用的初始權重?

[英]How do you extract the initial weights used in the model?

從文檔中我發現在構建模型后,權重通過調用TFNetwork.initialize_params進行初始化。 我想知道是否有一個 API 來提取這些權重? ...

2020-01-14 22:07:52   1   25    returnn  
如何在更多數據上訓練LM?

[英]How to train LM on more data?

我希望使用returnn訓練新的lm以獲得更多數據。 但是我不知道tain和dev的確切形式,例如 其次,我想知道為什么train_num_seqs等於40418260 ,而librispeech trainig數據集只有281241句子。 等待你的回答 ...

2019-07-19 08:03:56   1   58    returnn  
使用多個GPU進行訓練

[英]Training using multiple GPUs

我想使用多個GPU在LibriSpeech數據集上訓練RETURRN,但不知道該怎么做。 這可能嗎? 我看不到任何在.config文件中啟用它的選項。 ...

2019-04-05 04:10:23   1   36    returnn  
theano.sandbox.cuda 似乎是舊的 GPU 后端並從 Theano 中刪除

[英]theano.sandbox.cuda seems to be old GPU back-end and removed from Theano

當我嘗試在返回的 github 頁面上運行 rnn.py 時,我收到一條關於舊 GPU 后端的錯誤消息。 " https://github.com/rwth-i6/returnn " 這是錯誤消息: SkipTest:您正在導入 theano.sandbox.cuda。 這是舊的 GPU 后 ...

Returnn總機數據處理

[英]Returnn Switchboard data processing

誰能給我有關如何處理Switchboard數據集以進行RETURNN培訓的指導嗎? 我確實看到了BlissDataset類,該類似乎是為配電盤設計的,但是我不清楚在示例中給出的路徑中應該包含什么: 總機數據集有幾個帶有音頻的文件夾,即swb1_d2 / data / *。sph和記錄本 ...

2018-12-05 13:30:39   1   45    returnn  
Returnn中的預培訓

[英]Pretraining in Returnn

我正在嘗試使用此配置在返回中訓練一個簡單的單向編碼器https://github.com/rwth-i6/returnn-experiments/blob/master/2018-asr-attention/librispeech/full-setup-attention/returnn.con ...

2018-12-03 10:40:38   1   58    returnn  
返回自定義圖層搜索模式斷言錯誤

[英]RETURNN Custom Layer Search Mode Assertion Error

我已經實現了一個自定義的RETURNN層( HMM因數分解 ),該層在訓練期間按預期工作,但是在搜索模式下使用時會引發斷言錯誤。 該層的輸出與softmax層的輸出相同。 這是使用的配置: 變壓器+ HMM因式分解 已使用最新版本的RETURNN進行了測試。 失敗的確切行是( ...

返回的BeamSearch解碼代碼庫

[英]BeamSearch decoding codebase in returnn

此配置示例使用了從ctc或seq2seq模型向后添加lm_score的示例用法https://github.com/rwth-i6/returnn-experiments/blob/master/2018-asr-attention/librispeech/attention/exp3.ctc. ...

2018-09-24 10:10:26   1   36    returnn  

排序:
質量:
 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM