cost 141 ms
培訓/使用 OpenAI GPT-3 進行翻譯

[英]Training / using OpenAI GPT-3 for translations

我正在嘗試使用 OpenAI 將我的產品描述從一種語言翻譯成其他一些語言(EN、DE、CZ、SK、HU、PL、SI...)。 翻譯,尤其是對 SK/CZ/HU/PL 語言的翻譯(主要是語法上)非常糟糕(使用text-davinci-003模型)。 我有一個想法——我已經有幾千種類似的產品被專業翻譯人 ...

在用於機器翻譯的 seq2seq RNN 訓練期間,損失急劇下降,而 BLEU 分數保持為零

[英]loss is drastically decreasing whereas BLEU score stays at zero during training of the seq2seq RNN for machine translation

我正在嘗試使用 LSTM 訓練用於機器翻譯的 RNN。 然而,第一批的 BLEU 減少到零,並在所有訓練期間保持在這個水平。 與此同時,損失正在急劇減少。 可能是什么問題? **代碼: ** 訓練,在開發數據集和損失上評估的 BLEU 分數圖 訓練,在開發數據集和損失上評估的 BLEU 分數圖我認 ...

FairSeq 中基於 BLEU 的提前停止

[英]Early stopping based on BLEU in FairSeq

我的目標是在 FairSeq 中訓練翻譯 model 時使用 BLEU 作為早停指標。 按照文檔,我將以下 arguments 添加到我的訓練腳本中: 我收到以下錯誤: 系統信息: fairseq版本:0.10.2 手電筒:1.10.1+cu113 更多細節: 當我嘗試 f.netune M2M1 ...

huggingface 翻譯模型是否支持源和目標的單獨詞匯表?

[英]Do huggingface translation models support separate vocabulary for source and target?

到目前為止我看過的每個例子似乎都在源語言和目標語言之間使用共享詞匯表,我想知道這是否是 Huggingface 模型的硬編碼約束,或者我的誤解,或者我只是沒有看在正確的地方了嗎? 舉一個隨機的例子,當我在這里查看文件時, https://huggingface.co/Helsinki-NLP/op ...

(錯誤)- 使用 open.ai whisper 進行文本到文本的翻譯

[英](Mis)-using open.ai whisper for text-to-text translation

我注意到使用 openai whisper 語音到文本庫轉錄多種語言的語音有時會准確識別另一種語言的插入,並會提供預期的 output,例如:八十多個人 is the same as 八十幾個人. So 多 and 幾 are interchangeable and they can both me ...

鏈接谷歌自動翻譯自定義 model 與詞匯表

[英]Link Google automl translation custom model with glossary

我已經使用 Google automl 構建了自定義翻譯 model 和詞匯表。 這導致了兩種不同的路徑,一種用於使用 model,另一種用於詞匯表。 我想知道是否可以將 model 和詞匯表鏈接起來,以獲得將模型+詞匯表與不同的翻譯工具(在我的例子中是 Wordbee)連接起來的單一路徑。 我現在 ...

Image Captioning評估常用的BLEU平滑function是哪個?

[英]Which BLEU smoothing function is commonly used for Image Captioning evaluation?

我正在圖像字幕領域研究和運行一些實驗,我無法完全弄清楚的一件事是我何時必須評估我訓練的模型:我應該使用哪些 NLTK 平滑函數。 當我嘗試在沒有 Smoothin function 的情況下運行 BLEU 測試時,我收到一條警告告訴我這樣做,但其中有 7 個。 由於沒有 Image caption ...

如何在句子及其翻譯之間執行單詞級 alignment?

[英]How to perform word-level alignment between a sentence and its translation?

我想在多語言翻譯設置中對齊源句和目標句。 從概念上講,我想對示例性英語源句和德語目標句執行以下操作: 字級 alignment 將是:0-0 1-1 2-2 3-3 4-7 5-4 6-5 7-6 或者在源句和目標句長度不同的情況下: 字級 alignment 應該類似於: 0-0 1-1 2-2 ...

選擇分詞器的詞匯量

[英]Choose vocabulary size of tokenizer

我有一個數據集,其中包含大約 150,000 個用於機器翻譯任務的句子對。 我必須從源語言和目標語言的數據集構建一個標記器。 我應該為分詞器選擇詞匯量嗎? 謝謝 ...

我們如何在機器翻譯中生成第一個目標詞?

[英]How do we generate the first target words in machine translation?

我正在學習使用變壓器的機器翻譯任務。 據我所知,變形金剛 model 根據源句的前一個詞預測目標句的下一個詞。 但是,在 MarianMT model(或 T5)中,我發現它的標記器沒有句子開頭標記(<cls> 或 <s>)。 我認為需要一個標記來開始預測目標句子中的第一個 ...

如何檢查二值化 FairSeq 數據集中的值?

[英]How to inspect values in binarized FairSeq datasets?

運行fairseq-preprocess腳本會生成二進制文件,其中包含 integer 個索引,對應於字典中的令牌 ID。 當我不再擁有原始標記化文本時,探索二值化數據集的最簡單方法是什么? 該文檔沒有詳細說明如何加載數據集以進行調試。 ...

BLEU分數和METEOR有什么區別?

[英]What are the differences between BLEU score and METEOR?

我試圖理解評估機器翻譯評估分數的概念。 我了解 BLEU 分數是如何達到的。 它查看不同的 n-gram,如 BLEU-1、BLEU-2、BLEU-3、BLEU-4,並嘗試與人類書面翻譯相匹配。 但是,我真的無法理解 METEOR 分數用於評估 MT 質量。 我正在嘗試直觀地理解基本原理。 我已經 ...

在語料庫中查找給定單詞的翻譯,例如通過機器學習、word2vec、文本挖掘

[英]Find translations of a given word in the corpus e.g. by machine learning, word2vec, text mining

我正在使用這個線程來獲得一些想法並找到一些可能性。 我有大約 1000 篇講道及其翻譯成另一種語言。 講道的長度是不同的。 這些是宗教布道文本。 由於領域(宗教),有很多詞可以根據上下文以不同的方式使用。 同一個詞可以變成不同的意思。 有沒有辦法,我可以“以編程方式”獲得目標語言中給定單詞的翻譯? ...

如何從文本文件的每一行中刪除一段文本?

[英]How to strip a certain piece of text from each line of a text file?

我已經下載了帶有英語-德語句子對的制表符分隔的 tatoeba 數據集,以在其上訓練 NMT model。 不幸的是,每一行都以各種附加信息結尾: 如何剝離文本文件中每一行第二句之后的部分? 我嘗試在 python 中這樣做: ...但這沒有用。 我正在尋找的是一個看起來像這樣的文件: 對於任何 ...

MarianMT 和 OpusMT 有什么區別?

[英]What is the difference between MarianMT and OpusMT?

我目前正在比較各種預訓練的 NMT 模型,不禁想知道 MarianMT 和 OpusMT 之間的區別是什么。 根據 OpusMT 的Github ,它基於 MarianMT。 然而,在Huggingface 轉換器實現中,所有預訓練的 MarianMT 模型都以“Helsinki-NLP/opus ...

"創建神經機器翻譯基礎知識"

[英]Creating a Neural Machine Translation basics

我目前正在進行一個項目設計,我將創建一個程序\/模型來將我的母語方言翻譯成英語,我想問在創建我的項目時有什么書或任何東西可以推薦給我。" ...

使用 GPU 和簡單的變壓器 mt5 培訓

[英]using gpu with simple transformer mt5 training

mt5 微調不使用 gpu(volatile gpu utill 0%) 嗨,我正在嘗試使用 mt5-base 模型對 ko-en 翻譯進行微調。 我認為 cuda 設置是正確的(cuda available is True)但是在訓練期間,除了首先獲取數據集(非常短的時間)之外,訓練集不使用 ...

Tensorflow unicode 文本編碼-解碼

[英]Tensorflow unicode text encoding-decoding

我剛開始使用西里爾文。 文本預處理后無法正確打印俄文文本。 如何在文本加載期間設置編碼? 輸出 1: 創建數據集: 輸出 2: 你能告訴我這里打印俄文有什么問題嗎? 英文文本打印正常。 ...

如何在通過 AWS SageMaker 使用 Facebook 的 M2M-100 HuggingFace 模型時指定 force_bos_token_id?

[英]How to specify a forced_bos_token_id when using Facebook's M2M-100 HuggingFace model through AWS SageMaker?

模型頁面提供了該模型應該如何使用的代碼片段: from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer hi_text = "जीवन एक चॉकलेट बॉक्स की तरह है।" chinese_t ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM