簡體 English 中英

語言模型評估如何處理未知詞？

[英]How does language model evaluation work with unknown words?

原文 2017-10-12 15:03:12 9 1 language-model/ perplexity

因此，對於構建語言模型，將排名超出詞匯量范圍的頻率較低的單詞替換為“ UNK”。

我的問題是，如何評估基於“ UNK”評估概率的語言模型？ 假設我們要在測試集上評估這種語言模型的困惑性，對於模型未知的單詞，我們基於未知單詞的“袋”評估獲得的概率。

這似乎是有問題的，因為如果我們將詞匯量設置為1，即所有單詞都是未知的，那么這種無能為力的語言模型的困惑將是1。

1 個解決方案

這個文件很好地解釋了這個問題：

https://web.stanford.edu/~jurafsky/slp3/4.pdf

簡而言之，困惑只能在具有相同詞匯的語言模型之間進行比較。

Ulmfit 的語言 model 在應用於文本分類問題時如何工作？

[英]How does Ulmfit's language model work when applied on a text classification problem?

創建50,000字的ARPA語言模型文件

[英]Creating ARPA language model file with 50,000 words

語言 model 中的“theta”是什么意思？

[英]What does 'theta' mean in a language model?

如何使用龐大的語言模型調整機器翻譯模型？

[英]How to tune a Machine Translation model with huge language model?

如何從本地機器加載 spacy 語言 model？

[英]How to load spacy language model from local machine?

SRILM語言模型

[英]language model with SRILM

檢查語言模型的困惑

[英]Check perplexity of a Language Model

填充和注意掩碼在 GPT 語言模型的批量輸入中無法按預期工作

[英]padding and attention mask does not work as intended in batch input in GPT language model

訪問空間屏蔽語言模型

[英]Access spaCy Masked Language Model

如何將整個句子的語言模型分數與句子成分的分數聯系起來

[英]How to relate the language model score of a whole sentence to those of the sentence's constituents

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Ulmfit 的語言 model 在應用於文本分類問題時如何工作？創建50,000字的ARPA語言模型文件語言 model 中的“theta”是什么意思？如何使用龐大的語言模型調整機器翻譯模型？如何從本地機器加載 spacy 語言 model？ SRILM語言模型檢查語言模型的困惑填充和注意掩碼在 GPT 語言模型的批量輸入中無法按預期工作訪問空間屏蔽語言模型如何將整個句子的語言模型分數與句子成分的分數聯系起來

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM