簡體   English   中英

如何調整OOV字的FastText參數?

[英]How to tune FastText parameter for OOV word?

我已經聽說 FastText 正在使用其 n-gram 生成 OOV 詞向量。 它已經自動內置在 FastText 架構中,還是我們想調整特定參數? 就像 Keras 標記器中的 oov_tokens。 我已經在尋找要在 Fast Text 中調整的參數,但找不到任何參數。

如果有人知道並想分享他們的知識,我將非常感激。

謝謝你。

OOV 詞的矢量生成已集成到 fastText 中(至少在 Facebook 的原始實現中)。

為了生成這些向量,fastText 使用子詞 n-grams 要了解更多信息,您可以閱讀此主題此視覺指南

因此,對 OOV 詞向量創建影響最大的參數如下:

  • minn (char ngram 的最小長度)
  • maxn (字符 ngram 的最大長度)

有關 fastText 選項/參數的更多信息,請參閱官方文檔

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM