繁体   English   中英

Gensim Word2Vec 或 FastText 从频率构建词汇

[英]Gensim Word2Vec or FastText build vocab from frequency

我想知道.build_vocab_from_freq()函数实际上做了什么? 当我不使用它时有什么区别? 谢谢!

它“从词频词典中构建词汇表”。 您的 gensim 模型需要一个词汇表。 通常你从你的语料库中构建它。 这基本上是从词频词典构建词汇的另一种选择。 例如,词频通常用于过滤对您的模型无意义的低频或高频词。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM