简体   繁体   English

Scala/Java word2vec 阅读器

[英]Scala / Java word2vec reader

I've got several word2vec text files with the following standard layout:我有几个具有以下标准布局的 word2vec 文本文件:

numWords vecSize
word1 vec1 vec2 ...
word2 vec1 vec2 ...
...

Is there any Scala or Java library to read these and calculate simple stuff like:是否有任何 Scala 或 Java 库来读取这些并计算简单的东西,例如:

  • isWordInVocab isWordInVocab
  • getWordVectors获取词向量
  • nearestNeighbours最近的邻居
  • cosDistance cos距离
  • ... ...

I could find some only for binary formats, is there a way to use these (apart from writing my own one)?我只能找到一些二进制格式,有没有办法使用这些(除了写我自己的)?

我刚刚结束了自己的类,以避免整个 dl4j/nd4j 导入/设置/运行过程。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM