[英]How can we use artificial neural networks to find similar documents?
我們如何使用ANN查找一些相似的文檔? 我知道這是一個愚蠢的問題,但是我是NLP領域的新手。 我使用kNN和詞袋方法制作了一個模型來解決我的問題。 使用它,我可以獲得n個與輸入內容有些相似的文檔(以及它們的緊密程度),但是現在我想使用ANN來實現相同的功能,但我一無所知。
在此先感謝您的幫助或建議。
獲取語言嵌入的方法是在您選擇的語料庫上對其進行訓練 (足夠大,例如Wikipedia),或者下載經過訓練的嵌入(對於python,有許多經過培訓的或可通過gensim
模塊加載的嵌入源-這是一個實際上是Python word2vec的標准)。
您也可以使用GloVe (使用Gloves glove-python
)或FastText詞嵌入。
如果您有興趣,可以找到帶有代碼示例和源論文的嵌入的詳細說明 。
看看https://arxiv.org/pdf/1805.10685.pdf可以為您提供總體思路的論文。 檢查此鏈接以獲取更多參考https://github.com/Hironsan/awesome-embedding-models
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.