簡體   English   中英

C++中文檔分類的SVM實現

[英]SVM implementation for document classification in c++

我想實現一個小項目,將一組文檔(file.txt)分類為多個類別,然后根據在 C++ 中使用 SVM 的測試新文檔。

我對此進行了廣泛的搜索,但仍然沒有完全了解我需要做什么! 我聽說過 LIBLINEAR 庫,但我不知道如何使用它,如果我將使用 TF-IDF,我是否需要為每個類都有一個向量? 還是所有類的一個向量? 如何使用 TF-IDF 測試新文檔? 我真的很困惑!

是否要求用 C++ 編寫? Python 為機器學習任務(例如 svm 實現和使用)提供了許多有用的資源和即用型模塊。

例如,在 scikit-learn 上,可以找到有關該主題的有用資源,例如這個: https : //scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html

就您的問題而言 - 對於 TF-IDF 實施,您需要為每個文檔提供一個向量。 對於每個文檔,其中的單詞將被列出並分配值(TF-IDF 值)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM