簡體   English   中英

如何使用nlp對我擁有的數據集將評論分為好與壞?

[英]how do i classify the reviews as good and bad using nlp for the dataset that i have?

我在jupyter上嘗試過 的數據 事物 的tsv文件

我有服裝電子商務商店的客戶評論數據,我正在'jupyter-notebook'上使用python學習'nlp',我想學習如何使用nlp將'Review Text'欄的評論分為好還是壞。

  • 項目清單

我已導入文件,並用定界符分隔,清除了數據的“審閱文本”列數據標記化,如轉換為小寫字母,停用詞發出,詞干和拆分。

請在這個項目上幫助我。 我嘗試通過從一些博客中學習來做到這一點,但並沒有太大幫助。

通過查看您的數據集,我假設您可以將Review Text列作為自變量,而將“ Positive feedback”列作為從屬變量,該變量由0和1組成。步驟1:對“ Review text”列進行詞干處理步驟2:拆分單詞並將其轉換為小寫並刪除所有正則表達式步驟3:使用Count矢量化器步驟4:接下來,在x =“ Review text” y =“ Positive feedback”中進行train_test_split步驟5:接下來,使用任何分類器將單詞分類為0和1個

如需進一步的指導,請參閱此鏈接https://www.kaggle.com/apekshakom/sentiment-analysis-of-restaurant-reviews

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM