![](/img/trans.png)
[英]how do I classify or regroup dataset based on time variation in python
[英]how do i classify the reviews as good and bad using nlp for the dataset that i have?
我有服裝電子商務商店的客戶評論數據,我正在'jupyter-notebook'上使用python學習'nlp',我想學習如何使用nlp將'Review Text'欄的評論分為好還是壞。
我已導入文件,並用定界符分隔,清除了數據的“審閱文本”列數據標記化,如轉換為小寫字母,停用詞發出,詞干和拆分。
請在這個項目上幫助我。 我嘗試通過從一些博客中學習來做到這一點,但並沒有太大幫助。
通過查看您的數據集,我假設您可以將Review Text列作為自變量,而將“ Positive feedback”列作為從屬變量,該變量由0和1組成。步驟1:對“ Review text”列進行詞干處理步驟2:拆分單詞並將其轉換為小寫並刪除所有正則表達式步驟3:使用Count矢量化器步驟4:接下來,在x =“ Review text” y =“ Positive feedback”中進行train_test_split步驟5:接下來,使用任何分類器將單詞分類為0和1個
如需進一步的指導,請參閱此鏈接https://www.kaggle.com/apekshakom/sentiment-analysis-of-restaurant-reviews
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.