簡體   English   中英

ValueError:維度不匹配tfidf朴素的貝葉斯

[英]ValueError: dimension mismatch tfidf naive bayes

我真的需要你的幫助。 我的工作在文本分類,我用tfidfnaive bayes ngram所以我救了我的模型,然后我裝好了再利用和分類的一句話,問題是我用了之后tfidf加載,當我試圖用我的模型,我得到這個錯誤

“ValueError:dimension mismatch”在此先感謝

from Feature_Engineering import clean_text_test
import pandas as pd 
X_raw = 'Spécialisées dans l’achat et la revente de produits de luxes, ces organisations parviennent à blanchir des centaines de millions d’euros par an. Le luxe à la française fascine les jeunes Chinois de la classe moyenne. C’est tellement vrai qu’en région parisienne des organisations occultes profitent de la revente de vêtements et d’articles de maroquinerie pour blanchir de l’argent provenant de fraudes fiscales, du proxénétisme ou du trafic de drogue. Les enquêteurs du deuxième district de police judiciaire de Paris viennent de mettre à bas, à l’automne dernier, un réseau fort d’au moins six hommes et femmes d’origine chinoise, âgés de 30 et 40 ans, qui entre 2017 et 2018, a fait circuler plus de cinq millions d’euros entre la France et la Chine, sans payer un centime de taxe.'

X_final=clean_text_test(X_raw)

df_train = pd.DataFrame({'X': [X_final]})

tf1 = pickle.load(open("tf_ngram.pkl", 'rb'))

# Create new tfidfVectorizer with old vocabulary
tf1_new = TfidfVectorizer(analyzer='word', ngram_range=(5,5),  lowercase = True,
                          max_features = 50000, vocabulary = tf1.vocabulary_)
X_tf1 = tf1_new.fit_transform(df_train.X)

filename = 'Naive_Bayes_CountVect'

loaded_model = pickle.load(open(filename, 'rb'))

ypredict=loaded_model.predict(X_tf1)

為什么你再次適合你的TF-IDF矢量圖? 你只需要做X_tf1 = tf1.transform(df_train.X)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM