[英]KeyError while using sklearn.feature_extraction.text
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
tfidf = TfidfVectorizer(analyzer='word', stop_words='english')
age_matrix = tfidf.fit_transform(df['age'])
運行上述代碼時可能會出現以下錯誤。
為什么會發生這種情況?
請幫我。 提前致謝。
/usr/local/lib/python3.6/dist-packages/pandas/core/indexes/base.py in get_loc(self, key, method, tolerance) 2895 return self._engine.get_loc(casted_key) 2896 除了 KeyError 作為錯誤:-> 2897 如果公差不是 None,則從 err 2898 2899 引發 KeyError(key):
關鍵錯誤:'年齡'
我的數據集如下。
Gender product 0
age
18 F Bags-Mens 5
18 F Bags-Women 4
18 F Books-Academic 4
18 F Books-Children 5
18 F Books-Comics 7
.. ... ... ..
44 M Books-Comics 2
44 M Clothing-Mens 1
44 M Clothing-Women 1
44 M Footwear-Women 1
44 M Home and kitchen-Furnishing 2
[1202 rows x 3 columns]
似乎'age'是數據框索引(而不是列),因此您無法通過df['age']訪問它。
您可以將df.index傳遞給 fit_transform 方法。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.