簡體   English   中英

使用 sklearn.feature_extraction.text 時出現 KeyError

[英]KeyError while using sklearn.feature_extraction.text

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
tfidf = TfidfVectorizer(analyzer='word', stop_words='english')

age_matrix = tfidf.fit_transform(df['age'])

運行上述代碼時可能會出現以下錯誤。

為什么會發生這種情況?

請幫我。 提前致謝。

/usr/local/lib/python3.6/dist-packages/pandas/core/indexes/base.py in get_loc(self, key, method, tolerance) 2895 return self._engine.get_loc(casted_key) 2896 除了 KeyError 作為錯誤:-> 2897 如果公差不是 None,則從 err 2898 2899 引發 KeyError(key):

關鍵錯誤:'年齡'

我的數據集如下。

        Gender                      product  0
age                                       
18       F                    Bags-Mens  5
18       F                   Bags-Women  4
18       F               Books-Academic  4
18       F               Books-Children  5
18       F                 Books-Comics  7
..     ...                          ... ..
44       M                 Books-Comics  2
44       M                Clothing-Mens  1
44       M               Clothing-Women  1
44       M               Footwear-Women  1
44       M  Home and kitchen-Furnishing  2

[1202 rows x 3 columns]

似乎'age'是數據框索引(而不是列),因此您無法通過df['age']訪問它。

您可以將df.index傳遞給 fit_transform 方法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM