使用 sklearn.feature_extraction.text 時出現 KeyError

Question

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
tfidf = TfidfVectorizer(analyzer='word', stop_words='english')

age_matrix = tfidf.fit_transform(df['age'])

運行上述代碼時可能會出現以下錯誤。

為什么會發生這種情況？

請幫我。 提前致謝。

/usr/local/lib/python3.6/dist-packages/pandas/core/indexes/base.py in get_loc(self, key, method, tolerance) 2895 return self._engine.get_loc(casted_key) 2896 除了 KeyError 作為錯誤：-> 2897 如果公差不是 None，則從 err 2898 2899 引發 KeyError(key)：

關鍵錯誤：'年齡'

我的數據集如下。

        Gender                      product  0
age                                       
18       F                    Bags-Mens  5
18       F                   Bags-Women  4
18       F               Books-Academic  4
18       F               Books-Children  5
18       F                 Books-Comics  7
..     ...                          ... ..
44       M                 Books-Comics  2
44       M                Clothing-Mens  1
44       M               Clothing-Women  1
44       M               Footwear-Women  1
44       M  Home and kitchen-Furnishing  2

[1202 rows x 3 columns]

Answer 1

似乎'age'是數據框索引（而不是列），因此您無法通過df['age']訪問它。

您可以將df.index傳遞給 fit_transform 方法。

使用 sklearn.feature_extraction.text 時出現 KeyError

問題描述

1 個解決方案

解決方案1
0 2020-11-06 10:42:11

使用 sklearn.feature_extraction.text 時出現 KeyError

問題描述

1 個解決方案

解決方案1 0 2020-11-06 10:42:11

解決方案1
0 2020-11-06 10:42:11