[英]How to deal with data that is not ints in sklearn
我對 sklearn 和 pandas 很陌生,想知道如何處理非 int 值。 我已經做了一些例子,其中數據只是整數並且它有效但現在我正在處理字符串並且它不起作用我嘗試過 astype 但它沒有幫助。
數據在 csv 中,如下所示:
|value| type|
|a | g|
|b | g|
|a | g|
|d | g|
|c | k|
|f | g|
value 是目標,但我不知道如何傳遞它以使用此數據來執行 X 和 Y,因此我可以使用類似 fit.
您不能使用分類值(對象、字符串等)。 必須使用編碼器 (sklearn.preprocessing.LabelEncoder) 將分類變量轉換為數值變量,例如 a --> 0 / b--> 1 / d--> 2 / c --> 3 和 f --> 4 如果您想自定義轉換分類 --> 數字,您應該手動進行轉換。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.