.loc 和 np.nan 的問題

Question

我遇到了以下代碼的問題：

student_data_df.loc[(student_data_df.school_name=="Thomas High School") & (student_data_df.grade=='9th'), student_data_df.reading_score] = np.nan

基本上我試圖在 dataframe 上使用 .loc 來提取特定的學校名稱和年級，然后將列中的所有分數更改為 NaN 以使其無效。 但是，我遇到了一個問題，當我嘗試運行單元時，什么也沒有發生。 沒有錯誤，沒有打印。

我究竟做錯了什么？

Answer 1

將您的代碼分成單獨的行以使其易於理解和調試：

school_matches = student_data_df.school_name=="Thomas High School"
grade_matches = student_data_df.grade=='9th'
rows = school_matches & grade_matches
column = student_data_df.reading_score

student_data_df.loc[rows, column] = np.nan

我認為前三行很好，問題出在第四行。 您在兩個維度上“定位”：

包含“Thomas High School”和“9th”年級的行。
包含...閱讀分數的列？ 我敢打賭這不是你想要的。 我敢打賭，您想要的是 select 將 reading_score 列設置為nan 。 為此，您需要：

column = 'reading_score'

我們現在要做的是定位名為“reading_score”的列，而不是定位分數的值（這是荒謬的）。

參考： https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.loc.html

.loc 和 np.nan 的問題

問題描述

1 個解決方案

解決方案1
0 2022-01-30 06:28:36

.loc 和 np.nan 的問題

問題描述

1 個解決方案

解決方案1 0 2022-01-30 06:28:36

解決方案1
0 2022-01-30 06:28:36