[英]How to create numpy array from dataframe?
我正在使用包含 4 列的Pandas
DataFrame:“TV”、“Radio”、“Newspaper”和“Sales”。 我需要創建兩個NumPy
arrays: X
包含前 3 列, y
包含“銷售”列。 我發現有兩種方法可以從Pandas
DataFrame 創建NumPy
數組:
import numpy as np
X = np.array(adver_data.iloc[:,0:3].values)
y = np.array(adver_data["Sales"].values)
和:
import numpy as np
X = adver_data[['TV', 'Radio', 'Newspaper']].values
y = adver_data[['Sales']].values
問題是,即使這兩種方法實際上創建了一個NumPy
數組,我的代碼也為這兩種方法給出了不同的結果,我不知道為什么,因為我看不出這兩種方法的 arrays 有何不同。
有什么區別?
假設您有“ n
”行數據。
編碼:
y = np.array(adver_data["Sales"].values)
給出y
的形狀為(n,)
即一維數組
而代碼:
y = adver_data[['Sales']].values
給出y
的形狀為(n, 1)
即二維數組
所以,你會得到不同的結果。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.