[英]How to retrieve one column from csv file using python?
我試圖從其中一個 csv 文件中檢索年齡列,這是我到目前為止編碼的內容。
df = pd.DataFrame.from_csv('train.csv')
result = df[(df.Sex=='female') & (df.Pclass==3)]
print(result.Age)
# finding the average age of all people who survived
print len(result)
sum = len(result)
我打印了年齡,因為我想查看屬於具有“女性”值的性別列和值為“3”的類列的所有年齡的列表
由於某種原因,打印結果顯示了列號和它旁邊的年齡,我只想打印年齡列表。
PassengerId
3 26.0
9 27.0
11 4.0
15 14.0
19 31.0
20 NaN
23 15.0
25 8.0
26 38.0
29 NaN
33 NaN
39 18.0
40 14.0
41 40.0
45 19.0
48 NaN
50 18.0
69 17.0
72 16.0
80 30.0
83 NaN
86 33.0
101 28.0
107 21.0
110 NaN
112 14.5
114 20.0
115 17.0
120 2.0
129 NaN
...
658 32.0
678 18.0
679 43.0
681 NaN
692 4.0
698 NaN
703 18.0
728 NaN
730 25.0
737 48.0
768 30.5
778 5.0
781 13.0
787 18.0
793 NaN
798 31.0
800 30.0
808 18.0
814 6.0
817 23.0
824 27.0
831 15.0
853 9.0
856 18.0
859 24.0
864 NaN
876 15.0
883 22.0
886 39.0
889 NaN
Name: Age, dtype: float64
這是我的程序打印的內容,我只想要右側列中的年齡列表,而不是左側的乘客 ID 列。
謝謝
result.Age
是一個 pandas Series
對象,因此當您print
它時,還會顯示列標題、索引和數據類型。 這是一件好事,因為它使對象的打印表示有用得多。
如果要精確控制數據的顯示方式,則需要進行一些字符串格式化。 這樣的事情應該做你所要求的:
print('\n'.join(str(x) for x in result.Age))
如果您出於某種原因想要訪問該列下的原始數據(通常您也可以使用Series
),沒有索引或標題,您可以獲得一個 numpy 數組
result.Age.values
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.