[英]Merging 2 data frames without changing associated values
我目前有2個數據集1 =每個醫院開出的葯物2 =犯罪
我已經能夠將所定位的醫院ID分配給各種犯罪活動,因此可以確定哪家醫院更近。
我真正想做的是將使用count_values方法開出的處方葯數量分配給犯罪數據中的醫院ID,這樣我就可以繪制出犯罪發生地和從中開出的處方葯總量的散點矩陣最近的醫院。
我嘗試使用以下
df = Crimes.merge(hosp[['hosp no', 'Total Quantity']],
left_on='hosp_no', right_on='hosp no').drop('hosp no', 1)
df
但是,當我使用上面的代碼時,與犯罪相關的醫院ID發生了變化,我也不想這樣做!
我是Jupyter Notebook的新手,所以我將非常感謝您的幫助!! 先感謝您
犯罪df
ID Type Hosp No
0 Anti-Social 222
醫院df
Hosp no Total Quantity Drug name
222 1000 Paracetamol
因此,基本上,Hosp 222規定了1000種撲熱息痛葯物,我如何將數字1000分配給Crime df,Hosp No = 222看起來像這樣:Crimes df
ID Type Hosp No Total Quantity
0 Anti-Social 222 1000
如果您要合並的列使用相同的名稱,則不需要on參數。 由於您需要將列添加到犯罪中,因此我們可以使用參數how = left
Crimes = Crimes.merge(Hosp[['Hosp No', 'Total Quantity']], how = 'left')
ID Type Hosp No Total Quantity
0 0 Anti-Social 222 1000
讓我知道這是否是所需的輸出或您還需要其他什么
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.