[英]Create a dataframe which shows the Relationship between 2 Dataframes
您好,這是我的第一個問題,我嘗試了一切。
我是 Dataframe 和 SQL 的新手,我有一個包含多部電影的 excel 表。 它有電影名稱、年份、...和演員等列。 在 Column Actors 中是多個 Actors listet,由 / 分隔。 我創建了一個具有 UUID 的 Dataframe Movies,以及我應該為電影存儲的所有信息。 我還過濾了我所有電影中的所有演員,並創建了一個名為 Actors 的 DataFrame,它也有一個唯一 ID 和名稱,並單獨存儲它們。
DF_MOVIE:
影片編號 | 演員 |
---|---|
X | 人 1、人 2、人 5 |
是 | 人1 |
DF_演員:
演員ID | 演員 |
---|---|
一種 | 人1 |
b | 人 5 |
我想要創建的是一個新的 Dataframe,它顯示了它們之間的關系。
例如:
DF_ACTORS_MOVIE:
影片編號 | 演員ID |
---|---|
X | 一種 |
X | b |
問題是:我的 Excel 表(和 Bookdf)中有 Actors。 我想同時使用兩個 IDS。
有人有想法嗎? 將不勝感激,謝謝..:
我嘗試迭代兩本 Dataframe 書籍,並嘗試使用兩個 UUIDS 在 DF_ACTORS_MOVIE Dataframe 上創建一個新條目。 問題是,有多個 Actor,它們被 / 和 / 分開。
您可以先將explode
分解為一個新列:
out = df_actors.merge(df_movie.assign(Actor=df_movie['Actors'].str.split(','))
.explode('Actor').drop(columns='Actors')
)
輸出:
ActorID Actor Movie ID
0 a Person1 x
1 a Person1 y
2 b Person5 x
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.