簡體   English   中英

創建一個顯示 2 個數據框之間關系的數據框

[英]Create a dataframe which shows the Relationship between 2 Dataframes

您好,這是我的第一個問題,我嘗試了一切。

我是 Dataframe 和 SQL 的新手,我有一個包含多部電影的 excel 表。 它有電影名稱、年份、...和演員等列。 在 Column Actors 中是多個 Actors listet,由 / 分隔。 我創建了一個具有 UUID 的 Dataframe Movies,以及我應該為電影存儲的所有信息。 我還過濾了我所有電影中的所有演員,並創建了一個名為 Actors 的 DataFrame,它也有一個唯一 ID 和名稱,並單獨存儲它們。

DF_MOVIE:

影片編號 演員
X 人 1、人 2、人 5
人1

DF_演員:

演員ID 演員
一種 人1
b 人 5

我想要創建的是一個新的 Dataframe,它顯示了它們之間的關系。

例如:

DF_ACTORS_MOVIE:

影片編號 演員ID
X 一種
X b

問題是:我的 Excel 表(和 Bookdf)中有 Actors。 我想同時使用兩個 IDS。

有人有想法嗎? 將不勝感激,謝謝..:

我嘗試迭代兩本 Dataframe 書籍,並嘗試使用兩個 UUIDS 在 DF_ACTORS_MOVIE Dataframe 上創建一個新條目。 問題是,有多個 Actor,它們被 / 和 / 分開。

您可以先將explode分解為一個新列:

out = df_actors.merge(df_movie.assign(Actor=df_movie['Actors'].str.split(','))
                                            .explode('Actor').drop(columns='Actors')
                      )

輸出:

  ActorID    Actor Movie ID
0       a  Person1        x
1       a  Person1        y
2       b  Person5        x

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM