[英]Create edgelist from dataframe with groups in Python
我有以下數據:
import pandas as pd
employee=["a","b","a","c","d","e","c","d","f"]
project=[1,1,2,2,2,3,3,4,4]
df=pd.DataFrame({"employee":employee,
"project":project})
我想從此數據框中創建一個邊緣列表。 過去,當我使用RI時,使用以下代碼:
edges<-unique(df %>% group_by(project) %>%
filter(n()>=2) %>% group_by(project) %>%
do(data.frame(t(combn(.$employee, 2)), stringsAsFactors=FALSE)))
edges<-subset(edges,as.numeric(edges$X1)-as.numeric(edges$X2)!=0)
但是,當我想在Python中做同樣的事情時,我不會成功。 任何人都可以提供一些有關如何將其轉換為邊緣列表的技巧(可能通過鄰接矩陣)。
所需的結果應如下所示
employee1 employee2
A B
A C
C D
E C
D F
編輯:我終於找到了答案: 熊貓-根據列值將數據框重塑為邊緣列表
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.