我有一个字典词典,结构如下: 键的范围从1到大约。 500000,每个嵌套字典包含有关丹麦议会一名成员的一票表决信息。 此外,还有信息可以确定成员投票的唯一投票。 我希望每个成员提取该成员活跃的所有投票,并将这些成员的投票行为与迭代地在同一投票子集上活跃的所有其他成员进行比较。 ...
提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供 中文繁体 英文版本 中英对照 版本,有任何建议请联系yoyou2525@163.com。
我有以下数据:
import pandas as pd
employee=["a","b","a","c","d","e","c","d","f"]
project=[1,1,2,2,2,3,3,4,4]
df=pd.DataFrame({"employee":employee,
"project":project})
我想从此数据框中创建一个边缘列表。 过去,当我使用RI时,使用以下代码:
edges<-unique(df %>% group_by(project) %>%
filter(n()>=2) %>% group_by(project) %>%
do(data.frame(t(combn(.$employee, 2)), stringsAsFactors=FALSE)))
edges<-subset(edges,as.numeric(edges$X1)-as.numeric(edges$X2)!=0)
但是,当我想在Python中做同样的事情时,我不会成功。 任何人都可以提供一些有关如何将其转换为边缘列表的技巧(可能通过邻接矩阵)。
所需的结果应如下所示
employee1 employee2
A B
A C
C D
E C
D F
编辑:我终于找到了答案: 熊猫-根据列值将数据框重塑为边缘列表
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.