[英]How to read a csv with unknown no of columns and compare it with another and retrieve values
我有一个 csv Neighbours.csv
,其中包含疾病名称和患有该疾病的患者:
Chondromalacia patellae,alex,maggie,bob
Hypogonadism,Williams,alex
and so on....
另一个 csv Similarityscores.csv
有患者姓名和他的分数:
Williams,0.0
alex,1.0
bob,2.0
maggie,0.5
and so on....
现在我想要的输出疾病名称和患有该疾病的患者的分数总和:
Chondromalacia patellae,3.5
Hypogonadism,1.0
我曾尝试先处理Neighbours.csv
,但由于患病人数未知,我无法进一步处理。
根据我的理解,你不知道一个特定的疾病有多少患者,对吧?,如果是这样,我有点想法:
1:您加载 csv 并获取疾病的患者列,如下所示
import pandas as pd
data_Neighbours = pd.read_csv("Neighbours.csv")
patients = data_Neighbours["patients"]
2:然后你会得到一个病人名单:
患者 = [髌骨,亚历克斯,玛吉,鲍勃......杰克]
您现在可以获取患者的数量。并根据您的需要在此患者列表上进行一些操作。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.