![](/img/trans.png)
[英]How to check if elements of a list of strings in a pandas column are present in another column
[英]Checking if a pandas column value is present in another pandas column (list)
我有一個帶有字符串值的 pandas 列,我想查看一個單獨的列(列出的格式)是否包含該字符串。
類別 | 最高預測 |
---|---|
類別 A. 分子發病機制和生理學 | list see below |
[("Category A. Molecular Pathogenesis and Physiology::HiClass::Separator::1. Amyloid beta::HiClass::Separator::f. Amyloid Structure",
0.054),
('Category B. Diagnosis and Assessment::HiClass::Separator::8. Methodologies::HiClass::Separator::None',
0.049),
('Category B. Diagnosis and Assessment::HiClass::Separator::1. Fluid Biomarkers::HiClass::Separator::b. Blood-based',
0.035)]
生成的列表提供Category
和 2 個進一步的子類別。
我想要的是一種確定和識別Category
列值出現在 column top predicted
列表中的次數的方法。 例如,在上述情況下,“類別 A. 分子發病機制和生理學”將返回 1。如果值為“類別 B. 診斷和評估”,則將返回 2。 然后這將遍歷 pandas 數據框中的行。
任何有助於實現這一目標的幫助將不勝感激:)非常感謝!
您的第二列包含一個元組列表,這些元組又包含要檢查的字符串。 下面幾行代碼應該做到這一點:
df['count'] = df.apply(lambda row: sum(1 for x in row['top predicted'] if row['Category'] in x[0]), axis=1)
您應該使用apply()
而不是按照您的建議遍歷行。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.