簡體   English   中英

檢查熊貓列值是否存在於另一個熊貓列(列表)中

[英]Checking if a pandas column value is present in another pandas column (list)

我有一個帶有字符串值的 pandas 列,我想查看一個單獨的列(列出的格式)是否包含該字符串。

類別 最高預測
類別 A. 分子發病機制和生理學 list see below
[("Category A. Molecular Pathogenesis and Physiology::HiClass::Separator::1. Amyloid beta::HiClass::Separator::f. Amyloid Structure",
  0.054),
 ('Category B. Diagnosis and Assessment::HiClass::Separator::8. Methodologies::HiClass::Separator::None',
  0.049),
 ('Category B. Diagnosis and Assessment::HiClass::Separator::1. Fluid Biomarkers::HiClass::Separator::b. Blood-based',
  0.035)]

生成的列表提供Category和 2 個進一步的子類別。

我想要的是一種確定和識別Category列值出現在 column top predicted列表中的次數的方法。 例如,在上述情況下,“類別 A. 分子發病機制和生理學”將返回 1。如果值為“類別 B. 診斷和評估”,則將返回 2。 然后這將遍歷 pandas 數據框中的行。

任何有助於實現這一目標的幫助將不勝感激:)非常感謝!

您的第二列包含一個元組列表,這些元組又包含要檢查的字符串。 下面幾行代碼應該做到這一點:

df['count'] = df.apply(lambda row: sum(1 for x in row['top predicted'] if row['Category'] in x[0]), axis=1)

您應該使用apply()而不是按照您的建議遍歷行。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM