簡體   English   中英

Pandas:根據某些Column的字符串值將Dataframe拆分為單獨的Dataframe

[英]Pandas: Split a Dataframe into separate Dataframes based on certain Column's string values

沒有找到任何我可以應用於我的問題的答案,所以在這里:

我有一個初始的圖像數據框,我想根據該圖像的描述將其分成兩部分,這是“描述”列中的一個字符串。

我的問題是並非所有描述都是同等的。 這是我的意思的一個例子:

在此輸入圖像描述

有些圖像是加速的,有些則不是。 這是我想用來分割數據集的標准。

然而,即使加速和非加速圖像描述也各不相同。

我的策略是將其中包含“ACC”的每個字符串重命名為“ACCELERATED IMAGE”,這將覆蓋所有加速圖像。

然后我可以這樣做:

df_Accl = df[df.Description == "ACCELERATED IMAGE"]
df_NonAccl = df[df.Description != "ACCELERATED IMAGE"]

我怎樣才能做到這一點? 這只是我想出的一個策略,如果有任何其他更有效的方式可以隨意說出來。

你可以使用str.contains作為布爾掩碼 - 然后通過boolean indexing進行過濾。

對於反轉掩碼使用~ ,過濾行不包含ACC

mask = df.Description.str.contains("ACC")
df_Accl = df[mask]
df_NonAccl = df[~mask]

您可以使用contains來查找包含子字符串ACC的行:

df['Description'].str.contains('ACC')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM