[英]Filter Pyspark Dataframe column based on whether it contains or does not contain substring
[英]Pyspark filter dataframe if column does not contain string
我希望以前沒有問過,至少我找不到。 我正在嘗試排除鍵列不包含“sd”值的行。 以下是它包含時的工作示例。
values = [("sd123","2"),("kd123","1")]
columns = ['Key', 'V1']
df2 = spark.createDataFrame(values, columns)
df2.where(F.col('Key').contains('sd')).show()
怎么做相反?
使用~
按位 NOT:
df2.where(~F.col('Key').contains('sd')).show()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.