繁体   English   中英

从日期列中提取年份和月份作为 Pyspark 中的字符串

[英]Extract year and month as string in Pyspark from date column

使用 Pandas,我只需使用即可提取年份和月份; tb['yearmon'] = tb['date'].apply(lambda x: x.strftime('%Y%m'))

我怎样才能在 Pyspark 中做到这一点?

这应该可以正常工作。 基本上使用 pyspark 中内置的 sql 函数来提取年份和月份并将它们与“-”连接起来

from pyspark.sql.functions import year, month, concat_ws
df = spark.createDataFrame([('2015-04-08',)], ['date'])
df.select(concat_ws("-", year('date').alias('year'), month("date").alias("month")).alias("yearmon")).collect()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM