繁体   English   中英

如何将字符串列转换为日期列 PySpark DataFrame

[英]How to Convert string column to Date column in PySpark DataFrame

我有一个如下所示的字符串列 (DOB):

出生日期
1973-6-28
1978-5-02

我想将其转换为Date类型。 我尝试了以下但它在 output 中显示null值。我尝试了 stackoverflow 的其他答案但无济于事。

df.withColumn('DOB', to_date('DOB', 'yyyy-MMM-dd'))

你能测试下面的代码并验证它是否有效吗?

参考: https://spark.apache.org/docs/latest/sql-ref-datetime-pattern.html

cat <<EOF >test.csv     
DOB
1973-Jun-28
1978-May-02
EOF

pyspark

from pyspark.sql.functions import to_date
df = spark.read.csv('test.csv',header=True)    
df.withColumn('DOB', to_date('DOB', 'yyyy-MMM-dd')).show()

+----------+
|       DOB|
+----------+
|1973-06-28|
|1978-05-02|
+----------+

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM