[英]How can I split a pandas column containing a json into new columns in a given dataframe?
[英]How can I convert a spark dataframe column, containing serialized json, into a dataframe itself?
原因我覺得這不是這個問題的重復:
exprs
語句中)出現 - 再次 - 作者希望事先了解模式,而不是推斷模式。 要求:
事前,我不知道json架構是什么,因此需要推斷它。 spark.read.json似乎是推斷模式的最佳案例,但我遇到的所有示例都是從文件加載json。 在我的用例中,json包含在數據幀的一列中。
我對源文件類型不可知(在這種情況下,使用parquet和csv進行測試)。 但是,源數據幀架構是並且結構良好。 對於我的用例,json包含在源數據框中名為“fields”的列中。
結果數據框應鏈接到源數據幀中的主鍵(我的示例為“id”)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.