繁体   English   中英

在创建数据集时使用 @JsonProperty 重命名 spark 中的列

[英]Rename columns in spark using @JsonProperty while creating Datasets

有没有办法在创建数据集时使用 Jackson 注释重命名数据集中的列名?

我的编码器类如下:

import com.fasterxml.jackson.annotation.JsonProperty;
import lombok.*;
import scala.Serializable;
import javax.persistence.Table;

      @Builder 
      @Data 
      @AllArgsConstructor
      @EqualsAndHashCode 
      @Table(name = "sample_table")
      public class SampleRecord implements Serializable {
         @JsonProperty("sample_id")
         private Long sampleId;
         @JsonProperty("sample_name")
         private String name;
         @JsonProperty("sample_desc")
         private String description; 
      }

我的目标是根据@JsonProperty 重命名列,以便我可以重新使用相同的类和 json 功能。

请找到模块的相关版本: - Spark : 2.4.0 (with scala 2.11) - jackson-module-scala_2.11 : 2.9.6

如果您需要更多信息,请与我们联系。 帮助表示赞赏。


public class SampleRecord implements Serializable {
         private Long sampleId;

         private String name;

         private String description; 


@JsonProperty("sample_id")
public void setSampleId(Long sampleId) {
        this.sampleId = sampleId;
    }

@JsonProperty("sample_name")
public void setName(String name) {
        this.name = name;
    }


@JsonProperty("sample_desc")
public void setDescription(String description) {
        this.description = description;
    }
}

有趣的想法。 我会这样做:

  1. 在数据框中摄取您的数据。
  2. 编写一个使用数据框和类名的实用方法(这里是 SampleRecord)。
  3. 使用自省来读取注释(如果需要定义特定属性,您最终可以添加一些注释)。
  4. 使用数据框上的 withColumnRenamed() 重命名列。
  5. 返回修改后的数据帧。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM