簡體 English 中英

如何在 spark 數據幀中加載 avro 時合並模式？

[英]How to merge schema while loading avro in spark dataframe?

原文 2015-12-30 10:51:25 3 1 apache-spark/ pyspark/ avro

我正在嘗試使用https://github.com/databricks/spark-avro讀取 avro 文件，並且 avro 模式隨着時間的推移而演變。 我這樣閱讀，將 mergeSchema 選項設置為true ，希望它會合並架構本身，但它沒有用。

sqlContext.read.format("com.databricks.spark.avro").option("mergeSchema", "true").load('s3://xxxx/d=2015-10-27/h=*/')

解決方法是什么？

1 個解決方案

spark 中的 avro 文件未實現合並模式，並且沒有簡單的解決方法。 一種解決方案是將您的 avro 數據逐個文件（或逐個分區）作為單獨的數據集讀取，然后合並這些數據集。 但這可能非常慢。

Spark DataFrame：以Avro編寫時如何指定架構

[英]Spark DataFrame: How to specify schema when writing as Avro

從數據幀制作Avro模式-Spark-Scala

[英]make avro schema from a dataframe - spark - scala

使用模式將帶有Spark的AVRO消息轉換為DataFrame

[英]Use schema to convert AVRO messages with Spark to DataFrame

Spark - Avro 讀取架構但數據幀為空

[英]Spark - Avro Reads Schema but DataFrame Empty

當編碼時行模式未知時，如何將字符串與行合並以創建新的火花 dataframe？

[英]How do I merge string with a Row to create a new spark dataframe when Row schema is unknown while coding?

Spark：如何使用 Avro 模式創建數據集？

[英]Spark: How to use Avro schema to create a dataset?

如何在 spark 中將 Avro Schema 對象轉換為 StructType

[英]How to convert Avro Schema object into StructType in spark

用於激發 StructType 的 Avro Schema

[英]Avro Schema to spark StructType

如何使用架構將數據幀轉換為Avro？

[英]How to convert dataframe to avro using schema?

Spark的正確架構（將數據加載到Dataframe時）

[英]Proper Schema for Spark (when loading data into Dataframe)

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Spark DataFrame：以Avro編寫時如何指定架構從數據幀制作Avro模式-Spark-Scala 使用模式將帶有Spark的AVRO消息轉換為DataFrame Spark - Avro 讀取架構但數據幀為空當編碼時行模式未知時，如何將字符串與行合並以創建新的火花 dataframe？ Spark：如何使用 Avro 模式創建數據集？如何在 spark 中將 Avro Schema 對象轉換為 StructType 用於激發 StructType 的 Avro Schema 如何使用架構將數據幀轉換為Avro？ Spark的正確架構（將數據加載到Dataframe時）

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM