簡體   English   中英

如何使用 Azure Cosmos DB Spark 僅將不存在的記錄寫入 Cosmos DB?

[英]How to write only non existing records to Cosmos DB from using Azure Cosmos DB Spark?

我正在使用 Databricks,它使用 Spark 連接器將 CSV 文件中的數據寫入 Cosmos DB。 現在我的 Cosmos DB 已經包含很少的記錄,所以當我運行 Databricks Notebooks 時,它應該只寫入 DB 中不存在的記錄。 我嘗試使用 SaveMode.Ignore 但沒有幫助。

df.write.mode(SaveMode.Ignore).cosmosDB(writeConfig)

現在理想情況下, SaveMode.Ignore 應該跳過現有記錄並寫入數據庫中不存在但沒有發生的唯一記錄。

如果有人對如何實現這一目標提出建議,那將是一個很大的幫助。

謝謝。

使用 CSV 文件中的一些唯一字段創建具有唯一鍵的容器。 之后,您無法將重復的唯一鍵值添加到 Cosmos DB。

更多信息: https://docs.microsoft.com/en-us/azure/cosmos-db/unique-keys

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM