繁体 English 中英

为 Scala 数据框中的每一行添加唯一 ID 以进行多次插入

[英]Adding unique ID for each row in scala dataframe for multiple insertions

原文 2020-08-24 08:10:35 7 1 sql/ scala/ apache-spark/ apache-spark-sql

我正在尝试为我的 scala 数据框中的每一行设置唯一 ID，因此我可以将数据框从 databricks notebook 插入到 SQL DB 中。

val df2 = df1.withColumn("unique_ID",monotonicallyIncreasingId)

这适用于第一次摄取到 SQL DB 中。 但是当我尝试摄取新数据时，出现重复键错误“重复键值是..XXXX”

如何克服为每个 SQL 摄取生成唯一键？ 谢谢。

1 个解决方案

而不是自己手动添加标识符（我认为这是失败的，因为monotonicallyIncreasingId总是从 0 开始，即使它已经存储在您尝试保存到的数据库中），您可以向模式添加一个自动增加的标识符列您正在保存的数据库。 每个 RDBMS 都有自己的方法来允许您执行此操作，此页面显示了如何在选择的 SQL 数据库实现上执行此操作。 例如，在 MySQL 中，您可以将AUTO_INCREMENT限定符添加到列中：

CREATE TABLE Persons (
    Personid int NOT NULL AUTO_INCREMENT,
    LastName varchar(255) NOT NULL,
    FirstName varchar(255),
    Age int,
    PRIMARY KEY (Personid)
);

保存数据框时，您不需要指定自动增加的标识符（即在上面的示例中，您的数据框应该只包含LastName 、 FirstName和 `Age~

如何为具有多次插入的每个事务获取唯一的ID

[英]How do I get an unique ID per transaction which has multiple insertions

在 SQL Server 的视图中将每个唯一 ID 的多行合并为一个具有多个索引列名称的单行

[英]Combining multiple rows for each unique ID as a single row with multiple indexed column names in a view in SQL Server

为表中的每个唯一值添加随机 ID

[英]Adding Random Id for each unique value in table

为每一行添加一个具有唯一值的列ID

[英]Add a column ID with a unique value for each row

如何 select 为每个唯一 ID 单独一行

[英]How to select a single row for each unique ID

SQL：获取每个唯一ID的最后一行

[英]SQL: Get last row for each unique id

如何在每个SQLite行中插入唯一的ID？

[英]How to insert a unique ID into each SQLite row?

向现有表添加其他唯一行ID

[英]Adding additional unique Row ID to existing table

每个唯一的客户ID /会员ID一行

[英]one row for each unique customer ID/affiliate id

SQL获取每个唯一ID的第一行以及在第一个后的x时间内具有该ID的每一行

[英]SQL Get first row of each unique ID AND each row with that ID within x time after the first

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何为具有多次插入的每个事务获取唯一的ID 在 SQL Server 的视图中将每个唯一 ID 的多行合并为一个具有多个索引列名称的单行为表中的每个唯一值添加随机 ID 为每一行添加一个具有唯一值的列ID 如何 select 为每个唯一 ID 单独一行 SQL：获取每个唯一ID的最后一行如何在每个SQLite行中插入唯一的ID？向现有表添加其他唯一行ID 每个唯一的客户ID /会员ID一行 SQL获取每个唯一ID的第一行以及在第一个后的x时间内具有该ID的每一行

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM