簡體 English 中英

Spark中的鍵值對順序

[英]Key-value pair order in Spark

原文 2015-05-26 15:28:29 9 2 scala/ apache-spark

當應用諸如reduceByKey的功能時，除了元組的第一個元素reduceByKey ，是否有任何其他方法可以指定鍵？

我當前的解決方案包括使用map函數以正確的順序重新排列元組，因為我假設此附加操作是以計算為代價的，對嗎？

2 個解決方案

要使用reduceByKey ，您需要一個鍵值RDD[K,V] ，其中K是將要使用的鍵。 如果您具有RDD[V] ，則需要首先執行map以指定密鑰。

myRdd.map(x => (x, 1))

如果您已經擁有RDD[K,V] ，而密鑰不是您想要的...您需要另一個map 。 沒有其他方法可以解決此問題。 例如，如果要在鍵和值之間切換，可以執行以下操作：

myPairRdd.map(_.swap)

您可以覆蓋compare函數並調用sortByKey ：

implicit val sortFunction = new Ordering[String] {
  override def compare(a: String, b: String) = // compare function
}

val rddSet: RDD[(String, String)] = sc.parallelize(dataSet)

rddSet.sortByKey()

Spark-兩個鍵值對RDD的總和

[英]Spark - Sum values of two key-value pair RDDs

Spark-減少Scala中的鍵/值對列表

[英]Spark - Reduce List of key-value pair in Scala

具有復合值的RDD鍵值對

[英]RDD Key-Value pair with composite value

如何使用Spark Scala解析具有鍵值對的XML節點

[英]How to parse an XML node having key-value pair using spark scala

按火花對RDD中的值排序

[英]Order by value in spark pair RDD

Spark鍵/值對問題

[英]Spark key/value pair issue

反轉Spark中Pair的鍵和值

[英]Reverse the Key and value of a Pair in Spark

在Spark中將Dataframe轉換為Map（鍵值）

[英]Convert Dataframe to a Map(Key-Value) in Spark

Spark Scala中的字符串到鍵值轉換

[英]string to key-value conversion in spark scala

使用現有鍵將鍵值對添加到HashMap（Scala）

[英]Add key-value pair to a HashMap with an existing key (Scala)

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Spark-兩個鍵值對RDD的總和 Spark-減少Scala中的鍵/值對列表具有復合值的RDD鍵值對如何使用Spark Scala解析具有鍵值對的XML節點按火花對RDD中的值排序 Spark鍵/值對問題反轉Spark中Pair的鍵和值在Spark中將Dataframe轉換為Map（鍵值） Spark Scala中的字符串到鍵值轉換使用現有鍵將鍵值對添加到HashMap（Scala）

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM