標簽[udf] - 堆棧內存溢出

[英]Why is SQL server inserting 0 values into my table instead of the correct values using function

希望有人可以幫助我解決這個問題，因為我完全不知道為什么會這樣。我目前正在對英超聯賽比賽結果進行一些分析，作為此分析的一部分，我創建了一個多語句表UDF。此函數接受HomeTeam，AwayTeam和MatchDate參數，然后對在指定的比賽日之前在主隊和客隊之間歷史上贏，輸或輸的 ...

Spark SQL 嵌套 withColumn

[英]Spark SQL nested withColumn

我有一個 DataFrame，它有多個列，其中一些是結構。像這樣的東西我想在列baz上應用UserDefinedFunction以用baz的函數替換baz ，但我不知道如何做到這一點。這是所需輸出的示例（注意baz現在是int ）看起來DataFrame.withColumn僅適用於 ...

如何從Scala方法創建UDF（計算md5）？

[英]How to create UDF from Scala methods (to compute md5)?

我想從兩個已經工作的函數構建一個UDF。我正在嘗試將md5哈希計算為現有Spark Dataframe的新列。結構（到目前為止我有什么）不幸的是，我不知道如何將該函數作為UDF實現。 ...

使用不可序列化的對象創建SparkSQL UDF

[英]Create SparkSQL UDF with non serializable objects

我正在嘗試編寫要在sqlContext中的Hive表上使用的UDF。是否可以以任何方式包含來自其他無法序列化的庫的對象？這是一個無效的最小示例：我在Spark Shell中將函數注冊為udf函數如果我嘗試在“測試”表上運行它我得到錯誤有沒有解決方法 ...

當用戶輸入的參數超出預期時，是否強制VBA中的UDF顯示MsgBox？

[英]Force UDF in VBA to display a MsgBox when the user enters more than expected arguments?

當用戶為COUNTBLANK函數輸入太多參數時，該函數顯示此錯誤消息，並返回到編輯模式：您為此函數輸入了太多參數。如何使任何UDF那樣工作？例如：默認情況下，此UDF返回#VALUE! 用戶輸入多個參數時發生錯誤。如何使其像COUNTBLANK函 ...

分區上的Spark Scala DataFrame功能

[英]spark scala dataframe function over partition

我有200萬行，每千個小組看起來像這樣我想為每個組運行相同的函數（例如X在[X, Z, Q, W]上的linear regression ）。我本可以做Window.partition等，但是我有自己的功能。目前，我執行以下操作：想知道是否有更好的方法？ ...

結合兩個Spark UDF問題

[英]Combine two spark udf issue

我在Scala中使用Spark 1.6; 我必須計算持續時間，即結束時間和開始時間之間的差。我已經試過了：我想添加另一個條件：當結束時間和開始時間相等時，持續時間應設置為1而不是0。如何實現？ ...

Excel2011：Vlookup和合並

[英]Excel2011: Vlookup and Combine

我在合並多個功能以在70000+行的excel文件中執行所需操作時遇到了一些困難。任何提示，指示或建議，我們將不勝感激。我有2列（價值約70000行）。在第1列中，我有客戶的帳號（重復），在第2列中，我旁邊有要提取的數據。我還有第三列（第3列），它是帳號的列表，但已刪除了重復 ...

字符串置換Spark UDF

[英]String permutation spark udf

我正在使用scala轉換一個Pig腳本來激發1.6，我有一個包含字符串的數據框，並且我想按特定順序交換字符。例如：我想按此順序進行轉換[3,1,5,7,6，（8-16），4,2] 這是我的帶有Java的豬UDF，它正在工作：我如何使用Scala將其更改為Spar ...

使用 Java 方法的 UDF 在 spark 上中斷

[英]UDF using Java methods breaks on spark

我已經在 databricks 環境中完成了這段代碼，但是當我在本地環境中嘗試它時，它會中斷...... 錯誤：版本是 Spark 2.1 ...

在BigQuery的查詢中使用UDF作為列

[英]Using UDF as a column in a query in BigQuery

我已經在BigQuery中創建了一個UDF，並設法像文檔（ https://cloud.google.com/bigquery/user-defined-functions#creating-the-query ）中的示例一樣運行它，其中UDF用於FROM子句。但是，我需要在select ...

如何：在沒有地圖的情況下編寫Aerospike udf過濾器或在地圖中返回完整記錄

[英]How to: write aerospike udf filter without map OR return full record in map

我在Aerospike中有帶有過濾器和地圖的udf流。如果我按照我看到的所有示例進行地圖繪制，則可以從記錄中選擇字段，並返回包含已過濾和選定字段的新地圖。但是，我不想這樣做。我想獲取具有任何列/箱的任何流，應用過濾器並返回完整記錄。一種方法可能是使用類似stream的東西：f ...

如何在scala的蜂巢udf中返回null？

[英]How to return null in hive udf in scala?

我正在Scala的Hive UDF中工作我嘗試了null.asInstanceOf[Double]但這將輸出設置為0。我需要在蜂巢中使用NULL輸出。謝謝。 ...

如何使用Java調用Groovy或Scala UDF更新Oracle？

[英]How to call Groovy or Scala UDF to update Oracle, using Java?

我有到Oracle DB的JDBC連接。我也有一些用Groovy或Scala編寫的函數f（x）。例如，f（x）僅返回2x。現在我的問題是：我應該如何在Java代碼中調用f（x），以將f（x）應用於列中的所有值，並在上述示例中將該列更新為2x？ ...

Scala Spark中的udf運行時錯誤

[英]Runtime error with udf in Scala Spark

我正在嘗試在DataFrame中創建一個新列。此新列將包含從長時間戳創建的格式化數據字符串（以毫秒為單位）。我一直收到這個錯誤：它出現在這段代碼中：我在build.sbt中使用以下依賴項：我願意采取其他方式做到這一點，這可能更容易（或者至少是工作）。 ...

從確定性SUDF中選擇多個參數的性能

[英]Performance for selecting multiple out-params from deterministic SUDF

我將測試返回多個值的SUDF的確定性標志（對此問題進行跟蹤）。 DETERMINISTIC標志應將相同輸入的結果緩存，以提高性能。但是，我不知道如何對多個返回值執行此操作。我的SUDF如下所示：現在，當我執行以下選擇語句時：我得到了相應的服務器處理時間： ...

pyspark 中列名的字符串操作

[英]string manipulation for column names in pyspark

這篇文章很好地概述了如何更改列名。如何在pyspark中更改數據框列名？盡管如此，我需要更多/稍微調整一些我無法做到的事情。任何人都可以幫助刪除所有列名中的空格嗎？它需要例如連接命令和系統方法減少了處理 30 列的工作量。我認為正則表達式和 UDF 的組合效果最好。示例：root ...

從UDF或過程中選擇多個參數

[英]Selecting multiple parameters from UDF or procedure

我正在嘗試計算多個值並在select子句中獲取它們。它是通過UDF計算還是通過過程計算對我來說都無關緊要，但我無法弄清楚如何以任何一種方式進行計算。我想這樣使用它：然后，該表應返回具有ID, Bitset1, Bitset2 。如果可能的話，它應該表現得盡可能好。我 ...

在Spark Scala UDF中定義返回值

[英]Define return value in Spark Scala UDF

想象一下以下代碼：如何定義myUdf的返回類型，以便查看代碼的人會立即知道它返回Double？ ...

識別當前表並記錄Firebird UDF中的值

[英]Identifying the current table and record values in a Firebird UDF

我正在研究如何使用觸發器創建UDF來復制Firebird表的完整記錄。我想創建一些關於某些表的修訂/歷史記錄，使用UDF將數據復制到mongodb數據庫以連接到mongodb並在那里插入記錄。我的問題是：是否可以創建一個UDF，當我調用它時，它會識別當前的表和行以自動獲取列值而不 ...