cost 200 ms
為什么SQL Server使用函數將0值而不是正確值插入表中

[英]Why is SQL server inserting 0 values into my table instead of the correct values using function

希望有人可以幫助我解決這個問題,因為我完全不知道為什么會這樣。 我目前正在對英超聯賽比賽結果進行一些分析,作為此分析的一部分,我創建了一個多語句表UDF。 此函數接受HomeTeam,AwayTeam和MatchDate參數,然后對在指定的比賽日之前在主隊和客隊之間歷史上贏,輸或輸的 ...

Spark SQL 嵌套 withColumn

[英]Spark SQL nested withColumn

我有一個 DataFrame,它有多個列,其中一些是結構。 像這樣的東西 我想在列baz上應用UserDefinedFunction以用baz的函數替換baz ,但我不知道如何做到這一點。 這是所需輸出的示例(注意baz現在是int ) 看起來DataFrame.withColumn僅適用於 ...

如何從Scala方法創建UDF(計算md5)?

[英]How to create UDF from Scala methods (to compute md5)?

我想從兩個已經工作的函數構建一個UDF。 我正在嘗試將md5哈希計算為現有Spark Dataframe的新列。 結構 (到目前為止我有什么) 不幸的是,我不知道如何將該函數作為UDF實現。 ...

使用不可序列化的對象創建SparkSQL UDF

[英]Create SparkSQL UDF with non serializable objects

我正在嘗試編寫要在sqlContext中的Hive表上使用的UDF。 是否可以以任何方式包含來自其他無法序列化的庫的對象? 這是一個無效的最小示例: 我在Spark Shell中將函數注冊為udf函數 如果我嘗試在“測試”表上運行它 我得到錯誤 有沒有解決方法 ...

當用戶輸入的參數超出預期時,是否強制VBA中的UDF顯示MsgBox?

[英]Force UDF in VBA to display a MsgBox when the user enters more than expected arguments?

當用戶為COUNTBLANK函數輸入太多參數時,該函數顯示此錯誤消息,並返回到編輯模式: 您為此函數輸入了太多參數。 如何使任何UDF那樣工作? 例如: 默認情況下,此UDF返回#VALUE! 用戶輸入多個參數時發生錯誤。 如何使其像COUNTBLANK函 ...

分區上的Spark Scala DataFrame功能

[英]spark scala dataframe function over partition

我有200萬行,每千個小組看起來像這樣 我想為每個組運行相同的函數(例如X在[X, Z, Q, W]上的linear regression )。 我本可以做Window.partition等,但是我有自己的功能。 目前,我執行以下操作: 想知道是否有更好的方法? ...

結合兩個Spark UDF問題

[英]Combine two spark udf issue

我在Scala中使用Spark 1.6; 我必須計算持續時間,即結束時間和開始時間之間的差。 我已經試過了: 我想添加另一個條件:當結束時間和開始時間相等時,持續時間應設置為1而不是0。如何實現? ...

Excel2011:Vlookup和合並

[英]Excel2011: Vlookup and Combine

我在合並多個功能以在70000+行的excel文件中執行所需操作時遇到了一些困難。 任何提示,指示或建議,我們將不勝感激。 我有2列(價值約70000行)。 在第1列中,我有客戶的帳號(重復),在第2列中,我旁邊有要提取的數據。 我還有第三列(第3列),它是帳號的列表,但已刪除了重復 ...

字符串置換Spark UDF

[英]String permutation spark udf

我正在使用scala轉換一個Pig腳本來激發1.6,我有一個包含字符串的數據框,並且我想按特定順序交換字符。 例如: 我想按此順序進行轉換[3,1,5,7,6,(8-16),4,2] 這是我的帶有Java的豬UDF,它正在工作: 我如何使用Scala將其更改為Spar ...

如何:在沒有地圖的情況下編寫Aerospike udf過濾器或在地圖中返回完整記錄

[英]How to: write aerospike udf filter without map OR return full record in map

我在Aerospike中有帶有過濾器和地圖的udf流。 如果我按照我看到的所有示例進行地圖繪制,則可以從記錄中選擇字段,並返回包含已過濾和選定字段的新地圖。 但是,我不想這樣做。 我想獲取具有任何列/箱的任何流,應用過濾器並返回完整記錄。 一種方法可能是使用類似stream的東西:f ...

如何在scala的蜂巢udf中返回null?

[英]How to return null in hive udf in scala?

我正在Scala的Hive UDF中工作 我嘗試了null.asInstanceOf[Double]但這將輸出設置為0。我需要在蜂巢中使用NULL輸出。 謝謝。 ...

2017-06-17 06:20:32   1   176    scala / hive / udf  
如何使用Java調用Groovy或Scala UDF更新Oracle?

[英]How to call Groovy or Scala UDF to update Oracle, using Java?

我有到Oracle DB的JDBC連接。 我也有一些用Groovy或Scala編寫的函數f(x)。 例如,f(x)僅返回2x。 現在我的問題是:我應該如何在Java代碼中調用f(x),以將f(x)應用於列中的所有值,並在上述示例中將該列更新為2x? ...

Scala Spark中的udf運行時錯誤

[英]Runtime error with udf in Scala Spark

我正在嘗試在DataFrame中創建一個新列。 此新列將包含從長時間戳創建的格式化數據字符串(以毫秒為單位)。 我一直收到這個錯誤: 它出現在這段代碼中: 我在build.sbt中使用以下依賴項: 我願意采取其他方式做到這一點,這可能更容易(或者至少是工作)。 ...

從確定性SUDF中選擇多個參數的性能

[英]Performance for selecting multiple out-params from deterministic SUDF

我將測試返回多個值的SUDF的確定性標志( 對此問題進行跟蹤)。 DETERMINISTIC標志應將相同輸入的結果緩存,以提高性能。 但是,我不知道如何對多個返回值執行此操作。 我的SUDF如下所示: 現在,當我執行以下選擇語句時: 我得到了相應的服務器處理時間: ...

pyspark 中列名的字符串操作

[英]string manipulation for column names in pyspark

這篇文章很好地概述了如何更改列名。 如何在pyspark中更改數據框列名? 盡管如此,我需要更多/稍微調整一些我無法做到的事情。 任何人都可以幫助刪除所有列名中的空格嗎? 它需要例如連接命令和系統方法減少了處理 30 列的工作量。 我認為正則表達式和 UDF 的組合效果最好。 示例:root ...

從UDF或過程中選擇多個參數

[英]Selecting multiple parameters from UDF or procedure

我正在嘗試計算多個值並在select子句中獲取它們。 它是通過UDF計算還是通過過程計算對我來說都無關緊要,但我無法弄清楚如何以任何一種方式進行計算。 我想這樣使用它: 然后,該表應返回具有ID, Bitset1, Bitset2 。 如果可能的話,它應該表現得盡可能好。 我 ...

識別當前表並記錄Firebird UDF中的值

[英]Identifying the current table and record values in a Firebird UDF

我正在研究如何使用觸發器創建UDF來復制Firebird表的完整記錄。 我想創建一些關於某些表的修訂/歷史記錄,使用UDF將數據復制到mongodb數據庫以連接到mongodb並在那里插入記錄。 我的問題是:是否可以創建一個UDF,當我調用它時,它會識別當前的表和行以自動獲取列值而不 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM