![](/img/trans.png)
[英]Error in submitting a pig job to Google Dataproc with properties file
我是 Dataproc 的新手,正在嘗試通過 gcloud 向 google dataproc 提交一份 Pig 作業 具有以下屬性文件 下面是上傳到 GCS 的 pig 腳本示例 低於錯誤 也嘗試了大多數使用控制台的方法,但沒有得到好的文檔。 查詢參數字段(指定要插入的參數名稱和值以代替查詢文件中 ...
[英]Error in submitting a pig job to Google Dataproc with properties file
我是 Dataproc 的新手,正在嘗試通過 gcloud 向 google dataproc 提交一份 Pig 作業 具有以下屬性文件 下面是上傳到 GCS 的 pig 腳本示例 低於錯誤 也嘗試了大多數使用控制台的方法,但沒有得到好的文檔。 查詢參數字段(指定要插入的參數名稱和值以代替查詢文件中 ...
[英]What is the best way to add BigDecimals in Hadoop?
我需要在 Hadoop 中添加 BigDecimals。我目前正在使用 Apache Pig BigDecimalWritable,但 Pig 似乎已經完全過時了。 這個版本已有 5 年歷史了!! ...
[英]Splitting string into a new line in apache-pig
我想將數據集中由反斜杠 (/) 連接的字符串拆分為新行。 示例數據集是: 我希望結果是: 我寫的代碼是: 但是我在終端中得到的結果是: ...
[英]Is there a pig / hadoop property that can be set for PIG_HEAPSIZE?
spark、hadoop、tez等都有可以手動配置的屬性列表。 例子: yarn.nodemanager.resource.memory-mb 或者 spark.executor.memory 或者 pig.exec.reducers.bytes.per.reducer, pig.exec.r ...
[英]ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2998: Unhandled internal error. org/python/google/common/collect/Lists
我剛剛開始使用 Pig,在運行我的第一個程序時遇到了很多問題。 任何幫助深表感謝。 我試過用這些解決: 錯誤 org.apache.pig.tools.grunt.Grunt - 錯誤 2998:未處理的內部錯誤。 org/apache/hadoop/hbase/filter/WritableB ...
[英]Merging multiple files in Pig
我有幾個文件(大約 10 個文件)我想在 Pig 中合並在一起: 我知道我可以通過以下方式將兩個數據集合並在一起: 有什么方法可以遍歷循環以將數據集從 Student01 合並到 Student10? ...
[英]Write a pig sequence of statements to calculate the number of ratings records and the average rating score by gender
這就是我到目前為止所做的。 我得到的錯誤: 輸入:無法從“hdfs://localhost:9000/mike/users.txt”讀取數據 無法從“hdfs://localhost:9000/mike/movies/data.txt”讀取數據 localhost:9000 告訴我這個:看起來您正在 ...
[英]PIG mapreduce output and HIVE
我有一個名為 test.txt 的文件,其記錄如下(忽略點): (制表符作為字段分隔符) 我的豬腳本(test.pig): 我運行腳本: pig -x mapreduce test.pig 輸出: 而且內容只有: Q1- 其他領域發生了什么? Q2-為什么制表符沒有被“, ...
[英]Sum of Salary in Apache Pig
為可用文件 emp1.csv 和 dept.csv 創建員工和部門表。 Colnames: Emp: Empno, name, sal, did, branch, dno Dept: deptno, name, loc 檢索要為在“芝加哥”工作的員工支付的總工資。 emp 的桌子 ...
[英]How to execute pig script and save the result in another file?
我有一個“solution.pig”文件,其中包含所有加載、連接和轉儲查詢。 我需要通過在 grunt> 中鍵入“solution.pig”來運行它們並將所有結果保存在其他文件中。 我怎樣才能做到這一點? ...
[英]Apache Pig : Counting frequencies of "character"
假設有一個名為 abalone_data 的文本文件,具有 3 個屬性:名稱、性別和長度 M 是男性,F 是女性,I 是嬰兒。 問題是如何統計每種性別的鮑魚數量。 所需的 output 應如下所示 我使用 LOAD 語法加載文件,然后使用 TOKENIZE 僅獲取性別。 但是我一直在數字符。 ...
[英]Error 1070 Pig Could not resolve PigSorage using imports:
我正在嘗試用 pig 讀取文件,但出現標題中指示的錯誤。 data = LOAD '/user/cloudera/pigexample/commands' 使用 PigSorage('\n') as (command:chararray); 轉儲數據; 該文件包含以下內容: 我不明白為什么我會收 ...
[英]Load Text Files and store it in Dataframe using Pyspark
我正在將 pig 腳本遷移到 pyspark,我是 Pyspark 的新手,所以我在數據加載時遇到了困難。 我的豬腳本看起來像: Bag1 = LOAD '/refined/em/em_results/202112/' 使用 PigStorage('\u1') AS (PAYER_SHORT: ...
[英]how to extract single element from a bag in pig?
我的 pig 語句生成以下 output: 但我想將 output 以上存儲在豬中,如下所示: 有沒有辦法從豬的袋子中提取第一個元素? ...
[英]Why am I not getting the NULL values when using FILTER to remove CSV Headers in PIG?
我在 .csv 文件中有以下數據: ...
[英]Convert chararray to float
我是豬編程的新手。 我有一個 txt 文件和逗號 (,) 作為分隔符。 在金額列中,即; amt_IN 和 amy_OUT 是 chararray 類型,數據分別為 $830.03 和 $1392.54。 我需要 INR 中的這兩列。 我首先從字符串中刪除 $ 符號,然后嘗試將其轉換為浮點數。 以 ...
[英]Pig Installation error: ERROR pig.Main: ERROR 2998: Unhandled internal error
錯誤 pig.Main:錯誤 2998:未處理的內部錯誤。 com.google.common.base.Preconditions.checkArgument(ZLjava/lang/String;Ljava/lang/Object;)V WARN pig.Main:沒有要寫入的日志文件。 ...
[英]Is it possible to use/query data using Pig/Tableau or some-other tool from HDFS which was inserted/loaded using a HIVE Managed table?
是否可以使用 Pig、Drill 或 Tableau 或 HDFS 中的其他工具使用或查詢數據,這些工具是使用 HIVE 托管表插入/加載的; 還是僅適用於使用 HIVE 外部表插入/加載的 HDFS 中的數據? 編輯 1:與托管 Hive 表關聯的數據是否鎖定到 Hive? ...
[英]HIVE/PIG JOIN Based on SUBSTRING match
我有一個要求,我需要加入一個包含人名的推文表,例如過濾包含任何人名的推文。 我有以下數據: Tweets 表: (7000 萬條記錄存儲為 HIVE 表) ID 鳴叫 1 歷史上最偉大的克里斯蒂亞諾·羅納爾多 2 布拉德皮特電影 3 沒有任何人名的隨機推文人名: (160 萬個名字存儲在 HD ...
[英]How to solve problem of DUMP not working in Apache Pig
(r1797386) 編譯於 2017 年 6 月 2 日,15:41:58 org.apache.hadoop.conf.Configuration.deprecation - 不推薦使用 mapred.job.tracker。 相反,使用 mapreduce.jobtracker.a ...