簡體   English   中英

編碼“UTF8”的無效字節序列:從 S3 導入后處理時為 0x00

[英]invalid byte sequence for encoding "UTF8": 0x00 while postgress import from S3

我正在使用 aws_s3 擴展將數據從 S3 csv 文件導入到 Pstgress RDS,它在導入之間給出了一個錯誤

命令

psql=> SELECT aws_s3.table_import_from_s3( 't1',

'(格式 csv)', :'s3_uri' );

錯誤

錯誤:編碼“UTF8”的無效字節序列:0x00 上下文:COPY t1,第 7324484 行

我試圖將列類型更改為文本但不起作用

如果您的輸入數據中確實有 ASCII 0x00,您需要在 COPY 命令中將其指定為 NULL 字符和 NULL AS '\000'。

請參閱 - https://docs.aws.amazon.com/redshift/latest/dg/copy-parameters-data-conversion.html

我的數據包含無效值,需要清理

當我嘗試從 Redshift 導出數據並將其導入 S3 時,我發現 redshift 有一些支持來清理此類數據

這是解決方案的鏈接https://aws.amazon.com/premiumsupport/knowledge-center/remove-invalid-characters-redshift-data/

謝謝

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM