簡體   English   中英

如何清除奇怪字符(例如SUB)中的csv文件?

[英]How to clean a csv file from weird characters (e.g. SUB)?

我正在使用jdbc將csv文件上傳到teradata。 一切都很好,直到最近我遇到了一個csv文件,其中包含一些奇怪的字符,並且我的代碼無法上傳。

我在記事本++中打開了csv文件,它看起來像是SUB 當我在Excel中打開它時,它看起來像這樣->->

當我手動刪除這些字符時,一切恢復正常。 我很好奇,有什么辦法可以使用java清理csv文件來刪除所有無效字符嗎?

你可以試試:

myString.replaceAll("\\p{C}", "?");

如果要刪除它:

myString.replaceAll("\\p{C}", "");

更多信息: 如何替換Java中不可打印的Unicode字符?

SUB字符是ASCII 26(=十六進制0x1A)。 當DEC-10統治地球時,這被稱為Ctrl-Z。 它用於指示文件的結尾。

如果確實在文件末尾,並且您使用Java InputStream讀取了它(請查看將InputStream轉換/轉換為String ),則它將離開該終端Ctrl-Z。

將SUB包含在CSV數據中是​​非常不尋常的(也是一個問題),除非它代表二進制對象。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM