[英]How complex can an enum get before reading lines of data from a file is better (e.g. .csv)?
[英]How to clean a csv file from weird characters (e.g. SUB)?
我正在使用jdbc
將csv文件上傳到teradata。 一切都很好,直到最近我遇到了一個csv
文件,其中包含一些奇怪的字符,並且我的代碼無法上傳。
我在記事本++中打開了csv
文件,它看起來像是SUB
。 當我在Excel中打開它時,它看起來像這樣->->
當我手動刪除這些字符時,一切恢復正常。 我很好奇,有什么辦法可以使用java
清理csv
文件來刪除所有無效字符嗎?
你可以試試:
myString.replaceAll("\\p{C}", "?");
如果要刪除它:
myString.replaceAll("\\p{C}", "");
更多信息: 如何替換Java中不可打印的Unicode字符?
SUB字符是ASCII 26(=十六進制0x1A)。 當DEC-10統治地球時,這被稱為Ctrl-Z。 它用於指示文件的結尾。
如果確實在文件末尾,並且您使用Java InputStream讀取了它(請查看將InputStream轉換/轉換為String ),則它將離開該終端Ctrl-Z。
將SUB包含在CSV數據中是非常不尋常的(也是一個問題),除非它代表二進制對象。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.