簡體   English   中英

從utf8格式的網站獲取內容

[英]get content from website with utf8 format

我想如何從utf8格式的網站獲取內容,

我寫了下面的代碼是

try {
        String webnames = "http://pathivu.com";

        URL url = new URL(webnames);

        URLConnection urlc = url.openConnection();

        //BufferedInputStream buffer = new BufferedInputStream(urlc.getInputStream());
        BufferedReader buffer = new BufferedReader(new InputStreamReader(urlc.getInputStream(), "UTF8"));

        StringBuilder builder = new StringBuilder();

        int byteRead;

        while ((byteRead = buffer.read()) != -1)
            builder.append((char) byteRead);

        buffer.close();

        String text=builder.toString();

        System.out.println(text);
    } 
catch (IOException e) 
{
    e.printStackTrace();

}

但我不能得到正確的格式......

謝謝並提前..

問題可能是您的控制台或System.out不是UTF-8。

  • 嘗試將其寫入文件
  • 通過System.setOut(..)設置控制台流

您可能必須使用-Dfile.encoding=utf-8OutputStreamWriter

你的代碼看起來還不錯..這里的問題是服務器中的數據不是UTF-8格式的..

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM