簡體   English   中英

使用PHP從txt文件讀取捷克字符

[英]Reading czech characters from a txt file using PHP

我從txt文件讀取捷克字符時遇到問題。

我想逐行閱讀包含類別的.txt文件。 使用通用語言,我沒有問題。 我可以逐行閱讀txt文件,然后將所需的類別復制到數組中。

但是,一旦我想閱讀一個包含捷克語類別的txt文件,就會在處理代碼輸出時遇到問題。 即使文本文件正確顯示了這些字符,捷克語特定的字符也會變得亂七八糟。

例如:根據讀取文件的方式,字母ě,č,ů或ř全部輸出為正方形或st \\ u001b或其他顏色。

最初,我使用fgets函數從文本文件中讀取一行。

但是由於這不能返回正確的字符,因此我開始添加utf8_encode進行測試,但是盡管更改了某些字符,但仍然無法恢復所有字符。

然后,我開始嘗試將mb_detect_encoding與mb_convert_encoding結合使用,然后在某處讀取fgets有時可能返回錯誤字符的地方,因此我開始使用file_get_contents進行測試。 這也沒有解決問題。

我認為主要問題在於讀取txt文件的方式,因為fgets和file_get_contents函數的輸出從一開始就是亂碼。

誰能告訴我如何正確讀取帶有捷克字符的文本文件?

提前致謝。

好吧,我自己找到了解決方案。 只是出於其他人遇到此問題的情況,txt文件的編碼錯誤。 該文件使用“ UCS-2 Little Endian”編碼。 在Notepad ++中加載文件后,我可以將其編碼為UTF-8格式,從而解決了該問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM