Windows Perl->移植后Unix無法正常工作，可能是編碼問題

Question

我有一個在Windows上編寫的Perl程序。 它開始於：

$unused_header = <STDIN>;
my @header_fields = split('\|\^\|', $unused_header, -1);

哪個應拆分包含非常大文件的輸入：

The|^|Quick|^|Brown|^|Fox|!|

進入：

{The, Quick, Brown, Fox|!|}

注意：這條線僅執行headre，還有另一條行重復數據行。

它在Windows上效果很好，但在Linux上卻失敗了。 但是，如果我在Perl中定義了一個具有相同內容的字符串，然后在該字符串上運行split，則可以正常工作。

我認為這是UTF-16編碼處理問題，但我不確定如何處理。 有誰知道我如何獲得perl來了解將UTF-16傳送到STDIN中的方法？

我發現： http : //www.haboogo.com/zh-cn/matching_patterns/2009/01/utf-16-processing-issue-in-perl.html，但是我不確定該如何處理。

Answer 1

如果STDIN為UTF-16，請使用以下之一

binmode(STDIN, ':encoding(UTF-16le)');   # Byte order used by Windows.
binmode(STDIN, ':encoding(UTF-16be)');   # The other byte order.
binmode(STDIN, ':encoding(UTF-16)');     # Use BOM to determine byte order.

Answer 2

湯姆就perl和unicode寫了一個冗長的答案。 它包含一些bolierplate代碼以正確並完全支持UTF-8，但是您可以根據需要替換為UTF-16。

Answer 3

我懷疑這是UTF-xx編碼問題，因為Windows Perl和Unix Perl都不會嘗試使用這些編碼讀取數據，除非您告知。

如果Unix腳本正在讀取與Windows腳本完全相同的文件，但是行為有所不同，則可能是行尾問題。 大多數Unix-y系統上的dos2unix命令可以更改文件的行尾，或者您可以在Perl腳本中自己剝離行尾。

$unused_header = <STDIN>;
$unused_header =~ s/\r?\n$//;   # chop \r\n (Windows) or \n (Unix)

Windows Perl->移植后Unix無法正常工作，可能是編碼問題

問題描述

3 個解決方案

解決方案1
5 已采納 2012-09-24 22:40:26

解決方案2
3 2012-09-24 22:47:37

解決方案3
0 2012-09-24 23:05:48

Windows Perl-&gt;移植后Unix無法正常工作，可能是編碼問題

問題描述

3 個解決方案

解決方案1 5 已采納 2012-09-24 22:40:26

解決方案2 3 2012-09-24 22:47:37

解決方案3 0 2012-09-24 23:05:48

Windows Perl->移植后Unix無法正常工作，可能是編碼問題

解決方案1
5 已采納 2012-09-24 22:40:26

解決方案2
3 2012-09-24 22:47:37

解決方案3
0 2012-09-24 23:05:48