Perl 用 UTF-8 BOM 格式讀取.DAT 文件並用 UTF-8 格式寫入不帶 BOM

Question

我有一個帶有 CR LF 和 UTF-8 格式的帶有 BOM 的.DAT 文件，我正在嘗試使用 Z0114AD06D728F1834E36FE1A39574EF4 將其轉換為沒有 BOM 的 CR LF UTF-8 格式我目前正在使用以下代碼來執行此操作，盡管 output 文件是在沒有 BOM 的情況下生成的，但 header 不包含在數據的 Z65E8800B5C6800AAD896F888B2A6AFC 文件中。 我的要求是獲得 UTF-8 格式的最終 output 文件，沒有 BOM 和 header 包含在 Z65E8800B8CDB2006 的數據中。

use open qw( :encoding(UTF-8) :std ); # Make UTF-8 default encoding

sub encodeWithoutBOM
{
    my $src = $_[1];
    my $des = $_[2];
    my @array;
    open(SRC,'<',$src) or die $!;
    # open destination file for writing
    open(DES,'>',$des) or die $!;
    print("copying content from $src to $des\n");
    while(<SRC>){
         @array = <SRC>;    
    }
    foreach (@array){
    print DES;
    }
    close(SRC);
    close(DES); 
}

Answer 1

use open ':std', ':encoding(UTF-8)';

while (<>) {
   s/^\N{BOM}// if $. == 1;
   print;
}

Answer 2

另一種選擇是使用 CPAN 中的File::BOM ，它可以讓您透明地處理字節順序標記：

#!/usr/bin/env perl
use warnings;
use strict;
use autodie;
use feature qw/say/;
use File::BOM qw/open_bom/;

sub encode_without_bom {
    my ($src, $dst) = @_;

    open_bom(my $infile, $src, ":encoding(UTF-8)");
    open my $outfile, ">:utf8", $dst;
    say "Copying from $src to $dst";
    while (<$infile>) {
        print $outfile $_;
    }
}

encode_without_bom "input.txt", "output.txt";

Perl 用 UTF-8 BOM 格式讀取.DAT 文件並用 UTF-8 格式寫入不帶 BOM

問題描述

2 個解決方案

解決方案1
2 已采納 2020-08-08 22:16:09

解決方案2
2 2020-08-09 00:38:06

Perl 用 UTF-8 BOM 格式讀取.DAT 文件並用 UTF-8 格式寫入不帶 BOM

問題描述

2 個解決方案

解決方案1 2 已采納 2020-08-08 22:16:09

解決方案2 2 2020-08-09 00:38:06

解決方案1
2 已采納 2020-08-08 22:16:09

解決方案2
2 2020-08-09 00:38:06