[英]Working with Spreadsheet::ParseExcel
我正在使用Excel工作表來獲取兩列並基於它們替換文件名。
這就是我獲取感興趣的兩列的值的方式。第14列可以是單個值,也可以是多個值,多個值之間用逗號分隔。
my @required = (2,14);
my @value;
my @files = grep{ -f && -T && -M > 0 } glob("$dir/*");
my @expected_file = grep{ /Parsed/ } @files;
print "@expected_file\n";
if(! $workbook) {
die $parser->error(),"\n";
}
for my $row (1 .. $row_max) {
@value = map{
my $cell = $worksheets[0]->get_cell($row,$_);
$cell ? $cell->value() : '';
}@required;
my %hash_value = @value;
foreach my $key (keys %hash_value ){
my @suffix = split /[, ]/,$hash_value{$key};
push @{ $resample->{$key} },@suffix;
print $key . ":" .@suffix,"\n";
}
}
輸出為:
TY45745a:A,BTY45745a:C,DTY45745a:E,FTY5475a:G,HTY5475a:I,JTY5475a:K,L
其中以TY45745a,TY5475a為鍵。我想要實現的是這樣的:TY45745a A,B,C,D,E,F和TY5475a G,H,I,J,K,L。
如果文件名的末尾帶有[AE],則應將其重命名為TY45745a [1..6],如果文件名具有[GL] TY5475a [1..6]。
從Excel工作表中提取名稱后綴是否可以分組?
我該怎么辦? 任何建議或指示都會有所幫助。
我假設您的表如下所示:
| B (2) | N (14) |
|:--------:|:-------:|
| TY45745a | A,B |
| TY45745a | C,D |
| TY45745a | E,F |
| TY5475a | G,H |
| TY5475a | I,J |
| TY5475a | K,L |
你可以做第一部分
其中以TY45745a,TY5475a為鍵。我想要實現的是這樣的:TY45745a A,B,C,D,E,F和TY5475a G,H,I,J,K,L。
使用以下代碼:
use strict;
use warnings;
use Spreadsheet::ParseExcel;
use Data::Dumper;
my $parser = Spreadsheet::ParseExcel->new();
my $book = $parser->Parse('Mappe1.xls') or die $parser->error(),"\n";
my $sheet = $book->{Worksheet};
my %hash;
for my $row (0 .. $sheet->[0]{MaxRow}) {
my $c2 = $sheet->[0]->get_cell($row, 2-1);
my $key = $c2 ? $c2->value() : '';
my $c14 = $sheet->[0]->get_cell($row, 14-1);
my @values = $c14 ? split(',', $c14->value()) : ();
push @{$hash{$key}}, @values;
}
print Dumper \%hash;
我添加了缺少的部分來使代碼運行並為演示目的對其進行了一些簡化。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.