繁体   English   中英

在 C# 中格式化 Excel 中多行的最快方法

[英]Fastest way to format multiple rows in an excel in C#

我有一个巨大的数据集,我想写入 Excel 并需要根据业务逻辑对行进行条件格式设置。 因此,对于数据插入部分,我使用数据数组来填充 Excel,它的运行速度非常快。 但是,在格式化行时,我看到了严重的性能下降。 仅进行格式化就几乎需要两倍多的时间。

截至目前,我正在将格式应用于单个行并循环遍历一系列行。 但是,我想知道是否可以一次选择多行并将批量格式化选项应用于这些行:这是我现在所拥有的:

foreach (int row in rowsToBeFormatted)
{
    Excel.Range range = (Excel.Range)xlsWorksheet.Range[xlsWorksheet.Cells[row + introFormat, 1], xlsWorksheet.Cells[row + introFormat, 27]];
    range.Font.Size = 11;
    range.Interior.ColorIndex = 15;
    range.Font.Bold = true;
}

这是我如何尝试为范围选择多行并应用格式的演示:

string excelrange = "A3:AA3,A83:AA83,A88:AA88,A94:AA94,A102:AA102,A106:AA106,A110:AA110,...." (string with more than 3000 characters)
xlsWorksheet.get_Range(excelrange).Interior.Color = Color.SteelBlue;

但是,当我执行代码时出现以下错误:

HRESULT 异常:0x800A03EC

并且内部没有任何异常。 任何想法我怎样才能达到预期的结果?

根据问题下的评论,范围字符串的硬编码限制为 255 个字符,但是我找不到任何有关它的文档。 另一位评论者建议使用分号作为分隔符,但文档明确指出应将逗号用作范围字符串中的联合运算符:

应用程序语言中A1 样式表示法的范围名称。 它可以包括范围运算符(冒号)、交集运算符(空格)或联合运算符(逗号)。 它还可以包含美元符号,但它们会被忽略。 您可以在范围的任何部分使用本地定义的名称。 如果使用名称,则假定该名称采用应用程序的语言。

那么,我们该何去何从? 单独格式化每个范围确实是低效的。 Application接口提供了方法Union ,但在循环中调用它与单独格式化一样低效。 因此,自然的选择是将范围字符串限制为最大值,从而最大限度地减少对 COM 接口的调用次数。

您可以将整个范围拆分为多个块; 每个不超过 255 个字符的限制。 我会使用枚举器来实现它:

static IEnumerable<string> GetChunks(IEnumerable<string> ranges)
{
    const int MaxChunkLength = 255;
    var sb = new StringBuilder(MaxChunkLength);
    foreach (var range in ranges)
    {
        if (sb.Length > 0)
        {
            if (sb.Length + range.Length + 1 > MaxChunkLength)
            {
                yield return sb.ToString();
                sb.Clear();
            }
            else
            {
                sb.Append(",");
            }
        }
        sb.Append(range);
    }
    if (sb.Length > 0)
    {
        yield return sb.ToString();
    }
}

var rowsToFormat = new[] { 3, 83, 88, 94, 102, 106, 110/*, ...*/ }
var rowRanges = rowsToFormat.Select(row => "A" + row + ":" + "AA" + row);

foreach (var chunk in GetChunks(rowRanges))
{
    var range = xlsWorksheet.Range[chunk];
    // do formatting stuff here
}

以上比单独格式化快10-15倍:

foreach (var rangeStr in rowRanges)
{
    var range = xlsWorksheet.Range[rangeStr];
    // do formatting stuff here
}

我还可以看到更多的优化空间,例如对连续行进行分组,但如果您使用小计格式化离散行,则无济于事。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM