[英]Matlab `rowfun` function with multiple outputs: Safe to assume row order?
我尝试为rowfun
提供一个函数,该函数返回与输入高度相同的多行输出。 它似乎按预期工作。
% Example table with 2-column-array as a single data field
x = table( [1;1;2;2] , [[2;2;1;1] [2;1;2;1]] , ...
'VariableNames' , {'idx' 'Field2columns'} )
x = idx Field2columns
___ _____________
1 2 2
1 2 1
2 1 2
2 1 1
% Example anonymous function takes all rows with same idx value and
% reverse their row order
y = rowfun( @(z) z(end:-1:1,:) , x , 'Input','Field2columns' , ...
'Grouping','idx' , 'OutputVar','OutVar' )
y = idx GroupCount OutVar
___ __________ ______
1 1 2 2 1
1_1 1 2 2 2
2 2 2 1 1
2_1 2 2 1 2
% Append the generated data to original table
[ x y(:,{'OutVar'}) ]
ans = idx Field2columns OutVar
___ _____________ ______
1 1 2 2 2 1
1_1 1 2 1 2 2
2 2 1 2 1 1
2_1 2 1 1 1 2
这使得代码非常高效。 否则,我将不得不遍历x.idx
所有不同值,为每个值提取x
匹配行,生成行反转子集并编译结果。
我唯一担心的是,我假设匿名函数输出的行顺序将保持不变,并且每一行都将与表x
的相应行对齐。 例如,如果 idx=7,那么当它应用于x(x.idx==7,:)
时, x
中 idx=7 的第 N 行将附加到匿名函数输出中的第 N 行。
rowfun
文档不处理第一个参数表示返回多行输出的函数的情况。 我只有观察到的行为可以依赖。 利用这种行为来简化我的代码是可取的,还是依赖这种未记录的行为是一种不好的做法,例如,可能不包括极端情况,并且 TMW 没有义务在未来保持当前行为?
'GroupingVariables'
下'GroupingVariables'
rowfun
文档说:
输出 B 包含每一组的一行。
因此,如果您每组获得不止一排,那么您肯定是在无证水域。 未来的版本可能会在您的代码中引发错误。
关于函数输入行的顺序:我建议您向 MathWorks 询问具有相同分组变量的行的顺序。 一种方法是转到文档页面的底部,选择星级,然后在文本框中说文档不完整,因为在给出此选项时它没有指定行的顺序。 喜欢文档的人喜欢彻底和完整的文档,他们可能会通过完成文档来回答这个问题。
如果你想留在记录区域,你可以使用非常方便的splitapply
。 要处理输出中的多行,您可以将它们放在一个单元格中,然后将其转换为表格:
y = splitapply(@(z) {z(end:-1:1,:)},x.Field2columns,x.idx) % note the {...} in the function
[x table(cell2mat(y),'VariableNames',{'OutVar'})] % this is like: [x y(:,{'OutVar'})]
我猜这会降低效率,但它使您的代码保持在函数的记录行为内,而无需使用循环。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.