繁体   English   中英

通过聚类点matlab着色的等高线图

[英]Contour plot coloured by clustering of points matlab

我有两个配对值的向量

size(X)=1e4 x 1; size(Y)=1e4 x 1

是否可以绘制某种contour plot ,以最高密度点contour plot轮廓? 即最高聚类=红色,然后在其他地方渐变颜色?

如果您需要更多说明,请询问。 问候,

示例数据:

X=[53 58 62 56 72 63 65 57 52 56 52 70 54 54 59 58 71 66 55 56];  
Y=[40 33 35 37 33 36 32 36 35 33 41 35 37 31 40 41 34 33 34 37 ];
 scatter(X,Y,'ro');

在此输入图像描述

谢谢大家的帮助。 还记得我们可以使用hist3

x={0:0.38/4:0.38}; % # How many bins in x direction
y={0:0.65/7:0.65}; % # How many bins in y direction

ncount=hist3([X Y],'Edges',[x y]);
pcolor(ncount./sum(sum(ncount)));
colorbar

任何人都知道为什么hist3中的edges必须是细胞?

这基本上是一个关于估计生成数据的概率密度函数,然后以一种良好而有意义的方式将其可视化的问题。 为此,我建议使用比直方图更平滑的估计,例如Parzen窗口化(直方图方法的推广)。

在下面的代码中,我使用了您的示例数据集,并根据数据范围估算了网格中的概率密度。 这里有3个变量需要调整以用于原始数据; Borders,Sigma和stepSize。

Border = 5;
Sigma = 5;
stepSize = 1;

X=[53 58 62 56 72 63 65 57 52 56 52 70 54 54 59 58 71 66 55 56];  
Y=[40 33 35 37 33 36 32 36 35 33 41 35 37 31 40 41 34 33 34 37 ];
D = [X' Y'];
N = length(X);


Xrange = [min(X)-Border max(X)+Border];
Yrange = [min(Y)-Border max(Y)+Border];


%Setup coordinate grid
[XX YY] = meshgrid(Xrange(1):stepSize:Xrange(2), Yrange(1):stepSize:Yrange(2));
YY = flipud(YY);

%Parzen parameters and function handle
pf1 = @(C1,C2) (1/N)*(1/((2*pi)*Sigma^2)).*...
         exp(-( (C1(1)-C2(1))^2+ (C1(2)-C2(2))^2)/(2*Sigma^2));

PPDF1 = zeros(size(XX));    

%Populate coordinate surface
[R C] = size(PPDF1);
NN = length(D);
for c=1:C
   for r=1:R 
       for d=1:N 
            PPDF1(r,c) = PPDF1(r,c) + ...
                pf1([XX(1,c) YY(r,1)],[D(d,1) D(d,2)]); 
       end
   end
end


%Normalize data
m1 = max(PPDF1(:));
PPDF1 = PPDF1 / m1;

%Set up visualization
set(0,'defaulttextinterpreter','latex','DefaultAxesFontSize',20)
fig = figure(1);clf
stem3(D(:,1),D(:,2),zeros(N,1),'b.');
hold on;

%Add PDF estimates to figure
s1 = surfc(XX,YY,PPDF1);shading interp;alpha(s1,'color');
sub1=gca;
view(2)
axis([Xrange(1) Xrange(2) Yrange(1) Yrange(2)])

在此输入图像描述

请注意,此可视化实际上是三维的:

在此输入图像描述

在mathworks网站上观看这个4分钟的视频:

http://blogs.mathworks.com/videos/2010/01/22/advanced-making-a-2d-or-3d-histogram-to-visualize-data-density/

我相信这应该提供非常接近您所需的功能。

我将绘图所覆盖的区域划分为网格,然后计算网格每个方格中的点数。 这是一个如何做到这一点的例子。

% Get random data with high density
X=randn(1e4,1);
Y=randn(1e4,1);

Xmin=min(X);
Xmax=max(X);
Ymin=min(Y);
Ymax=max(Y);
% guess of grid size, could be divided into nx and ny
n=floor((length(X))^0.25); 

% Create x and y-axis
x=linspace(Xmin,Xmax,n);
y=linspace(Ymin,Ymax,n);
dx=x(2)-x(1);
dy=y(2)-y(1);
griddata=zeros(n);
for i=1:length(X)
    % Calculate which bin the point is positioned in
    indexX=floor((X(i)-Xmin)/dx)+1;
    indexY=floor((Y(i)-Ymin)/dy)+1;
    griddata(indexX,indexY)=griddata(indexX,indexY)+1;
end
contourf(x,y,griddata)

编辑:Marm0t在答案中的视频使用相同的技术,但可能以更好的方式解释它。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM