对于向量AB ,欧几里德距离为: sqrt((A1-B1)^2+(A2-B2)^2+...+(An-Bn)^2)

A <- c(5, 4, 3, 2, 1, 1, 2, 3, 5)
B <- c(1, 0, 6, 4, 3, 2, 3, 1, 3)
dist(rbind(A,B), method= "euclidean") 
7.681146

当向量A和B包含缺失值时,如何计算距离? 这是一个例子:距离的R输出是8.485281但它是如何计算的?

A <- c(5, NA, NA, NA, 1, 1, 2, 3, 5)
B <- c(1, 0, 6, NA, NA, NA, NA, 1, 3)
dist(rbind(A,B), method= "euclidean")
8.485281

===============>>#1 票数:9 已采纳

首先删除带NA条目,然后按比例缩放距离以考虑完整样本的较大尺寸:

i <- is.na(A) | is.na(B)
dist(rbind(A[!i], B[!i])) * sqrt(length(A) / length(A[!i]))
#          A2
# B2 8.485281

  ask by Filly translate from so

未解决问题?本站智能推荐:

1回复

两个位置向量列表之间的距离

我试图得到一个包含两个列表中的点之间的距离的矩阵。 点的矢量包含的纬度和经度,并且可以使用地圈包功能distCosine任意两点之间被计算出的距离。 我想得到一个看起来像这样的矩阵: 我正在努力思考一种生成矩阵的方法,而不仅仅是循环Points_a和Points_b并计算每
1回复

R中类别向量之间距离计算的性能

我正在计算两个分类向量(即字符向量)之间的距离,如下所示: 显然,向量具有相同的长度。 结果是两个向量不同的维数。 但是我有性能问题。 有谁知道如何加快计算速度? 谢谢,卢卡斯
2回复

如何计算R中两个向量之间不同的众所周知的相似性或距离度量?

我想计算两个向量之间的相似性(距离): 我只是想知道一个包是否可用于计算R中不同的众所周知的相似性(距离)度量? 例如,“Resnik”,“Lin”,“Rel”,“Jiang”,...... 这些方法的实现并不难,但我认为它必须在R中的一些包中定义。 经过一些谷歌搜索后,我
2回复

填写R中距离矩阵的缺失行/列

我有两个距离矩阵..但它们中的任何一个都可能缺少项目,并且它们可能会出现故障-例如: 矩阵#1(缺少项c) 矩阵#2(缺少项目b,并且项目乱序) 我想找出所有矩阵之间的差异,同时假设所有缺失项均为0。因此,我得到的矩阵应为: 最好的方法是什么? 我应该同时对两个矩
2回复

行之间的距离

我很抱歉这是我在一次灾难性的早期尝试后赎回自己的尝试。 现在我有了更多的清晰度。 所以我再来一次 我的目标是找到相似的行。 所以首先我有兴趣计算行之间的距离。 这是下面的测试数据集。 这里有两件事1)距离2)行 考虑这个行组合。 对于行(1-4-7-10),距离
1回复

端口之间的距离计算器

我有一个端口数据库,其中包含近1万个端口名称及其对应的位置。我想找到端口之间的距离。 根据使用Google距离矩阵API的理解,对于一组特定的出行方式,例如自行车,行车,步行和内部交通,我们只能找到两点之间的距离。 但以我为例,我想在航行中找到两个港口之间的距离。 如果有人做过类似
2回复

R距离矩阵由两个向量(n,1)建立

直升机, 我有两个向量:实值的x (n,1)和y (n,1) ,我想从这些向量创建矩阵M (n,n) ,其中包含每两对之间的距离。 Thnx为您提供帮助。
7回复

可视化文本之间的距离

我正在为学校开展研究项目。 我写了一些文本挖掘软件,分析集合中的法律文本,并吐出一个分数,表明它们有多相似。 我运行程序来比较每个文本和其他所有文本,我有这样的数据(虽然有更多的点): 现在我需要在图表上绘制它们。 我可以轻松地反转分数,以便现在小值表示相似的文本,大值表示不相似的
1回复

在距模板一定距离内生成随机向量

我在这里发现了类似的问题:但是它不涉及R。我想随机生成一个数字矢量,该数字矢量与定义的数字矢量相距一定的距离。 A = c(12,34,-2)距离= z 用dist(A,b)<z查找b = c(rnorm(1),rnorm(1),rnorm(1)) 有什么建议吗? 最好
1回复

如何计算距离并返回具有最短距离的特定变量的值?

我有两个分开的数据集。 一个包含参与者的位置,另一个包含测量站的位置和相应的值,在不同的时间点。 下面我生成样本数据集。 # 样本数据集如下。 我想计算每个站点(AF)和每个参与者(1-4)在每个时间点(yearmon)之间的距离。 并将特定时间点的值分配给特定参与者。