简体繁体 English

在 r/python 中查找 id 列之间的相似性

[英]Find similarity between column of an id in r/python

原文 2021-02-24 07:09:16 3 1 python/ r

The data is as follows:数据如下：

id <- c(1,1,2,1,3,2)
address <- c("ABC Ret1","ABC","NY AB1","XYZ","DEL1","NY AB")
similar_address <- data.frame(id,address)

I want to find similar address of each id and make a new data.frame as below我想找到每个 id 的相似地址并创建一个新的 data.frame 如下

Preferred is cosine similarity is used to find similarity among address首选是余弦相似度，用于查找地址之间的相似度

1 个解决方案

Using function sim.strings from package qlcMatrix:使用来自 package qlcMatrix 的 function sim.strings：

get_count_of_similar_strings = function(x){
  issim=(sum(sim.strings(x)>=.5) - length(x))/1
  isnotsim=length(x)-issim
  c(issim,isnotsim)
}

out = by(similar_address$address
,similar_address$id
,get_count_of_similar_strings
,simplify = T)    

data.frame(id=unique(similar_address$id),t(sapply(out,I)))

查找 2df python 之间值的相似性 - Find similarity of values between 2df python

在 Python 中查找 dataframe 的行之间的相似性 - Find similarity between rows of a dataframe in Python

如何在Python中的列表中查找字符串之间的相似性 - How to find similarity between strings in lists in Python

Python函数查找格式不同的字符串之间的相似性 - Python function to find similarity between differently formatted strings

Python 在两个十六进制数据包之间查找相似性十六进制点的代码 - Python Code for find similarity hex points between two hex packet

如何使用 python 查找两个字符串与 function 之间的相似性 - How to find similarity between two strings with function using python

Python NLTK：如何找到用户输入和 excel 数据之间的相似性 - Python NLTK: How to find similarity between user input and excel data

使用 python nltk 来查找两个 web 页面之间的相似性？ - using python nltk to find similarity between two web pages?

如何在图中的两个节点之间找到相似性（NetworkX / Python） - How to find similarity between two nodes in graph (NetworkX/ Python)

找出句子之间的相似度分数 - Find the similarity scores between sentences

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 查找 2df python 之间值的相似性 - Find similarity of values between 2df python 在 Python 中查找 dataframe 的行之间的相似性 - Find similarity between rows of a dataframe in Python 如何在Python中的列表中查找字符串之间的相似性 - How to find similarity between strings in lists in Python Python函数查找格式不同的字符串之间的相似性 - Python function to find similarity between differently formatted strings Python 在两个十六进制数据包之间查找相似性十六进制点的代码 - Python Code for find similarity hex points between two hex packet 如何使用 python 查找两个字符串与 function 之间的相似性 - How to find similarity between two strings with function using python Python NLTK：如何找到用户输入和 excel 数据之间的相似性 - Python NLTK: How to find similarity between user input and excel data 使用 python nltk 来查找两个 web 页面之间的相似性？ - using python nltk to find similarity between two web pages? 如何在图中的两个节点之间找到相似性（NetworkX / Python） - How to find similarity between two nodes in graph (NetworkX/ Python) 找出句子之间的相似度分数 - Find the similarity scores between sentences

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM