[英]Correlation in text using R
我的數據看起來像(示例)
ID Col1 Col2
1232 ABCSD abd
2342 ABCSD esw
7643 ABCSD rty
9821 ETHS fvc
我有2845428
這樣的行。 我想找出Col1
和Col2
每一對之間的相關性。 例如
ABCSD abd 0.64
ETHS fvc 0.23
如何使用R進行操作? 謝謝
我假設通過關聯,您的意思是“ ABCSD觀測的哪些部分在Col2中有abd ...”。
如果您的數據位於名為df的數據框中,
#get the absolute frequency
freqs <- ftable(df[,2:3])
#convert to relative frequency
freqs <- freqs/rowSums(freqs)
#then to get the format you want
library(reshape)
freqs <- melt(freqs)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.