[英]factor within factor summary statistical analysis in r
我有一個包含各種股票信息的數據框,該數據框用於創建有關公司名稱的正面,負面或不確定的情緒。 該數據的標題為:
head(companyReturnsNameScore)
#----------
PERMNO date EXCHCD SICCD TICKER PRC VOL RET SHROUT companyNameSentiment companyName
1 85814 19980831 3 5960 CTAC 6.1875 27989 -0.489691 6431 Not Determined 1 800 CONTACTS INC
2 85814 20021231 3 5960 CTAC 27.5700 97498 1.177725 11388 Not Determined 1 800 CONTACTS INC
3 85814 19990129 3 5960 CTAC 14.7500 5658 -0.180556 6275 Not Determined 1 800 CONTACTS INC
4 85814 20021031 3 5960 CTAC 9.0300 20192 -0.097000 11382 Not Determined 1 800 CONTACTS INC
5 85814 20021129 3 5960 CTAC 12.6600 15474 0.401993 12082 Not Determined 1 800 CONTACTS INC
6 85814 20070731 3 5961 CTAC 23.2400 5574 -0.009378 13619 Not Determined 1 800 CONTACTS INC
marketCap marketCapDeclile
1 39791.81 2
2 313967.16 6
3 92556.25 4
4 102779.46 4
5 152958.12 5
6 316505.56 6
我正在嘗試通過按市值的十分位排名(marketCapDecile)進行統計分析,但是在每個十分位排名中,我想進一步對每個情感因素進行按位分析。 這意味着對於每個十分位等級,我希望看到每個“正,負,未確定”因子水平的統計輸出。 當我輸入我認為是列出因素的正確命令時,
by( companyReturnsNameScore$RET, c(companyReturnsNameScore$marketCapDeclile,
companyReturnsNameScore$companyNameSentiment), summary)
不幸的是我得到以下錯誤:
Error in tapply(seq_len(1785812L), list(`c(companyReturnsNameScore$marketCapDeclile, companyReturnsNameScore$companyNameSentiment)` = c(2L,
: arguments must have same length
對於市值十分位數,我有10個因子水平,對於情感因子分類,我有3個因子水平,因此,基本上,我希望執行30個分析...問題是,我在因子分析中很難執行該因子。
我做錯了什么? 如何在因子分析中執行因子?
您的第二個參數連接了兩個向量,使它們的長度是第一個參數的兩倍:
length( c( factor(1:5), factor(6:10) ) )
[1] 10
您(至少)有兩個選擇:使用list
(請注意?by
的help函數說要使用列表,或者使用interaction
函數返回最長輸入長度的單個向量:
# 1
by( companyReturnsNameScore$RET,
list( companyReturnsNameScore$marketCapDeclile,
companyReturnsNameScore$companyNameSentiment),
summary)
# 2
by( companyReturnsNameScore$RET,
interaction( companyReturnsNameScore$marketCapDeclile,
companyReturnsNameScore$companyNameSentiment),
summary)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.