R中因素匯總統計分析中的因素

Question

我有一個包含各種股票信息的數據框，該數據框用於創建有關公司名稱的正面，負面或不確定的情緒。 該數據的標題為：

 head(companyReturnsNameScore)
#----------
  PERMNO     date EXCHCD SICCD TICKER     PRC   VOL       RET SHROUT companyNameSentiment        companyName
1  85814 19980831      3  5960   CTAC  6.1875 27989 -0.489691   6431       Not Determined 1 800 CONTACTS INC
2  85814 20021231      3  5960   CTAC 27.5700 97498  1.177725  11388       Not Determined 1 800 CONTACTS INC
3  85814 19990129      3  5960   CTAC 14.7500  5658 -0.180556   6275       Not Determined 1 800 CONTACTS INC
4  85814 20021031      3  5960   CTAC  9.0300 20192 -0.097000  11382       Not Determined 1 800 CONTACTS INC
5  85814 20021129      3  5960   CTAC 12.6600 15474  0.401993  12082       Not Determined 1 800 CONTACTS INC
6  85814 20070731      3  5961   CTAC 23.2400  5574 -0.009378  13619       Not Determined 1 800 CONTACTS INC
  marketCap marketCapDeclile
1  39791.81                2
2 313967.16                6
3  92556.25                4
4 102779.46                4
5 152958.12                5
6 316505.56                6

我正在嘗試通過按市值的十分位排名（marketCapDecile）進行統計分析，但是在每個十分位排名中，我想進一步對每個情感因素進行按位分析。 這意味着對於每個十分位等級，我希望看到每個“正，負，未確定”因子水平的統計輸出。 當我輸入我認為是列出因素的正確命令時，

by( companyReturnsNameScore$RET, c(companyReturnsNameScore$marketCapDeclile, 
                           companyReturnsNameScore$companyNameSentiment), summary)

不幸的是我得到以下錯誤：

Error in tapply(seq_len(1785812L), list(`c(companyReturnsNameScore$marketCapDeclile, companyReturnsNameScore$companyNameSentiment)` = c(2L, 
   : arguments must have same length

對於市值十分位數，我有10個因子水平，對於情感因子分類，我有3個因子水平，因此，基本上，我希望執行30個分析...問題是，我在因子分析中很難執行該因子。

我做錯了什么？ 如何在因子分析中執行因子？

Answer 1

您的第二個參數連接了兩個向量，使它們的長度是第一個參數的兩倍：

  length( c( factor(1:5), factor(6:10) ) )
[1] 10

您（至少）有兩個選擇：使用list （請注意?by的help函數說要使用列表，或者使用interaction函數返回最長輸入長度的單個向量：

 # 1
 by( companyReturnsNameScore$RET, 
      list( companyReturnsNameScore$marketCapDeclile, 
                       companyReturnsNameScore$companyNameSentiment),
      summary)
 # 2
 by( companyReturnsNameScore$RET, 
        interaction( companyReturnsNameScore$marketCapDeclile, 
                       companyReturnsNameScore$companyNameSentiment), 
        summary)

R中因素匯總統計分析中的因素

問題描述

1 個解決方案

解決方案1
0 2016-12-08 20:31:41

R中因素匯總統計分析中的因素

問題描述

1 個解決方案

解決方案1 0 2016-12-08 20:31:41

解決方案1
0 2016-12-08 20:31:41