提高 Cronbach Alpha 代碼 python numpy 的性能

Question

我編寫了一些代碼來計算有效的 Cronbach Alpha。 但我不太擅長使用 lambda 函數。 有沒有辦法通過使用 lambda 而不是 svar() 函數並通過使用 numpy 數組擺脫一些 for 循環來減少代碼並提高效率？

import numpy as np


def svar(X):
    n = float(len(X))
    svar=(sum([(x-np.mean(X))**2 for x in X]) / n)* n/(n-1.)
    return svar


def CronbachAlpha(itemscores):
    itemvars = [svar(item) for item in itemscores]
    tscores = [0] * len(itemscores[0])
    for item in itemscores:
       for i in range(len(item)):
          tscores[i]+= item[i]
    nitems = len(itemscores)
    #print "total scores=", tscores, 'number of items=', nitems

    Calpha=nitems/(nitems-1.) * (1-sum(itemvars)/ svar(tscores))

    return Calpha

###########Test################
itemscores = [[ 4,14,3,3,23,4,52,3,33,3],
              [ 5,14,4,3,24,5,55,4,15,3]]
print "Cronbach alpha = ", CronbachAlpha(itemscores)

Answer 1

def CronbachAlpha(itemscores):
    itemscores = numpy.asarray(itemscores)
    itemvars = itemscores.var(axis=1, ddof=1)
    tscores = itemscores.sum(axis=0)
    nitems = len(itemscores)

    return nitems / (nitems-1.) * (1 - itemvars.sum() / tscores.var(ddof=1))

NumPy 內置了方差函數。指定ddof=1使用 N-1 的分母，給出樣本方差。 還有一個sum內置。

Answer 2

正如 Julien Marrec 提到的，我建議對 CronbachAlpha 進行以下重構：

def CronbachAlpha(itemscores):
    # cols are items, rows are observations
    itemscores = np.asarray(itemscores)
    itemvars = itemscores.var(axis=0, ddof=1)
    tscores = itemscores.sum(axis=1)
    nitems = len(itemscores.columns)

    return (nitems / (nitems-1)) * (1 - (itemvars.sum() / tscores.var(ddof=1)))

Answer 3

與其他答案相同，只是多一點 Pythonic。 X是一個數據矩陣——也就是說，行是樣本，列是項目。 X可能是一個 numpy 數組或 Pandas DataFrame。

def cronbach_alpha(X):
    num_items = X.shape[1]
    sum_of_item_variances = X.var(axis=0).sum()
    variance_of_sum_of_items = X.sum(axis=1).var()
    return num_items/(num_items - 1)*(1 - sum_of_item_variances/variance_of_sum_of_items)

（沒有必要指定ddof ，因為該術語出現在分母和分子中並取消。）

提高 Cronbach Alpha 代碼 python numpy 的性能

問題描述

3 個解決方案

解決方案1
9 已采納 2013-12-27 11:13:10

解決方案2
1 2019-05-22 21:21:56

解決方案3
1 2021-03-11 19:55:26

提高 Cronbach Alpha 代碼 python numpy 的性能

問題描述

3 個解決方案

解決方案1 9 已采納 2013-12-27 11:13:10

解決方案2 1 2019-05-22 21:21:56

解決方案3 1 2021-03-11 19:55:26

解決方案1
9 已采納 2013-12-27 11:13:10

解決方案2
1 2019-05-22 21:21:56

解決方案3
1 2021-03-11 19:55:26