簡體   English   中英

無法在蒙特卡羅模擬極端值

[英]Can't simulate values extreme enough in Monte Carlo

我有一個576個感興趣基因的生物學數據集及其指定的功能類別。 我還為我正在使用的物種的基因組中的所有基因分配了功能類別。 這允許我設置加權,隨機,繪制,我可以從基因組中挑選576個基因/功能分配,並查看各種功能類別的分布。 我重復了這一百萬次這看起來有點過分; 然而,對於我的一個類別,我目前無法模擬一個像我感興趣的基因那樣極端的值。

為了提供背景,功能類別(讓我們用“A”代表)代表14%的基因組和28%的感興趣的基因。 我模擬的最高值為A類的22.92%,97.5%的置信區間為17.19%。 當我按照經驗進行計算p值時,這給我帶來麻煩,即(模擬A的值超過感興趣基因的A值)/(模擬總數),所以我的p值只是零。

len([i for i in probs_dict["A"] if i > target_per])/total_sims

有沒有不同的方法來計算p值或表示高度過度表示?

在分子和分子中添加1可能是合適的。 例如,請參閱此文章 這可以防止p = 0發生。 所以你的p值公式將成為:

(1 + len([i for i in probs_dict["A"] if i > target_per]))/(1 + total_sims)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM