簡體   English   中英

如何使用素食主義者在 R 中的 plot 稀疏曲線?

[英]How to plot rarefaction curves in R using Vegan?

我有一個數據集,其中包含在不同參考基因組中鑒定的基因。 因此,參考基因組在行中,基因在表的列中。 該表被編碼為二進制,其中0表示基因不存在, 1表示基因存在。 我做了基因積累曲線,這表明每個基因組的基因數量正在接近一個平台期。 現在,我正在嘗試使用 R-package vegan對稀疏曲線進行 plot 。 我使用了以下代碼:

b<-read.csv("data.csv", header = T, check.names = F)
S <- specnumber(b) # observed number of species
(raremax <- min(rowSums(b)))
Srare <- rarefy(b, raremax)
plot(Srare, xlab = "Observed No. of genes", ylab = "Rarefied No. of genes")
abline(0, 1)
rarecurve(b, step = 15, sample = raremax, col = "blue", cex = 0.6)

數據集如下:

          gene1 gene2 gene3
#genome1    0     1     0
#genome2    1     0     1
#genome3    1     0     1

但是,使用此代碼我沒有得到任何令人滿意的 output。 我只得到一條通過對角線的直線。 我在下面附上了 output。 稀疏曲線

有人可以建議我如何糾正 output?

謝謝你。

稀有rarefy稀有數據的各個行:它對每行中出現的事件(“個人”)進行子樣本。 如果所有這些抽樣個體的值都是 1,那么您將有一個子樣本,而一個子樣本的總和就是樣本量:這就是您得到的。 稀疏向量沒有有意義的方法:您需要一些計數 > 1 的計數數據。

在對矩陣的進行二次采樣時,您可能正在尋找整個數據集中的基因積累。 這是在素食主義者function specaccum (參數method = "exact" )中完成的,它有自己的plot等方法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM