標簽[quantile] - 堆棧內存溢出

[英]Error computing quantiles on large RasterStack

我想在 R 上的一組堆疊的 RasterLayers 上跨層獲取每個單元格的分位數。我的 RasterStack 看起來像這樣尺寸：721、1440、1038240、18628（nrow、ncol、ncell、nlayers）我運行以下行以獲得每個單元格的值為第 25 個和第 75 個百分位數的 ...

ggpubr如何模擬QQ plot

[英]How to emulate QQ plot from ggpubr

這里有很多關於使用 QQ plot 的話題，但我正在嘗試弄清楚如何手動計算一個，並且在這個過程中我想模擬ggpubr中使用的那個，因為它看起來比基本的 R 版本更好。到目前為止，我至少似乎使用這種方法在 base R 中生成了一個 QQ plot：結果和base R版本大同小異，只是QQ線我還 ...

Python 按分位數過濾較大的文本

[英]Python filter larger text by quantile

假設我正在處理一個非常大的文本文件，我有以下偽代碼注意文件很大，可能來自一個pipe，不想看兩遍。我們必須先讀取整個文件才能獲得過濾文件的截斷值上面的方法可以，但是memory的消耗太大了，有沒有什么算法優化可以提高效率，減少memory的消耗？ ...

使用 R 使用調查包按分位數創建虛擬變量。 findInterval 函數有問題

[英]Using R to create a dummy variable by quantile using the survey package. Trouble with findInterval function

我目前正在處理需要調查加權的公共使用微數據，因此我已經相當熟悉調查包和 srvyr 的匯總統計數據。我正在嘗試找出一種方法來為調查對象數據表中的每個觀察結果創建一個指示變量，該數據表在使用分位數函數時對應於該觀察結果的分位數。例如，我可能想在計算“高度”時根據觀察的分位數為每個觀察創建一個虛擬對 ...

為什么我無法刪除異常值？

[英]Why am I not able to remove outliers?

為什么我無法按預期過濾掉異常值？我的數據集有 299 個觀察值。我試過改變標志，但我不認為這是錯誤的。也許這可能是我的括號？ [Q3+(1.5)IQR] 以上的所有異常值是我試圖在serum_creatinine和creatine_phosphokinase中刪除的數據 ...

創建對前兩列進行排序的新列

[英]Create new column which orders two previous columns

我希望創建一個基於其他兩個列的順序的新列，最好使用 Tidyverse 函數，但我們歡迎任何建議。我有一個包含大約 1300 個條目和幾列的表格，但我的數據樣本類似於：人數總訂單總分位數 12 1個 1個 19 2個 1個 21 3個 2個 45 5個 2個 53 5個 3個 55 ...

按十分位數分布變量

[英]Distribute a variable by deciles

我有一個包含許多觀察值和變量的數據集，我正在嘗試使用ingressosmensualsllar變量（代表月收入）創建一個十分位數。我正在尋找的 output 是在我的數據集中添加一個新變量，以便每個觀察值都有其相應的十分位數。我的目標是擁有一個geom_bar ，其中income十分位數作為 x ...

類別比較

[英]Category comparison

我有以下數據框：我試圖盡可能簡單地形象化Extra與Standard的整體優勢（即：' Extra相對於Standard的優勢是什么？） ...

顯示變量 A 的百分位數，而百分位數的分類基於變量 B

[英]Show percentiles of Variable A, while the classification of percentiles is based on Variable B

我有一個如下所示的數據集：收入財富 10.000 100000 15.000 111000 14.200 123456 12.654 654321 我還有很多行。我現在想知道特定 WEALTH 百分位的家庭有多少收入。以下分位數是相關的：我一直使用以下代碼來獲取特定的百分位數 ...

Pandas qcut ValueError：輸入數組必須是一維的

[英]Pandas qcut ValueError: Input array must be 1 dimensional

我試圖將我的值分類為 10 個箱子，但我遇到了這個錯誤。我怎樣才能避免這個錯誤並順利地將它們裝箱？附件是數據和代碼示例。數據代碼 ...

如何根據值將記錄平均分為N組？

[英]How can I evenly divide records into N groups based on the values?

對於如下表，如何根據“factor_value”的值將這些記錄平均分為3組？ sym date factor_value ------ ---------- ------------ 100000 2022.04.27 1 100001 2022.04.27 2 100002 2022.04.2 ...

分位數 function 如何在 pandas 中工作

[英]how does quantile function works in pandas

我正在使用 pandas 來計算系列的分位數根據我的理解，要計算 0.25 分位數，公式為：現在我可以找到這個pos值的兩個解釋：解釋A：pos表示分位數值應該更接近第二個數字，那么分位數值應該是：解釋B：小數部分表示分位數的25%應該來自第2個數，75%來自第3個數，那么分位數的值應該是： ...

擴展 Window 並結合 PySpark 上的百分位數操作？

[英]Expanding Window combined with Percentile operation on PySpark?

我有一個 PySpark DataFrame ，每次車輛行程都有一個“速度”列，我想在新列中計算 0.95 擴展（1）分位數。也就是說，在 Python 中，以：並申請給出（在對新 df 的索引和列進行一些操作之后）：最后一列代表“SPEED”列的 .95 分位數，以擴展 window 方 ...

在 Julia 與 Python 中使用分位數時出現意外結果

[英]Unexpected result when using quantile in Julia vs Python

我剛從 Julia 開始，我正在嘗試做一些簡單的統計。我正在使用 StatsBase package 並嘗試計算分位數。並得到我假設 Q_1 = 3.25 和 Q_2 = 7.75 在 python 上運行類似的代碼：產量：其中 Q_1 = 2.75 和 Q_3 = 8.25。根據我對統 ...

9 種分位數的虛擬示例

[英]Dummy example of the 9 types of Quantiles

我們都知道R軟件通過function分位數(x,probs,type=1,2,3,4...)有9種分位數的計算方式。我正在為我的學生尋找一個簡單而愚蠢的特殊示例，其中每種類型的分位數計算方法都會返回一個不同的值，樣本大小至少為 20 個值。最好的例子是它們都為分位數 0.5（即中位數）返回不同的 ...

如何在 R 中將四分位數保存在不同的組中

[英]How to save quartiles in separate groups in R

我有幾門課程的學生成績清單。我想 select 第一個四分位數（保存在一個名為 A 的組中）和第三個四分位數（保存在一個名為 B 的組中）和學生的 rest 保存在一個名為 Z411250F8384DFCAD31D 的組中我的問題是如何將他們的成績保存在那個單獨的組中？我怎樣才能找到每個四分位數 ...

RuntimeError: quantile() q 張量必須與 pytorch-forecasting 中的輸入張量具有相同的 dtype

[英]RuntimeError: quantile() q tensor must be same dtype as the input tensor in pytorch-forecasting

PyTorch-預測版本：0.10.2 PyTorch版本：1.12.1 Python版本：3.10.4 操作系統：windows 預期行為沒有錯誤實際行為錯誤是文件 c:\Users\josepeeterson.er\Miniconda3\envs\pytorch\lib\site-pac ...

Pandas Groupby 使用“分位數”計算按列分位數的問題

[英]Pandas Groupby Problems with Calculating Column-Wise Quantiles with "quantile"

在我的情況下，我需要計算跨列或沿行或“月”列的大型 DF 的分位數。顯然，僅在 df 上應用的分位數 function 使用關鍵字“axis”工作，但如果您嘗試使用 groupby 應用分位數，則會因錯誤而被拒絕：以下是分位數與這樣的數據一起使用的情況：但是，如果我使用 groupby 語句添 ...

為什么 R 中的分位數 function 在每組中給出不相等的值計數

[英]Why do quantile function in R gives unequal count of values in each group

我正在嘗試將連續值數據分組為三分位數。我正在使用 function quantile來執行此操作。以下是我的代碼難道不應該在每組中給出相等的值計數嗎？我在組中得到不同的計數。這是值的輸入有人可以請幫助可能是什么原因 ...

ntile() 等效於相等范圍

[英]ntile() equivalent for equal ranges

我想將數據框的一列拆分為相同大小的箱。例如，我可以看一個向量 c.f. 我不想要的是相同大小的組，例如如果有一種有效且干凈的方法來做到這一點，我將不勝感激。從向量我可能可以概括它，但為了增加上下文，我的實際用例更類似於我使用第一節中等效的 function 而不是ntile 。這可能是最 ...