cost 476 ms
假設每個成員在 r 中至少被挑選一次,從集合中進行二次抽樣

[英]Subsampling from a set with the assumption that each member would be picked at least one time in r

對於我們有 1000 行數據集的情況,我需要一個代碼或想法。 我想多次從大小為 800 的行中進行子采樣(我不知道應該重復多少次)。 我應該如何控制至少在一次運行中選擇所有成員? 我需要 r 中的代碼。 為了使問題更清楚,讓我們將行名稱定義為: 如果我子采樣 3 次: I不在任何子樣本集中。 我想 ...

二次抽樣公式skipgram NLP

[英]subsampling formula skipgram NLP

我正在研究如何使用 Pytorch 實現 Skip-Gram 模型,我遵循本教程,在子采樣部分作者使用了這個公式: 其中z變量是某個單詞的計數占語料庫中單詞總數的比例。 我的疑問是,根據單詞的比例,這個公式給出的結果大於一,那么這個詞總是被添加到子樣本語料庫中,它不應該返回一個介於 0 和 1 ...

R 從數據集中的定制子集中獲取分位數和均值

[英]R Obtain quantile and mean from a tailored subset in the dataset

我想在定制的子集中獲得分位數。 例如在以下數據集中: 對於每一行i ,我想知道在x=x[i]和y=<y[i]的行中,50%tile(以及進一步計算中的其他分位數,例如 10%tile, 5% z[i]的平鋪)。 預期的 output 將是 對於每一行i ,我想知道在x=x[i]和y=<y ...

如何對時間序列進行二次采樣(GPS 位置的突發)

[英]How to subsample time series (bursts of GPS locations)

我有一個時間序列如下: 我想對其進行子采樣,例如我獲得了以下時間序列(即刪除每秒記錄的位置,例如大致僅保留 1 個位置/分鍾) 我寫了以下代碼(但我沒有得到預期的時間序列) 我真的很感激一些幫助,非常感謝! ...

在 Matlab 中,當圖像在 YCbCr 中時,如何使用色度二次采樣將 4:4:4 圖像縮小為 4:1:1?

[英]In Matlab, how can I use chroma subsampling to downscale a 4:4:4 image to 4:1:1 when the image is in YCbCr?

按照這個確切的問題 在 Matlab 中,當圖像在 YCbCr 中時,如何使用色度二次采樣將 4:4:4 圖像縮小為 4:2:0? 他正在執行從 4:4:4 到 4:2:0 的色度縮小,我想從 4:4:4 縮小到 4:1:1。 我不知道該怎么做? 執行縮減 誰能幫幫我嗎? 提前致謝。 ...

統計推理:tf.keras.preprocessing.sequence skipgrams 如何以及為什么以這種方式使用 sampling_table?

[英]Statistical reasoning: how and why does tf.keras.preprocessing.sequence skipgrams use sampling_table this way?

sampling_table parameter僅在tf.keras.preprocessing.sequence.skipgrams方法中使用一次,用於測試sampling_table中目標詞的概率是否小於從 0 到 1 抽取的某個隨機數( random.random() )。 如果你有一個很 ...

與類別成比例地從 df 中抽取隨機子樣本

[英]Drawing a random sub-sample from a df proportionally to categories

我有一個這樣的數據框 產生: (真實數據框有 >1000 行) 並計算類別產量: 我想繪制n行的隨機子樣本,以便按比例表示每個中間類別。 例如,13 個 (~23%) 類別中的 3 個是“內科”。 因此,大約 23% 的子樣本應該有這個類別。 如果每個患者有 1 個類別,這不會 ...

對聲音文件進行二次采樣的更有效方法?

[英]More efficient way of subsampling sound files?

如果已經問過這個問題,以及我對這個問題的措辭,因為我是 R 的新手,請提前道歉。 有什么方法可以使我的代碼對聲音文件進行二次采樣更有效嗎? 我有來自 9 個站點的 148 小時錄音,對於每個站點,我每 5 分鍾對 12 個 1 分鍾片段進行二次采樣。 我目前這樣做的方式有效,但非常耗時。 有沒有辦 ...

在 K 表示使用 R 進行聚類后,檢索最接近每個聚類的質心的 100 個樣本

[英]Retrieve 100 samples closest to the centroids of each cluster after K means clustering using R

我試圖通過首先在 R 中執行 K 均值聚類然后對每個代表性聚類采樣 50-100 個樣本來減少輸入數據大小,以進行下游分類和特征選擇。 原始數據集被分割為 80/20,然后 80% 進入 K 均值訓練。 我知道輸入數據有 2 列標簽和 110 列數字變量。 從標簽欄中,我知道有 7 種不同的葯物治 ...

如何在 Spark 中對數據集的窗口進行子采樣?

[英]How to subsample windows of a DataSet in Spark?

假設我有一個如下所示的DataSet : 我想創建一個新的DataSet ,其中每個名稱都有 3 行,其中附加的行(如果有)是從同名的行中采樣的(例如,Karen 將具有三行相同的行)。 如何在不遍歷每個名​​稱的情況下執行此操作? ...

循環左連接

[英]Loop over left joins

我一直在嘗試遍歷左連接(使用 R)。 我需要創建一個表,其中的列代表一個更大的表中的樣本。 新表的每一列都應代表這些樣本中的每一個。 如何循環左連接以使每列對應於不同的樣本? ...

在 R 中均勻分布的樣本隨機行

[英]Sample random rows evenly spaced apart in R

我有超過 50 年的測量值。 我正在嘗試對數據進行二次抽樣,以查看如果我只在 2 年或 3、4、5 年等而不是全部 50 年中抽樣,我會發現什么模式。我編寫了一個代碼,可以從數據集,但條件是這兩個隨機年份至少在數據集中分散開(相隔 10 年,或其他什么)。 有沒有條件隨機抽樣代碼? 這是我目前正在做 ...

如何在不替換的情況下重新采樣,將連續三個視為每個選擇的一個單元

[英]How to resample without replacement considering consecutive three as one unit for each choice

目標是從原始總體中抽取 n 個數據點。 但是原始人口具有序列相關性(將其視為時間序列數據),我想選擇相鄰的三個作為每個選擇的一個單位。 也就是說,每次都要選擇相鄰的三個數據點。 選擇必須在沒有替代的情況下完成。 它將重復選擇,直到樣本數據點的數量達到 n。 每個選擇的數據點都必須是唯一的。 (假設 ...

對 integer 的一維數組進行二次采樣,使總和達到 python 中的目標值

[英]Subsampling a 1D array of integer so that the sum hits a target value in python

我有兩個 1D arrays 的整數,它們有些不同,例如: 我希望每個數組的總和等於兩者中最小的數組的總和。 但是我想將值保留為整數,而不是浮點數,所以除法不是一種選擇。 解決方案似乎是對最大數組進行一些子采樣,使其總和等於最小數組的總和: 但是,我找不到可以執行此類二次采樣的 function。 ...

Gensim word2vec 下采樣樣本=0

[英]Gensim word2vec downsampling sample=0

Gensim word2vec 中的sample= 0是否意味着在我的訓練期間沒有使用下采樣? 文檔只是說 “有用的范圍是 (0, 1e-5)” 但是將閾值設置為 0 會導致 P(wi) 等於 1,這意味着不會丟棄任何單詞,我是否理解正確? 我正在處理一個包含 7597 個 Faceb ...

變長 df 子采樣函數 r

[英]variable length df subsampling function r

我需要編寫一個函數,涉及通過變量n bin 對 df 進行子集化。 例如,如果n為 2,則在兩個 bin 中對 df 進行多次子采樣(從前半部分開始,然后從后半部分開始)。 如果n為 3,則在 3 個 bin 中進行子采樣(第一個 1/3,第二個 1/3,第三個 1/3)。 到目前為止,我一直在為不 ...

如何在MATLAB中手動將Y Cb Cr轉換為RGB?

[英]How to convert Y Cb Cr to RGB in MATLAB manually?

我的任務是對一系列 JPEG 執行 4:2:0 色度子采樣(顏色壓縮)。 第一步是確保我可以生成我的 Y、Cb 和 Cr 值,然后轉換回 RGB 並顯示圖像。 然后我可以回去添加我的子采樣邏輯。 我很確定我有正確的公式來生成 Y、Cb 和 Cr 值,但我無法找出返回 RGB 和打印的正確方法。 ...

在 Matlab 中,當圖像在 YCbCr 中時,如何使用色度子采樣將 4:4:4 圖像縮小到 4:2:0?

[英]In Matlab, how can I use chroma subsampling to downscale a 4:4:4 image to 4:2:0 when the image is in YCbCr?

我已經將 jpg 圖像從 RGB 轉換為 YCbCr,但現在必須使用色度子采樣使它們成為 4:2:0。 我已經搜索過但沒有找到任何有關如何執行此操作的信息(注意:我對 Matlab 非常陌生) 編輯:我現在有了這個,但是在我設置 ycbcr(:,:,2) = newCb 的底部它說“無法執行分配, ...

為矩形圖像創建重疊的方形補丁

[英]Creating overlapping, square patches for rectangular images

給定一個矩形圖像img和 patch s 。 現在我想用邊長為s正方形補丁覆蓋整個圖像,以便img中的每個像素都在使用最少補丁數量的至少一個補丁中。 此外,我希望相鄰的補丁盡可能少重疊。 到目前為止:我已經在下面包含了我的代碼並制定了一個示例。 然而,它還不能完美地工作。 希望有人發現錯誤。 示 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM