[英]Stratified sampling in python
我想在 python 中對數據框庫進行采樣。 該樣本必須按特定變量進行分層。 我試過 sklearn.cross_validation 但問題是你只能用一個變量分層,我需要根據幾個變量對我的人口進行分層。
所以我正在尋找相當於proc調查,(SAS中的分層指令)或svydesign(R中)。 這個函數是否存在於python中?
我在此頁面上找到了函數 stratified_samples https://gist.github.com/spacelis/6088623但沒有文檔或使用示例,很難理解如何輸入分層變量。
謝謝你的幫助
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.