簡體   English   中英

python中的子集h2o框架

[英]subset h2o frame in python

如何在python中對h2o幀進行子集化。 如果x是df並且Origin是變量,那么在pandas中我們通常可以進行子集化

x[x.Origin == 'AAF']

但是使用h2o框架時會出現以下錯誤:“H2OResponseError:服務器錯誤java.lang.IllegalArgumentException:錯誤:'x.hex'的名稱查找失敗”

有許多不同的方法可以逐行切割H2OFrame。 切片行 ”的“H2O用戶指南”部分概述了這些方法。

以下是使用Iris數據集基於設置為特定值的列對H2OFrame進行子集化的Python示例:

import h2o
h2o.init()

# Load data
path = "http://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"
df = h2o.import_file(path=path)

# Subset data
mask = df["class"] == "Iris-setosa"
newdf = df[mask, :]

# equivalent to both of these, which also work
# newdf = df[df["class"] == "Iris-setosa", :]
# newdf = df[df["class"] == "Iris-setosa"]

newdf = df[df["class"] == "Iris-setosa"]版本幾乎與上面的格式相同,只是H2OFrames不支持引用這樣的列: df.class ; 你必須使用: df["class"]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM