cost 720 ms
我如何获得 cuML RandomForestClassifier 叶子?

[英]How can I get cuML RandomForestClassifier leafs?

我是cuML的新手,我有一个使用 scikit 学习的决策树分类器。 我想使用 GPU 执行一些超参数搜索,所以我开始寻找cuML 。 cuML 中没有DecisionTreeClassifier ,但据我在其他 SO 帖子中所读,它可以通过使用具有 1 棵树且没有引导程序的RandomFore ...

cuxfilter绘制的数据如何保存为图片

[英]How to save the data drawn by cuxfilter as an image

我正在考虑画一个.network。 比如demo中,我们可以使用dashboard来获取图表,但是右侧没有“保存按钮”,这是经常出现的情况。 由于我们使用的是大数据,所以我们想利用cuxfilter的快速绘图。 例如,如果是全息图,计算时间太长。 屏幕截图等是可以的,但是有什么方法可以保存结果图吗? ...

由于不兼容的 glib,安装 RAPIDS 时的 conda 错误失败

[英]conda error on install for RAPIDS fails due to incompatible glib

操作系统:Linux 4.18.0-193.28.1.el8_2.x86_64 anaconda:anaconda3/2022.10 尝试安装 RAPIDS,我得到: 正如其他人所问(但据我所知,没有回答),为什么“__glibc”版本 2.28 不在 2.17 和 3.0 之间? ...

cugraph 创建 NoneType

[英]cugraph create NoneType

我试图从 dask_cudf DataFrame 创建一个图形,但图形得到 Nonetype 而没有错误消息。 我也使用相同的数据集尝试了 pandas dataframe。 然后我尝试了三个样本边缘。 每次一个 NoneType object。 但是,如果我使用空手道数据集,一切正常。 我执行完 ...

用户定义的 function 组合 CUDF dataframe 列

[英]User defined function to combine CUDF dataframe columns

根据标题,我正在尝试组合来自不同cudf.DataFrame列的行值。 以下代码适用于标准pandas.DataFrame :import pandas as pd data = {'a': [1], 'b': [2], 'c': [3], 'd': [4]} df = pd.DataFrame.f ...

将 cugraph 中的 output 通过 vertex_id 与输入数据合并

[英]Merge output from cugraph over vertex_id with input data

如果我用 cugraph 创建一个图,然后从节点或社区计算 position,我会得到一个 dataframe 带有信息和顶点 ID。 所以我有三个问题: 顶点 id 是如何创建的? 有没有办法将顶点 id 上的 output 数据与输入数据合并? 是否可以将 networkx 中的信息直接存储在图 ...

通过 conda 安装 cuda rapids + xgboost 堆栈

[英]Installing the cuda rapids + xgboost stack through conda

我正在尝试通过 conda 在 AWS Sagemaker Studio 实例内的 jupyter 笔记本中安装带有 CUDA 的RAPIDS堆栈: 它试图解决依赖项中的尽可能多的冲突(大约 20 分钟后),然后它说: 但是当我尝试运行import xgboost时,我得到了一个ModuleNotF ...

CUDF 未正确读取列

[英]CUDF not reading columns properly

我正在尝试使用 cudf 阅读 csv。 它工作得很好,但是当我尝试获取列的内容时,cudf 似乎根本无法识别它们。 这是一个非常奇怪的行为: 这是代码: 这是错误: 请问有什么帮助吗? 谢谢 ...

谷歌 colab 上的 RAPIDS、CUML

[英]RAPIDS, CUML on google colab

我正在 google colab pro 上安装 RAPIDS,但这需要很长时间,最后 2 次安装花费了一个多小时,而不是安装过程中所说的大约 15 分钟“开始在 Colab 上安装 RAPIDS。这将需要大约 15 分钟”。 有没有办法加快这个过程? 我只想使用 cuML 库,我不关心正在安装它 ...

在 Windows 11 中的 WSL2 Ubuntu 20.04 分发版上安装 RAPIDS

[英]Install RAPIDS on WSL2 Ubuntu 20.04 distribution in Windows 11

我按照此处提供的更新说明在 WSL2 Windows 11 上安装 RAPIDS。如说明中所述,我尚未在 Z3D945423F8E9496C429A5D8C65B4604 分发版上安装 CUDA。 我从官网复制了以下命令: 我认为即使我当前的 CUDA 版本是 11.7,需要 CUDA 11.5 ...

Spark RAPIDS 不加载(CSV 的文件格式不支持错误,parquet 没有错误)

[英]Spark RAPIDS does not load (unsupported file format error for CSV and no error for parquet )

我正在使用带有 2xNVidia A100 GPU 的 Ubuntu 20.04.4 服务器。 Spark (3.3.0) 工作正常,但是当我尝试通过 RAPIDS 使用 GPU 时,它只是一直在等待而不加载数据。 我尝试将数据加载为 CSV 和镶木地板文件,但失败了。 我调用 GPU 的当前方 ...

如何在 python cuDF 中使用自定义 function 进行分组?

[英]How to groupby with custom function in python cuDF?

我不熟悉使用 GPU 进行数据操作,并且一直在努力复制 cuDF 中的一些功能。 例如,我想为数据集中的每个组获取一个模式值。 在 Pandas 中,使用自定义函数很容易完成:df = pd.DataFrame({'group': [1, 2, 2, 1, 3, 1, 2], ...

2022-07-30 08:23:34   2   155    rapids / cudf  
scala 急流使用不透明 UDF 用于单列 dataframe 产生另一列

[英]scala rapids using an opaque UDF for a single column dataframe that produces another column

我正在尝试使用带有 Scala 的 Spark (3.3) 来熟悉基于RAPIDS Accelerator的计算。 能够使用 GPU 的主要争论似乎源于 UDF 的黑盒特性。 自动解决方案是Scala UDF 编译器。 但它不适用于存在循环的情况。 怀疑:如果我的 dataframe 只有一列并产生 ...

当我保存经过训练的模型时,cuML Random Forest- Segmentation fault(core dumped)

[英]cuML Random Forest- Segmentation fault (core dumped) when I save the trained model

我试图在训练后保存我的 Rf 模型,但出现“分段错误(核心转储)”。 我曾尝试在训练前保存它,它不会给我带来任何泡菜问题。 我尝试过其他cuML算法,它让我在训练后保存它们。 此行抛出以下错误: pickle.dump(model, output) #This saving does not w ...

Dask cuDF 中的 memory 用完

[英]Running out of memory in Dask cuDF

最近一段时间,我一直试图在我最近的项目中解决 dask_cudf 中的 memory 管理问题,但似乎我遗漏了一些东西,我需要你的帮助。 我正在研究带有 15 GiB memory 的 Tesla T4 GPU。 我有几个 ETL 步骤,但 GPU 最近似乎在大多数步骤上都失败了(其中大多数只是过滤 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM