
[英]How can I get cuML RandomForestClassifier leafs?
我是cuML的新手,我有一个使用 scikit 学习的决策树分类器。 我想使用 GPU 执行一些超参数搜索,所以我开始寻找cuML 。 cuML 中没有DecisionTreeClassifier ,但据我在其他 SO 帖子中所读,它可以通过使用具有 1 棵树且没有引导程序的RandomFore ...
[英]How can I get cuML RandomForestClassifier leafs?
我是cuML的新手,我有一个使用 scikit 学习的决策树分类器。 我想使用 GPU 执行一些超参数搜索,所以我开始寻找cuML 。 cuML 中没有DecisionTreeClassifier ,但据我在其他 SO 帖子中所读,它可以通过使用具有 1 棵树且没有引导程序的RandomFore ...
[英]How to save the data drawn by cuxfilter as an image
我正在考虑画一个.network。 比如demo中,我们可以使用dashboard来获取图表,但是右侧没有“保存按钮”,这是经常出现的情况。 由于我们使用的是大数据,所以我们想利用cuxfilter的快速绘图。 例如,如果是全息图,计算时间太长。 屏幕截图等是可以的,但是有什么方法可以保存结果图吗? ...
[英]conda error on install for RAPIDS fails due to incompatible glib
操作系统:Linux 4.18.0-193.28.1.el8_2.x86_64 anaconda:anaconda3/2022.10 尝试安装 RAPIDS,我得到: 正如其他人所问(但据我所知,没有回答),为什么“__glibc”版本 2.28 不在 2.17 和 3.0 之间? ...
[英]Cupy config shows no cuda device
我构建了一个 docker contaiener,通过 singularity 部署在 HPC+GPU 上。 当我跑 cp.show_config() 操作系统:Linux-5.4.0-135-generic-x86_64-with-glibc2.31 蟒蛇版本:3.9.12 CuPy 版本:9. ...
[英]cugraph create NoneType
我试图从 dask_cudf DataFrame 创建一个图形,但图形得到 Nonetype 而没有错误消息。 我也使用相同的数据集尝试了 pandas dataframe。 然后我尝试了三个样本边缘。 每次一个 NoneType object。 但是,如果我使用空手道数据集,一切正常。 我执行完 ...
[英]User defined function to combine CUDF dataframe columns
根据标题,我正在尝试组合来自不同cudf.DataFrame列的行值。 以下代码适用于标准pandas.DataFrame :import pandas as pd data = {'a': [1], 'b': [2], 'c': [3], 'd': [4]} df = pd.DataFrame.f ...
[英]GPU vs CPU memory usage in RAPIDS
我知道 GPU 和 CPU 有自己的 RAM,但我不明白的是,为什么相同的 dataframe 在加载到 pandas 和 RAPIDS cuDF 时,memory 的用法却截然不同。 有人可以解释吗? ...
[英]Merge output from cugraph over vertex_id with input data
如果我用 cugraph 创建一个图,然后从节点或社区计算 position,我会得到一个 dataframe 带有信息和顶点 ID。 所以我有三个问题: 顶点 id 是如何创建的? 有没有办法将顶点 id 上的 output 数据与输入数据合并? 是否可以将 networkx 中的信息直接存储在图 ...
[英]Installing the cuda rapids + xgboost stack through conda
我正在尝试通过 conda 在 AWS Sagemaker Studio 实例内的 jupyter 笔记本中安装带有 CUDA 的RAPIDS堆栈: 它试图解决依赖项中的尽可能多的冲突(大约 20 分钟后),然后它说: 但是当我尝试运行import xgboost时,我得到了一个ModuleNotF ...
[英]CUDF not reading columns properly
我正在尝试使用 cudf 阅读 csv。 它工作得很好,但是当我尝试获取列的内容时,cudf 似乎根本无法识别它们。 这是一个非常奇怪的行为: 这是代码: 这是错误: 请问有什么帮助吗? 谢谢 ...
[英]RAPIDS, CUML on google colab
我正在 google colab pro 上安装 RAPIDS,但这需要很长时间,最后 2 次安装花费了一个多小时,而不是安装过程中所说的大约 15 分钟“开始在 Colab 上安装 RAPIDS。这将需要大约 15 分钟”。 有没有办法加快这个过程? 我只想使用 cuML 库,我不关心正在安装它 ...
[英]Install RAPIDS on WSL2 Ubuntu 20.04 distribution in Windows 11
我按照此处提供的更新说明在 WSL2 Windows 11 上安装 RAPIDS。如说明中所述,我尚未在 Z3D945423F8E9496C429A5D8C65B4604 分发版上安装 CUDA。 我从官网复制了以下命令: 我认为即使我当前的 CUDA 版本是 11.7,需要 CUDA 11.5 ...
[英]Dask-cuDF to CuDF dataframe conversion
是否有任何 function 将 Dask-cudf dataframe 转换为 Cudf dataframe? dgdf = dask_cudf.from_cudf(df, npartitions=2) ...
[英]Spark RAPIDS does not load (unsupported file format error for CSV and no error for parquet )
我正在使用带有 2xNVidia A100 GPU 的 Ubuntu 20.04.4 服务器。 Spark (3.3.0) 工作正常,但是当我尝试通过 RAPIDS 使用 GPU 时,它只是一直在等待而不加载数据。 我尝试将数据加载为 CSV 和镶木地板文件,但失败了。 我调用 GPU 的当前方 ...
[英]how to use rapids in colab easily
当我在 colaboratory 中使用 rapids (cudf) 时,我执行如下命令。但是这个命令通常需要大约 20 分钟,所以我每次使用 cudf 都必须等待。 https://colab.research.google.com/drive/1rY7Ln6rEE1pOlfSHCYOVaqt ...
[英]How to groupby with custom function in python cuDF?
我不熟悉使用 GPU 进行数据操作,并且一直在努力复制 cuDF 中的一些功能。 例如,我想为数据集中的每个组获取一个模式值。 在 Pandas 中,使用自定义函数很容易完成:df = pd.DataFrame({'group': [1, 2, 2, 1, 3, 1, 2], ...
[英]scala rapids using an opaque UDF for a single column dataframe that produces another column
我正在尝试使用带有 Scala 的 Spark (3.3) 来熟悉基于RAPIDS Accelerator的计算。 能够使用 GPU 的主要争论似乎源于 UDF 的黑盒特性。 自动解决方案是Scala UDF 编译器。 但它不适用于存在循环的情况。 怀疑:如果我的 dataframe 只有一列并产生 ...
[英]cuML Random Forest- Segmentation fault (core dumped) when I save the trained model
我试图在训练后保存我的 Rf 模型,但出现“分段错误(核心转储)”。 我曾尝试在训练前保存它,它不会给我带来任何泡菜问题。 我尝试过其他cuML算法,它让我在训练后保存它们。 此行抛出以下错误: pickle.dump(model, output) #This saving does not w ...
[英]Running out of memory in Dask cuDF
最近一段时间,我一直试图在我最近的项目中解决 dask_cudf 中的 memory 管理问题,但似乎我遗漏了一些东西,我需要你的帮助。 我正在研究带有 15 GiB memory 的 Tesla T4 GPU。 我有几个 ETL 步骤,但 GPU 最近似乎在大多数步骤上都失败了(其中大多数只是过滤 ...
[英]Rapids.ai / difference of computation with log between Pandas and cudf
这是我比较 cudf 和 pandas 性能的代码: 如何在两个计算之间保持一致性? ...