我的目标是探索具有 10,000 到 10M+ 记录的表格数据的 GPU 加速。我最熟悉 Pandas,所以 cuDF 似乎是一个不错的起点。
我发现混合结果:cuDF 是否会在我的系统上运行(Windows 7 Pro 64 位、i7-6820HQ、32GB RAM、NVidia Quadro M2000M 4GB)。还有一个板载显卡。
根据 gitHub 页面(https://github.com/rapidsai/cudf):
CUDA/GPU 要求
- CUDA 10.0+(是的 - 我有 v10.1.120)
- NVIDIA 驱动程序 410.48+(是的 - 我有 432.06)
- Pascal 架构或更好的架构 (NO - Maxwell)
我听说 Pascal 架构是首选/最佳而不是要求,但也许那是针对旧版本的 cuDF?就在今天早上,我听说它将在 Win 64 上运行,尽管性能优势也可能会降低。尽管如此,我有兴趣试一试。
当我使用我的 CUDA 版本推荐的命令从 conda 提示符(python 3.6 env)安装时:
conda install -c rapidsai -c nvidia -c numba -c conda-forge cudf=0.13 python=3.6 cudatoolkit=10.1
我得到:
收集包元数据(repodata.json):完成求解环境:初始冻结求解失败。使用灵活的求解重试。
PackagesNotFoundError:当前频道不提供以下软件包:
- cudf=0.13
当前频道:
- https://conda.anaconda.org/rapidsai/win-64
- https://conda.anaconda.org/rapidsai/noarch
- https://conda.anaconda.org/nvidia/win-64
- https://conda.anaconda.org/nvidia/noarch
- https://conda.anaconda.org/numba/win-64
- https://conda.anaconda.org/numba/noarch
- https://conda.anaconda.org/conda-forge/win
- https://conda.anaconda.org/conda-forge/noa
- https://repo.anaconda.com/pkgs/main/win-64
- https://repo.anaconda.com/pkgs/main/noarch
- https://repo.anaconda.com/pkgs/r/win-64
- https://repo.anaconda.com/pkgs/r/noarch
- https://repo.anaconda.com/pkgs/msys2/win-6
- https://repo.anaconda.com/pkgs/msys2/noarc
要搜索可能提供您正在寻找的 conda 包的替代频道,请导航至
https://anaconda.org
并使用页面顶部的搜索栏。
当我访问 anaconda.org 并搜索 cuDF(或 RAPIDS)时,我发现的只是 Linux 安装。
我今天早些时候参加了 Anaconda 赞助的网络研讨会,演讲者说它将在 Win-64 中运行,尽管这篇较旧的帖子建议我可能需要从源代码构建:
我还没准备好尝试从源代码构建。我只是在浪费时间吗?感谢建议(用于使用我的系统或替代软件包解决 cuDF)。