超算小站 超算小站
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
  • 登陆问题

  • 编译问题

  • 作业问题

  • 存储和数据问题

  • GPU问题

    • GPU问题汇总
      • 1 no CUDA-capable device is detected
  • 常见问题
  • GPU问题
mrzhenggang
2017-10-20
目录

GPU问题汇总

# GPU问题

# 1 no CUDA-capable device is detected

问题:使用 CUDA toolkit 编译程序后,在 gpu_test 分区提交作业,运行时提示错误:no CUDA-capable device is detected

解答:可能原因有二种情况:

1.可能是分配到的该计算节点上用于连接CPU 与 GPU 的 PCIe 总线松动,导致无法找到 device。解决方法:在提交作业是可使用 -x 选项屏蔽该节点;

2.可能是编译时使用的 CUDA toolkit 和计算节点上安装的 CUDA driver 版本不一致导致,gpu_test 分区的计算节点上的 CUDA driver 版本是与 CUDA 7.5 的 toolkit 对应的。解决方法:使用 CUDA 7.5 或 CUDA 5.0 的 toolkit 编译程序。另外,如果同时设置了多个版本的 CUDA 环境,也会导致该问题出现,解决方法:清除所有有关 CUDA 的环境变量设置,然后重新加载一个版本的 CUDA 环境。

天河系统数据拷贝系统用户使用流程

← 天河系统数据拷贝系统用户使用流程

Theme by Vdoing | Copyright © 2015-2024 Zheng Gang | MIT License | 津ICP备2021008634号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×