超算小站 超算小站
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
  • 注册账号

  • 登录系统

  • 熟悉系统

  • 配置环境

  • 数据管理

  • 作业管理

    • slurm

      • 简介
      • sinfo
      • srun
      • sbatch
      • squeue
      • scancel
        • scancel 命令
      • salloc
      • scontrol
      • sacct
    • scripts

  • 技术支持
  • 用户手册
  • 作业管理
  • slurm
mrzhenggang
2020-11-02
目录

scancel

# scancel 命令

如果提交作业后,如果正常结束,那么在slurm-jobid.out文件中并不会有任务的报错信息。

如果任务已经提交,想将它取消,可以使用 scancel 命令,在天河系统上对应的命令为 yhcancel。

本文以 yhcancel 命令为例进行介绍。

步骤如下:

1)确定任务编号

我们用yhq命令查看任务编号,比如为

$ yhq
JOBID    PARTITION  NAME     USER       ST  TIME      NODES NODELIST(REASON)
1454916  debug      sub.sh   zhenggang  R   00:15:00  2     cn[5-6]
1
2
3

2)取消任务

$ yhcancel 1454916
1

长期CG

  • 用户作业如果长时间为 CG 状态,表示作业没有正常退出,系统管理员会定期扫描 CG 作业并处理,请用户耐心等待;用户作业如果变成 S 状态,表示系统管理员在维护系统,维护完成后会将用户作业恢复,对用户作业不会造成影响。
squeue
salloc

← squeue salloc→

Theme by Vdoing | Copyright © 2015-2024 Zheng Gang | MIT License | 津ICP备2021008634号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×