超算小站 超算小站
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
  • 注册账号

  • 登录系统

  • 熟悉系统

  • 配置环境

  • 数据管理

  • 作业管理

    • slurm

      • 简介
      • sinfo
        • sinfo 命令
      • srun
      • sbatch
      • squeue
      • scancel
      • salloc
      • scontrol
      • sacct
    • scripts

  • 技术支持
  • 用户手册
  • 作业管理
  • slurm
mrzhenggang
2024-06-17
目录

sinfo

# sinfo 命令

使用超算中心计算的资源进行作业提交,第一步就是查看账号下有哪些可用的计算资源。

查看可用计算节点信息的命令是 sinfo,它可以查看当前系统中所有计算节点的状态。天河slurm的对应命令为 yhinfo 或 yhi。

$ yhi
PARTITION AVAIL  TIMELIMIT   NODES  STATE  NODELIST
debug        up      30:00     100  drain  cn[1-100]
debug        up      30:00     100  alloc  cn[101-200]
debug        up      30:00     100  idle   cn[200-300]
1
2
3
4
5

上面的代码中,行首为$符的行是用户输入的命令,其他行为显示的结果,同下。

说明:

关键词 含义 备注
PARTITION 分区名 -p 分区名来指定分区
AVAIL 可用状态 up 可用
down 不可用
TIMELIMIT 该分区的作业最大运行时长限制 30:00 表示30分钟
2-00:00:00表示2天
infinite表示不限时间
NODES 节点的数量 -N 数字 来指定节点数量
STATE 节点的状态 drain: 排空状态,表示该类结点不再分配到其他
idle: 空闲状态
alloc: 被分配状态

通过查看系统可用资源情况,我们就知道了要将计算任务提交到那里了,比如例子中的 debug 计算分区。

简介
srun

← 简介 srun→

Theme by Vdoing | Copyright © 2015-2024 Zheng Gang | MIT License | 津ICP备2021008634号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×