超算小站 超算小站
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
首页
  • 注册账号
  • 登录系统
  • 熟悉系统
  • 配置环境
  • 数据管理
  • 作业管理
  • 集群软件环境:

    • 01.编译环境
    • 02.基础库
    • 03.应用软件
    • 04.工具软件
    • 05.常用语言环境
    • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
HPC&AI
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
资料下载
归档
关于我
🚀试用
  • 登陆问题

  • 编译问题

  • 作业问题

  • 存储和数据问题

    • 存储和数据问题汇总
      • 1 ls 卡了
      • 2 Disk quota exceeded
      • 3 Input/output error
      • 4 No space left on device
      • 5 Encountered 1 error during the transfer
      • 6 数据如何传输?速度有多快?
      • 7 数据传输时报错
    • 关于存储配额的说明
    • 天河系统数据拷贝系统用户使用流程
  • GPU问题

  • 常见问题
  • 存储和数据问题
mrzhenggang
2017-10-20
目录

存储和数据问题汇总

# 存储问题汇总

# 1 ls 卡了

问题:我使用 ls 命令查看目录下的文件,可是一直停留下那里,没有显示

解答: 遇到这个问题,您可以等待一会,再重新使用 ls 命令查看目录文件。

  • 原因之一:可能是登录节点负载比较重,造成使用终端命令受到影响
  • 原因之二:可能是用户客户端的网络负载比较重,出现比较严重的网络延迟
  • 原因之三:可能是存储正在进行恢复调整。

# 2 Disk quota exceeded

问题:执行文件操作时提示:Disk quota exceeded

解答:原因为用户的磁盘配额已超限,天河系统针对用户的数据量和文件数量分别设有上限,可通过 lfs quota 命令查看具体信息;可通过删除临时数据来降低数据量和文件数量。命令行下输入 lfs quota -g 用户组名 /存储文件系统名 ,用于查看所在用户组的配额权限;命令行下输入 lfs quota -u 用户名 /存储文件系统名 ,用于查看所在用户的配额权限。

# 3 Input/output error

问题:作业运行提示forrtl: Input/output error

解答:可能是存储某一时刻压力较大,造成 IO 错误,请您重新提交作业。

# 4 No space left on device

问题:作业运行时报错:forrtl: No space left on device,forrtl: severe (38): error during write, unit 12,但是同样的作业再次提交时可能就正常运行完成

解答:该问题主要由文件系统中某一 OST 存储已满导致,请联系与您对接的工程师或系统管理员。Lustre 文件系统由若干 IO 服务器(Object Storage Services)和 Object Storage Targets(OST)组成。当对一个文件进行读写操作时,为了提高 IO 效率,文件系统会自动将该文件的读写操作分割成多个,在多个 OST 上并发实现,该过程也被称为 file striping。如果在该过程中,使用到的某一 OST 出现问题,就会发生读写错误。

# 5 Encountered 1 error during the transfer

问题:上传数据提示 Encountered 1 error during the transfer

解答:使用客户端传输软件如 Winscp 由本地上传数据至天河系统时,提示 Encountered 1 error during the transfer, 如果本地待传输的文件名称或所在路径含有空格或括号,在点击传输操作时就会出现上面的错误。将特殊字符替换为常规字符即可解决问题。

# 6 数据如何传输?速度有多快?

问题:数据如何传输?速度有多快?

解答:

  1. 用户可以通过 Winscp 等工具进行数据的上传和下载,速度与您办理的网络有关。通常可以达到 几百KB-几MB/s 。
  2. 如果数据量比较大,可以通过寄送硬盘的方式,由中心系统部提供免费的数据拷贝服务,再通过快递邮寄回去。

# 7 数据传输时报错

问题:数据传输时报错:Failed to open a secure file transfer session

解答:目前对用户开放的登陆节点有 LN1、LN2、LN3、LN8 和 LN9。其中,LN1、LN2 和 LN8 作为用户的登陆节点,LN3 和 LN9 作为用户的数据传输节点。请登录数据传输节点来进行数据传输。

如何设置环境变量
关于存储配额的说明

← 如何设置环境变量 关于存储配额的说明→

Theme by Vdoing | Copyright © 2015-2024 Zheng Gang | MIT License | 津ICP备2021008634号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×