存储和数据问题汇总
# 存储问题汇总
# 1 ls
卡了
问题:我使用 ls 命令查看目录下的文件,可是一直停留下那里,没有显示
解答: 遇到这个问题,您可以等待一会,再重新使用 ls 命令查看目录文件。
- 原因之一:可能是登录节点负载比较重,造成使用终端命令受到影响
- 原因之二:可能是用户客户端的网络负载比较重,出现比较严重的网络延迟
- 原因之三:可能是存储正在进行恢复调整。
# 2 Disk quota exceeded
问题:执行文件操作时提示:Disk quota exceeded
解答:原因为用户的磁盘配额已超限,天河系统针对用户的数据量和文件数量分别设有上限,可通过 lfs quota 命令查看具体信息;可通过删除临时数据来降低数据量和文件数量。命令行下输入 lfs quota -g 用户组名 /存储文件系统名
,用于查看所在用户组的配额权限;命令行下输入 lfs quota -u 用户名 /存储文件系统名
,用于查看所在用户的配额权限。
# 3 Input/output error
问题:作业运行提示forrtl: Input/output error
解答:可能是存储某一时刻压力较大,造成 IO 错误,请您重新提交作业。
# 4 No space left on device
问题:作业运行时报错:forrtl: No space left on device,forrtl: severe (38): error during write, unit 12,但是同样的作业再次提交时可能就正常运行完成
解答:该问题主要由文件系统中某一 OST 存储已满导致,请联系与您对接的工程师或系统管理员。Lustre 文件系统由若干 IO 服务器(Object Storage Services)和 Object Storage Targets(OST)组成。当对一个文件进行读写操作时,为了提高 IO 效率,文件系统会自动将该文件的读写操作分割成多个,在多个 OST 上并发实现,该过程也被称为 file striping。如果在该过程中,使用到的某一 OST 出现问题,就会发生读写错误。
# 5 Encountered 1 error during the transfer
问题:上传数据提示 Encountered 1 error during the transfer
解答:使用客户端传输软件如 Winscp 由本地上传数据至天河系统时,提示 Encountered 1 error during the transfer
, 如果本地待传输的文件名称或所在路径含有空格或括号,在点击传输操作时就会出现上面的错误。将特殊字符替换为常规字符即可解决问题。
# 6 数据如何传输?速度有多快?
问题:数据如何传输?速度有多快?
解答:
- 用户可以通过 Winscp 等工具进行数据的上传和下载,速度与您办理的网络有关。通常可以达到
几百KB-几MB/s
。 - 如果数据量比较大,可以通过寄送硬盘的方式,由中心系统部提供免费的数据拷贝服务,再通过快递邮寄回去。
# 7 数据传输时报错
问题:数据传输时报错:Failed to open a secure file transfer session
解答:目前对用户开放的登陆节点有 LN1、LN2、LN3、LN8 和 LN9。其中,LN1、LN2 和 LN8 作为用户的登陆节点,LN3 和 LN9 作为用户的数据传输节点。请登录数据传输节点来进行数据传输。