申请gpu分区的5G内存资源并打开bash

srun --partition=gpu --mem=5G --pty bash

编写任务脚本submit.sh

#!/bin/bash
#
#SBATCH --job-name=eit
#SBATCH --output=log.txt
#
#SBATCH --ntasks=1
#SBATCH --time=30:00
#SBATCH --partition=gpu
#SBATCH --mem=15G
#SBATCH --mem-per-gpu=10G
#SBATCH --gres=gpu:1
module load gcc/8.1.0
module load cmake/3.13.4
module load python/3.7.1
export C_INCLUDE_PATH=/usr/local/cuda-10.0/include
export CPLUS_INCLUDE_PATH=/usr/local/cuda-10.0/include
export LIBRARY_PATH=/usr/local/cuda-10.0/lib64
cd EIT/EIT_train/
srun python train.py

提交任务

sbatch submit.sh

查看我的任务

squeue --user=$MY_NAME

取消我的任务

scancel -v $JOB_ID

查看任务详细信息

scontrol show job $JOB_ID

为了防止任务的标准输出流长期不刷新,可以使用以下命令

stdbuf -o0 -e0 command
print("hello",flush=True)

标签: none

评论已关闭