slurm手册
申请gpu分区的5G内存资源并打开bash
srun --partition=gpu --mem=5G --pty bash
编写任务脚本submit.sh
#!/bin/bash
#
#SBATCH --job-name=eit
#SBATCH --output=log.txt
#
#SBATCH --ntasks=1
#SBATCH --time=30:00
#SBATCH --partition=gpu
#SBATCH --mem=15G
#SBATCH --mem-per-gpu=10G
#SBATCH --gres=gpu:1
module load gcc/8.1.0
module load cmake/3.13.4
module load python/3.7.1
export C_INCLUDE_PATH=/usr/local/cuda-10.0/include
export CPLUS_INCLUDE_PATH=/usr/local/cuda-10.0/include
export LIBRARY_PATH=/usr/local/cuda-10.0/lib64
cd EIT/EIT_train/
srun python train.py
提交任务
sbatch submit.sh
查看我的任务
squeue --user=$MY_NAME
取消我的任务
scancel -v $JOB_ID
查看任务详细信息
scontrol show job $JOB_ID
为了防止任务的标准输出流长期不刷新,可以使用以下命令
stdbuf -o0 -e0 command
print("hello",flush=True)
评论已关闭