Cluster

De Instituto de Física - UFRGS
Edição feita às 14h20min de 5 de janeiro de 2017 por Samoel (Discussão | contribs)

Submeter jobs

Para rodar, criar um arquivo (script.sh) com o seguinte conteúdo.

 #!/bin/bash 
 #SBATCH -n 1 # Number of cores 
 #SBATCH -N 1 # Number of nodes 
 #SBATCH -t 0-00:05 # Runtime in D-HH:MM 
 #SBATCH -p long # Partition to submit to 
 #SBATCH --qos qos_long # QOS 
 
 ./a.out

As partições possuem um qos associado, com o mesmo nome, adicionando "qos_" a frente do nome:

partição: short -> qos: qos_short -> limite de 2 semanas

partição: long -> qos: qos_long -> limite de 3 meses


Caso deseje rodar em gpu, é necessário especificar a fila e pedir explicitamente a gereric resource gpu:

 #!/bin/bash 
 #SBATCH -n 1 # Number of cores
 #SBATCH -N 1 # Number of nodes 
 #SBATCH -t 0-00:05 # Runtime in D-HH:MM 
 #SBATCH -p gpu # Partition to submit to 
 #SBATCH --qos qos_gpu # QOS
 #SBATCH --gres=gpu:1
 
 ./a.out

Para pedir alguma gpu específica, use um constraint adicionando a linha:

 #SBATCH --constraint="gtx970"


Para submeter o job, execute o comando

 sbatch script.sh

Comandos úteis

  • Para listar os jobs:
 squeue
  • Para deletar um job:
 scancel
  • Para listar as partições disponíveis:
 sinfo
  • Para listar as gpus presentes nos nós:
 sinfo -o "%N %f"