Mudanças entre as edições de "Cluster"

De Instituto de Física - UFRGS
Linha 6: Linha 6:
 
   #SBATCH -N 1 # Number of nodes  
 
   #SBATCH -N 1 # Number of nodes  
 
   #SBATCH -t 0-00:05 # Runtime in D-HH:MM  
 
   #SBATCH -t 0-00:05 # Runtime in D-HH:MM  
   #SBATCH -p short # Partition to submit to  
+
   #SBATCH -p long # Partition to submit to  
   #SBATCH --qos qos_short # QOS  
+
   #SBATCH --qos qos_long # QOS  
 
    
 
    
 
   ./a.out
 
   ./a.out

Edição das 14h20min de 5 de janeiro de 2017

Submeter jobs

Para rodar, criar um arquivo (script.sh) com o seguinte conteúdo.

 #!/bin/bash 
 #SBATCH -n 1 # Number of cores 
 #SBATCH -N 1 # Number of nodes 
 #SBATCH -t 0-00:05 # Runtime in D-HH:MM 
 #SBATCH -p long # Partition to submit to 
 #SBATCH --qos qos_long # QOS 
 
 ./a.out

As partições possuem um qos associado, com o mesmo nome, adicionando "qos_" a frente do nome:

partição: short -> qos: qos_short -> limite de 2 semanas

partição: long -> qos: qos_long -> limite de 3 meses


Caso deseje rodar em gpu, é necessário especificar a fila e pedir explicitamente a gereric resource gpu:

 #!/bin/bash 
 #SBATCH -n 1 # Number of cores
 #SBATCH -N 1 # Number of nodes 
 #SBATCH -t 0-00:05 # Runtime in D-HH:MM 
 #SBATCH -p gpu # Partition to submit to 
 #SBATCH --qos qos_gpu # QOS
 #SBATCH --gres=gpu:1
 
 ./a.out

Para pedir alguma gpu específica, use um constraint adicionando a linha:

 #SBATCH --constraint="gtx970"


Para submeter o job, execute o comando

 sbatch script.sh

Comandos úteis

  • Para listar os jobs:
 squeue
  • Para deletar um job:
 scancel
  • Para listar as partições disponíveis:
 sinfo
  • Para listar as gpus presentes nos nós:
 sinfo -o "%N %f"