Mudanças entre as edições de "Cluster"

De Instituto de Física - UFRGS
Linha 1: Linha 1:
Lista todos os nodos e seus estados:
+
== Submeter jobs ==
 +
Para rodar, criar um arquivo (script.sh) com o seguinte conteúdo.
  
pbsnodes
+
  teste
  
Lista quem está 'down':
+
sbatch script.sh
 
+
pbsnodes -l
+
 
+
Coloca um nodo que está offline online.
+
 
+
pbcnodes -c <nodo>
+
 
+
Para saber o que está rodando e os estados dos jobs:
+
 
+
qstat -a
+
 
+
Para mandar um sinal para o job (tipo um ping):
+
 
+
qsig -s0 <job>
+
 
+
Para listar os jobs presos (minuano e ada):
+
 
+
diagnose -q
+
 
+
Para matar um job que saiu da lista do torque:
+
 
+
qterm -t quick -> baixa o servidor
+
/var/spool/torque/server_priv/jobs -> diretório onde estão os jobs
+
pbs_server -t hot -> coloca o servidor no ar novamente.
+

Edição das 12h59min de 15 de setembro de 2016

Submeter jobs

Para rodar, criar um arquivo (script.sh) com o seguinte conteúdo.

 teste

sbatch script.sh