Mudanças entre as edições de "Cluster"

De Instituto de Física - UFRGS
Linha 18: Linha 18:
  
 
  qsig -s0 <job>
 
  qsig -s0 <job>
 +
 +
Para listar os jobs presos (minuano e ada):
 +
 +
diagnose -q
 +
 +
Para matar um job que saiu da lista do torque:
 +
 +
qterm -t quick -> baixa o servidor
 +
/var/spool/torque/server_priv/jobs -> diretório onde estão os jobs
 +
pbs_server -t hot -> coloca o servidor no ar novamente.

Edição das 15h41min de 25 de julho de 2011

Lista todos os nodos e seus estados:

pbsnodes 

Lista quem está 'down':

pbsnodes -l

Coloca um nodo que está offline online.

pbcnodes -c <nodo>

Para saber o que está rodando e os estados dos jobs:

qstat -a

Para mandar um sinal para o job (tipo um ping):

qsig -s0 <job>

Para listar os jobs presos (minuano e ada):

diagnose -q

Para matar um job que saiu da lista do torque:

qterm -t quick -> baixa o servidor
/var/spool/torque/server_priv/jobs -> diretório onde estão os jobs
pbs_server -t hot -> coloca o servidor no ar novamente.