Mudanças entre as edições de "Cluster"
De Instituto de Física - UFRGS
Linha 18: | Linha 18: | ||
qsig -s0 <job> | qsig -s0 <job> | ||
+ | |||
+ | Para listar os jobs presos (minuano e ada): | ||
+ | |||
+ | diagnose -q | ||
+ | |||
+ | Para matar um job que saiu da lista do torque: | ||
+ | |||
+ | qterm -t quick -> baixa o servidor | ||
+ | /var/spool/torque/server_priv/jobs -> diretório onde estão os jobs | ||
+ | pbs_server -t hot -> coloca o servidor no ar novamente. |
Edição das 15h41min de 25 de julho de 2011
Lista todos os nodos e seus estados:
pbsnodes
Lista quem está 'down':
pbsnodes -l
Coloca um nodo que está offline online.
pbcnodes -c <nodo>
Para saber o que está rodando e os estados dos jobs:
qstat -a
Para mandar um sinal para o job (tipo um ping):
qsig -s0 <job>
Para listar os jobs presos (minuano e ada):
diagnose -q
Para matar um job que saiu da lista do torque:
qterm -t quick -> baixa o servidor /var/spool/torque/server_priv/jobs -> diretório onde estão os jobs pbs_server -t hot -> coloca o servidor no ar novamente.