Bom dia!
Qual a versão do client? O que aparece no log do job no Director? Podes enviar o conteúdo do
Raw Job Log se usar uma interface web como
Bacularis ou
Bacullum. Se não tiver GUI, envia o trecho do log
/opt/bacula/working/log do job que deu erro.
Uma suspeita é que haja alguma lentidão no servidor Bacula para processar as requisições. Se tiver com load average alto, i/o wait, lentidão de disco,... pode ser que cause o problema. Um monitoramento SNMP no servidor seria interessante, aí você tem o estado dele no momento da falha. Se você não tiver esse monitoramento, pode usar o
Netdata para fazê-lo, pois é 0800 e de fácil instalação.
Além do ping para confirmar se há problemas de rede, você também pode fazer um teste direto na porta do SD no servidor. Assumindo que o client FD também seja linux:
echo 2>/dev/null > /dev/tcp/[IP_SERVER]/9103
Troca [IP_SERVER] pelo IP do seu servidor. Pode fazer um loop para deixar coletando esse dado no momento que o job estiver rodando:
n=1;while true; do echo 2>/dev/null > /dev/tcp/192.168.50.24/9104; cod=$?; if [ $cod -eq 0 ]; then resp="OK"; else resp='Erro!'; fi; echo "$n: $resp ($cod)" | tee -a /tmp/test.log; let n++; sleep 1; done
O comando acima vai imprimir na tela e armazenar a saída o resultado do teste. Exemplo:
1: OK (0)
2: OK (0)
3: OK (0)
E em caso de falha:
1: Erro! (1)
2: Erro! (1)
3: Erro! (1)