Erro de Timeout

25 views
Skip to first unread message

Diego

unread,
Nov 18, 2024, 1:52:44 PM11/18/24
to bacula-ba...@googlegroups.com
Olá , boa tarde!
Estou usando o bacula 15.0.2 e estou tendo um probleminha de timeout. 

Uso o Ubuntu Server 20.04.3 onde roda o DIR, SD e Mysql. Meu FD está na mesma rede. Não sei se esse seria o problema, mas o arquivo que estou tentando realizar o backup tem aproximadamente 500GB. 
Ele inicia bem o backup, mas chega por volta de 30 minutos ele dá erro de time out. Já deixei um ping estendido para ver se tem alguma instabilidade na rede, mas nada é detectado. 
Alguém já passou por isso, e posso me orientar? 


--
Diego Domingues Santos

Pedro Paulo de Alencar Severo

unread,
Nov 21, 2024, 9:32:50 AM11/21/24
to Bacula Backup-Pt-Br
Bom dia!

Qual a versão do client? O que aparece no log do job no Director? Podes enviar o conteúdo do Raw Job  Log se usar uma interface web como Bacularis ou Bacullum. Se não tiver GUI, envia o trecho do log /opt/bacula/working/log  do job que deu erro.

Uma suspeita é que haja alguma lentidão no servidor Bacula para processar as requisições. Se tiver com load average alto, i/o wait, lentidão de disco,... pode ser que cause o problema. Um monitoramento SNMP no servidor seria interessante, aí você tem o estado dele no momento da falha. Se você não tiver esse monitoramento, pode usar o Netdata para fazê-lo, pois é 0800 e de fácil instalação.

Além do ping para confirmar se há problemas de rede, você também pode fazer um teste direto na porta do SD no servidor. Assumindo que o client FD também seja linux:

echo 2>/dev/null > /dev/tcp/[IP_SERVER]/9103

Troca [IP_SERVER] pelo IP do seu servidor. Pode fazer um loop para deixar coletando esse dado no momento que o job estiver rodando:

n=1;while true; do echo 2>/dev/null > /dev/tcp/192.168.50.24/9104; cod=$?; if [ $cod -eq 0 ]; then resp="OK"; else resp='Erro!'; fi; echo "$n: $resp ($cod)" | tee -a /tmp/test.log; let n++; sleep 1; done

O comando acima vai imprimir na tela e armazenar a saída o resultado do teste. Exemplo:

1: OK (0)
2: OK (0)
3: OK (0)

E em caso de falha:

1: Erro! (1)
2: Erro! (1)
3: Erro! (1)

Pedro Paulo de Alencar Severo

unread,
Nov 21, 2024, 9:33:43 AM11/21/24
to Bacula Backup-Pt-Br
Tem outra coisa: é possível que haja duplicidade de IP nessa rede? Tanto do client quando do server.
Reply all
Reply to author
Forward
0 new messages