-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256
On Fri, Apr 30, 2010 at 10:16:16AM -0300, Rudá Porto Filgueiras wrote:
[...]
> - atualização do servidor "real" do Ubuntu 8.04.3 para 8.04.4, isso também
> atualizou o kernel
> - verificação do menu.lst e reinicialização do servidor para verificar se a
> atualização funcionou adequadamente, utilizando o novo kernel e proveitando
> que temos o KVM IP por 24 horas
> - atualização dos pacotes das máquinas virtuais que rodam Debian Lenny
> (apenas a máquina djangobrasil estáva 100% atualizada)
Um viva para o unattended-upgrades[1]. :)
[1].
http://packages.debian.org/unattended-upgrades
[...]
> Conclusão:
>
> Felizmente o problema não estava relacionado a falhas de disco ou outros
> tipos de problemas de integridade de dados.
>
> O servidor estava estável já com mais de 200 dias em funcionamento sem
> paradas, e acredito que deve vai continuar assim, e com desempenho melhor
> devido ao upgrade de memoria.
>
> Porem, esse incidente evidencia que é preciso ter mais de uma pessoa no
> suporte do servidor com condições de acionar o suporte e tomar providências
> na resolução dos problemas, pois idependentemente da causa do problema, o
> tempo para solucioná-lo foi devido a algumas causas:
>
> - o provedor não informou falha de boot após o upgrade de memória
> - eu falhei em não verificar o servidor no dia 28 pela manhã
> - eu não li meus email no dia 28 na parte da tarde e noite
> - apenas o Arthur identificou o problema, mas avisou por email, talvez uma
> ligação por telefone nesse caso ajudaria
> - eu não tive disponibilidade imediata para verificar o problema assim que
> li o email do Arthur
>
> Quem de vocês teria disponibilidade para essa tarefa de auxiliar no suporte
> do servidor?
Eu posso ajudar. :)
Como todos, a minha disponibilidade de tempo não é infinita, porém
acho que juntando o pouco tempo de vários, nós conseguimos fechar uma
janela de tempo razoavelmente grande que ajude a resolver os problemas
de forma mais rápida.
> Além disso, é interessante que os telefones dos responsaveis sejam passados
> para alguns outros membros que auxiliem também na notificação de quaisquer
> problemas e se for algo como indisponibilidade total, que possam entrar em
> contato por telefone (até mesmo SMS) imediatamente.
>
> Uma melhoria interessante seria ter um serviço de monitoramento em outro
> local (gratuito ou cedido por algum membro da comunidade) que envie emails
> de alerta em caso de falha do servidor ou até mesmo SMS.
Acho que isso seria interessante, principalmente a questão do
monitoramento dos serviços.
iQIcBAEBCAAGBQJL2vTMAAoJEOW5JtQn2BCEyF0P/2r/HglE5JSjVMc7ijpzy4c5
SZ6lkNkkAdSNrefIpVor2xfHmSzirgkB7g2X6vUmm6BZJaGYcJE/abMxKVmDT3GK
f6umC0Q3OFJ2WWlLlv2RLTjwTs+/tG8YdaxRTeXdVgBO2ltWbWQbfHm3iIsGdrow
FFiX25JAzfVN68n2to7Hk2mj9mDbN9GXt/WjA/QEAF5nRnRaQkx+g7ikZixKJDQ8
aMureRfU/iy4sQjy8eH7Xmbw1XD6dA7XzIz35BHlltucG1CVh+qBlA0GfCq9MQli
lbqxRuKar/Upc5irWdnrPHbNfWKpvYPBpn76eUKiF8LzS28xxPw1k7tfvxBjk5TQ
7umZH447RvX1tPDm68F3uwFtJu0y14NAk28ANteeuwwWs77EIQSPi0CM26A6Jgcg
hgY8WL/Lryr8t4wzviK4hicBi3t4MhUeHNeArzg3WZSBrtughxuIc6gbbNhlYG6n
QaMPzHvROPzwt4CushMPpNWHV6s32AGFfAr6tTYGiZ2Fc9jvFgX2pXJIlTH+NPkZ
Ew9Sxe9ZgZV0M/LuyzUYxylSqNpfPOoOYsxA3Dw84CpnOD2EVVQf8HpW/0BLvGCY
aCPqkYSDVBsxqHxcSrrkM+R14rQC3A1khQv/6SCV3FxU1hSAGqqgwsXTs55VVx6D
7llsWLnMX2ml/yQX0ImE
=Rqm6
-----END PGP SIGNATURE-----