[APyB-sites] Sites *.python.org.br fora do ar?

6 views
Skip to first unread message

Arthur Furlan

unread,
Apr 28, 2010, 9:35:41 PM4/28/10
to apyb-...@googlegroups.com
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

Não sei se é apenas comigo ou se estão fazendo alguma manutenção
nesse momento, mas aparemente os sites *.python.org.br estão fora do
ar. Tentei acessar (sem sucesso) os seguintes endereços:

* python.org.br
* wiki.python.org.br
* associacao.python.org.br


- --
Atenciosamente,

Arthur Furlan (afurlan)
afu...@afurlan.org
http://blog.afurlan.org
Public GPG KeyID: 27D81084

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (GNU/Linux)

iQIcBAEBCAAGBQJL2OJtAAoJEOW5JtQn2BCEtIgP/jjAO+tuFYB4ks/jet63qyB8
4fFtJgxhiGTcvHMU/WaQckoAc4+JdlreFkdkkyWgZf0lwKhni0S/gkf65WsrWHpu
hxIaAaM8l/KhU4ZDntbNDUfobY8qpht/IsE2fDhllftSaT+vAEs1Hfczt4fQWsSl
eICzde0f45/gmIPaGmf7wt6lk+CpAZMqspG/5ayvjEjXs40odmuNHWTEreazYCHb
0lEx+pGZx3cosYApK/gawooLeR2aWIEBvHDuEpu2PEV2Vsr60sW8HMx5NfCFRw8m
vA+i1h9uB8aGbFjBxX6kR/15VCGMd9wmgOU6esFULhATPOmpom8fmGU405fxI7Z2
O1qDC/1F/1W16YwjytcHSZFdJgHCi6yImj27nCQO4AGJPkBxp06n7ZN/bIhWWX5d
kiHazfnmes65YOg0w+K4YH1IdonHVRDHNokbcljnZBkek1KEP4UmoCW0qO2JOeeG
faXyvXLPFdUdgnlA0KBXfQBpbdzJ+3uz06lJu8bnfhYYRfzQqNOl2xKBmKS0Snwf
ZBmoUpSYfDiF910DGa4do+fWbCYD0UhjmfSdjzcz6YxByoDDC8z213IR7psCgmTL
IbVxhZyn2oMBURjTJWPFo41dN2Q9o5pHMOuwNsCKafLtY19mgKcMxXrnACiv+aYd
2rz3tlj1HyR/vHivcadT
=tmz3
-----END PGP SIGNATURE-----

--
You received this message because you are subscribed to the Google Groups "APyB: Sites" group.
To post to this group, send email to apyb-...@googlegroups.com.
To unsubscribe from this group, send email to apyb-sites+...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/apyb-sites?hl=en.

Osvaldo Santana

unread,
Apr 28, 2010, 11:22:50 PM4/28/10
to apyb-...@googlegroups.com
Ficou assim quase o dia inteiro.

Não seria interessante a gente lançar um chamado na lista pra achar
voluntários dispostos a ajudar o Rudá?

O gerenciamento dos sites ficou sob responsabilidade da APyB ou a
hospedagem também é responsável?

Obrigado,
Osvaldo
--
Osvaldo Santana Neto
Fone: 41-9244-1646
http://www.pythonologia.org

Dorneles Treméa

unread,
Apr 28, 2010, 11:32:12 PM4/28/10
to apyb-...@googlegroups.com
Rudá,

> Não sei se é apenas comigo ou se estão fazendo alguma manutenção
> nesse momento, mas aparemente os sites *.python.org.br estão fora do
> ar. Tentei acessar (sem sucesso) os seguintes endereços:
>
> * python.org.br
> * wiki.python.org.br
> * associacao.python.org.br

parece ser algo lá na iWeb... tens alguma informação?

--

Dorneles Treméa
X3ng Web Technology

Dorneles Treméa

unread,
Apr 29, 2010, 12:40:45 AM4/29/10
to apyb-...@googlegroups.com
Opa,

> parece ser algo lá na iWeb... tens alguma informação?

ainda não confirmado, mas talvez isso também esteja nos
afetando:

http://blog.iweb.com/en/2010/04/update-snw4-cable-repair-april-28-2010-1600

Rudá Porto Filgueiras

unread,
Apr 29, 2010, 11:46:52 AM4/29/10
to apyb-...@googlegroups.com
2010/4/29 Dorneles Treméa <dorn...@x3ng.com.br>

Opa,

> parece ser algo lá na iWeb... tens alguma informação?

ainda não confirmado, mas talvez isso também esteja nos
afetando:

http://blog.iweb.com/en/2010/04/update-snw4-cable-repair-april-28-2010-1600


Realmente parece que é isso, porém eu abri uma solicitação de suporte para verficar se o problema é esse mesmo.

Sds,
 

--

Dorneles Treméa
X3ng Web Technology


--
You received this message because you are subscribed to the Google Groups "APyB: Sites" group.
To post to this group, send email to apyb-...@googlegroups.com.
To unsubscribe from this group, send email to apyb-sites+...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/apyb-sites?hl=en.




--
Rudá Porto Filgueiras
http://python-blog.blogspot.com
http://twitter.com/rudaporto

Dorneles Treméa

unread,
Apr 29, 2010, 2:22:14 PM4/29/10
to apyb-...@googlegroups.com
Opa,

>> ainda não confirmado, mas talvez isso também esteja nos
>> afetando:
>>
>> http://blog.iweb.com/en/2010/04/update-snw4-cable-repair-april-28-2010-1600
>
> Realmente parece que é isso, porém eu abri uma solicitação de
> suporte para verficar se o problema é esse mesmo.

hum... pelo jeito não era... acabei de ver o retorno deles:

"""
We are not able to boot the server in any kernel, what we can do is
offer to reinstall the server on a new drive and plug the current
drive by USB to allow you recover your data. There will be 50$ fees for
the re-installation. If you like to troubleshoot the issue your self,
we can provide you with KVM access for 24 hours to allow you
investigate the server.
"""

Foi feita alguma atualização recente no servidor? Não bootar em
nenhum kernel geralmente é resultado disso... :-/

Rudá Porto Filgueiras

unread,
Apr 29, 2010, 3:01:41 PM4/29/10
to apyb-...@googlegroups.com


2010/4/29 Dorneles Treméa <dorn...@x3ng.com.br>

Opa,

>> ainda não confirmado, mas talvez isso também esteja nos
>> afetando:
>>
>> http://blog.iweb.com/en/2010/04/update-snw4-cable-repair-april-28-2010-1600
>
> Realmente parece que é isso, porém eu abri uma solicitação de
> suporte para verficar se o problema é esse mesmo.

hum... pelo jeito não era... acabei de ver o retorno deles:

"""
We are not able to boot the server in any kernel, what we can do is
offer to reinstall the server on a new drive  and plug the current
drive by USB to allow you recover your data. There will be 50$ fees for
the re-installation. If you like to troubleshoot the issue your self,
we can provide you with KVM access for 24 hours to allow you
investigate the server.
"""

Foi feita alguma atualização recente no servidor? Não bootar em
nenhum kernel geralmente é resultado disso... :-/

Não. Eu vou solicitar a instalação do KVM remoto para verificar agora.

Sds,
 

--

Dorneles Treméa
X3ng Web Technology


--
You received this message because you are subscribed to the Google Groups "APyB: Sites" group.
To post to this group, send email to apyb-...@googlegroups.com.
To unsubscribe from this group, send email to apyb-sites+...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/apyb-sites?hl=en.

Rudá Porto Filgueiras

unread,
Apr 30, 2010, 9:16:16 AM4/30/10
to apyb-...@googlegroups.com
Segue abaixo o histórico, detalhes do problema, solução e conclusão.


On Thu, Apr 29, 2010 at 4:01 PM, Rudá Porto Filgueiras <rud...@gmail.com> wrote:


2010/4/29 Dorneles Treméa <dorn...@x3ng.com.br>
Opa,


>> ainda não confirmado, mas talvez isso também esteja nos
>> afetando:
>>
>> http://blog.iweb.com/en/2010/04/update-snw4-cable-repair-april-28-2010-1600
>
> Realmente parece que é isso, porém eu abri uma solicitação de
> suporte para verficar se o problema é esse mesmo.

hum... pelo jeito não era... acabei de ver o retorno deles:

"""
We are not able to boot the server in any kernel, what we can do is
offer to reinstall the server on a new drive  and plug the current
drive by USB to allow you recover your data. There will be 50$ fees for
the re-installation. If you like to troubleshoot the issue your self,
we can provide you with KVM access for 24 hours to allow you
investigate the server.
"""

Foi feita alguma atualização recente no servidor? Não bootar em
nenhum kernel geralmente é resultado disso... :-/

Não. Eu vou solicitar a instalação do KVM remoto para verificar agora.

Histórico:

Após um ano de contrato com o provedor e pagamentos em dia, eles oferecem um desconto de até $50 (limitado a 20% do custo do nosso plano) ou aumento de disco de 320G para 500G ou incremento de memória de 2GB.

Como tínhamos apenas 2G no servidor, juntamente com Dorneles ficou decidido optar pelo upgrade de memória gratuitamente. Foi agendado a troca da memória na madrugada do dia 28/04/2010 01:00hs fuso EST.

O servidor foi desligado e a memória atualizada, porém acredito que a máquina não realizou após esse procedimento e nada foi informado pelo suporte que realizou o procedimento e o servidor ficou fora do ar desde então. Segue o LOG da data e hora do desligamento:

Apr 28 01:48:17 cl-t072-131cl kernel: Kernel logging (proc) stopped.
Apr 28 01:48:17 cl-t072-131cl kernel: Kernel log daemon terminating.
Apr 28 01:48:18 cl-t072-131cl exiting on signal 15

Como eu não tinha alterado nada no servidor e por alguns motivos pessoais meus, eu falhei em não acompanhar melhor o resultado desse procedimento, pois não me lembrei que ele estaria sendo feito naquele dia exatamente. Graças ao Arthur que identificou o problema, eu fui notificado da falha, mas somente li esse email ontem 29/04 por volta das 10:00hs da manhã.

Porém como tinha outros compromissos e vi o email do Deo sobre o possível problema no backbone do servidor, apenas ontem na parte da tarde foi confirmado que havia uum problema no nosso servidor.

Acionamos o suporte e solicitamos a instalação do KVM IP para verificar por que o servidor não inicializava. Além disso, via chat eu conversei com um analista de suporte questionando ele sobre o registro e notificação do sucesso ou falha no procedimento de upgrade de memória pois nada havia sido documentado no sistema deles de suporte. (vou encaminhar esse email com o chat para a lista).


Problema identificado pelo suporte:

Causa do problema identificada pelo suporte, que tinha sugerido reinstalar o servidor em outro disco e depois plugar o disco original via USB, mas que devido a minha solicitação de verificar o que exatamente causava a falha identificou o seguinte:

 - partição "root" errada no gerenciador de boot do Grub

Solução:

Ajuste da partição root no meu.lst do grub e o servidor inicializou corretamente.

Causa primária do problema:

O interessante é que eu realmente tinha feito modificações no fstab e menu.lst no passado, pois reparticionei o servidor e mudei a partição root antes de migrar os sites para o novo servidor, isso faz aproximadamente um ano.

Porém, o arquivo menu.lst havia sido modificado pela última vez com data de outubro de 2009:

root@cl-t072-131cl:/home/ruda# ls -la /boot/grub/menu.lst_20100429
-rw-r--r-- 1 root root 4500 2009-10-20 19:17 /boot/grub/menu.lst_20100429

E como após as modificações iniciais no primeiro semestre de 2009 eu precisei reiniciar o servidor na nova partição root, eu não poderia ter esquecido de modificar o menu.lst modificando a partição root da antiga para a nova.

A minha suspeita principal é que alguma atualização do Ubuntu (não me recordo quando realizei isso) possa ter modificado o menu.lst, alterando a partição root para a antiga, usando alguma configuração da instalação do sistema.


Após o retorno do servidor eu realizei alguns procedimentos:

- atualização do servidor "real" do Ubuntu 8.04.3 para 8.04.4, isso também atualizou o kernel
- verificação do menu.lst e reinicialização do servidor para verificar se a atualização funcionou adequadamente, utilizando o novo kernel e proveitando que temos o KVM IP por 24 horas
- atualização dos pacotes das máquinas virtuais que rodam Debian Lenny (apenas a máquina djangobrasil estáva 100% atualizada)
- alteração de configurações do XEN para solucionar problema de RTC, deixando que cada máquina virtual possa ter seu relógio independente
- configuração do ntpdate para rodar de hora em hora para que cada máquina virtual para manter o relógio sincronizado
- aumento da memória diponível para a máquina virtual que roda o Wiki PythonBrasil e o site Plone da Associação de 650MB para 900MB
- configuração do smartd para monitorar o disco e enviar alertas por email caso detecte algum tipo de problema

Conclusão:

Felizmente o problema não estava relacionado a falhas de disco ou outros tipos de problemas de integridade de dados.

O servidor estava estável já com mais de 200 dias em funcionamento sem paradas, e acredito que deve vai continuar assim, e com desempenho melhor devido ao upgrade de memoria.

Porem, esse incidente evidencia que é preciso ter mais de uma pessoa no suporte do servidor com condições de acionar o suporte e tomar providências na resolução dos problemas, pois idependentemente da causa do problema, o tempo para solucioná-lo foi devido a algumas causas:

- o provedor não informou falha de boot após o upgrade de memória
- eu falhei em não verificar o servidor no dia 28 pela manhã
- eu não li meus email no dia 28 na parte da tarde e noite
- apenas o Arthur identificou o problema, mas avisou por email, talvez uma ligação por telefone nesse caso ajudaria
- eu não tive disponibilidade imediata para verificar o problema assim que li o email do Arthur

Quem de vocês teria disponibilidade para essa tarefa de auxiliar no suporte do servidor?

Além disso, é interessante que os telefones dos responsaveis sejam passados para alguns outros membros que auxiliem também na notificação de quaisquer problemas e se for algo como indisponibilidade total, que possam entrar em contato por telefone (até mesmo SMS) imediatamente.

Uma melhoria interessante seria ter um serviço de monitoramento em outro local (gratuito ou cedido por algum membro da comunidade) que envie emails de alerta em caso de falha do servidor ou até mesmo SMS.

Gostaria da opinião de outras pessoas e quaisquer críticas e sugestões serão bem vindas.

Sds,
 

Marcos Daniel Petry

unread,
Apr 30, 2010, 9:40:03 AM4/30/10
to apyb-...@googlegroups.com

Estou meio atarefado com alguns trabalhos paralelos e com minha pós-graduação, mas passando este período (pelo menos um mes) posso dar uma mão. Minha experiência como sysadmin não é lá essas coisas, mas acredito que sirva p/ apagar alguns incêndios ;). Mas acredito que, quanto + gente p/ essa tarefa, melhor!
 

Além disso, é interessante que os telefones dos responsaveis sejam passados para alguns outros membros que auxiliem também na notificação de quaisquer problemas e se for algo como indisponibilidade total, que possam entrar em contato por telefone (até mesmo SMS) imediatamente.

Uma melhoria interessante seria ter um serviço de monitoramento em outro local (gratuito ou cedido por algum membro da comunidade) que envie emails de alerta em caso de falha do servidor ou até mesmo SMS.

Aqui na UCS, trabalhamos com o nagios, ele é bem competente nessa tarefa... eu tenho 1 vm na locaweb, mas estou pensando em migrar de servidor p/ uma outra empresa nas próximas semanas, mas se precisarem para agora agora, posso instalar lá sem problemas...
 

Gostaria da opinião de outras pessoas e quaisquer críticas e sugestões serão bem vindas.

Sds,
 
--
Rudá Porto Filgueiras
http://python-blog.blogspot.com
http://twitter.com/rudaporto

--
You received this message because you are subscribed to the Google Groups "APyB: Sites" group.
To post to this group, send email to apyb-...@googlegroups.com.
To unsubscribe from this group, send email to apyb-sites+...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/apyb-sites?hl=en.



--
Marcos Daniel Petry
http://mdpetry.net

Fabiano Weimar dos Santos

unread,
Apr 30, 2010, 9:49:21 AM4/30/10
to apyb-...@googlegroups.com
Advinha com quem a UCS hospeda um nagios?

Eu falei com o Ruda a alguns minutos atrás. Ficamos acordados que semana que vem ele me procure para passarmos a monitorar o ping e http dos serviços da APyB.

Já hospedamos o backup remoto da APyB; manter um nagios também não será problema.

-- Fabiano Weimar


<snip>

2010/4/30 Marcos Daniel Petry <marco...@gmail.com>


Uma melhoria interessante seria ter um serviço de monitoramento em outro local (gratuito ou cedido por algum membro da comunidade) que envie emails de alerta em caso de falha do servidor ou até mesmo SMS.


Aqui na UCS, trabalhamos com o nagios, ele é bem competente nessa tarefa... eu tenho 1 vm na locaweb, mas estou pensando em migrar de servidor p/ uma outra empresa nas próximas semanas, mas se precisarem para agora agora, posso instalar lá sem problemas...
 

Gostaria da opinião de outras pessoas e quaisquer críticas e sugestões serão bem vindas.

 
<snip>

--
Fabiano Weimar dos Santos [Xiru]
http://www.pytown.com
Blog: http://blog.xiru.org
Twitter: xiru
Buzz: xirumacanudo
Skype: xirumacanudo
MSN: xirumacanudo

Arthur Furlan

unread,
Apr 30, 2010, 11:18:37 AM4/30/10
to apyb-...@googlegroups.com
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

On Fri, Apr 30, 2010 at 10:16:16AM -0300, Rudá Porto Filgueiras wrote:
[...]
> - atualização do servidor "real" do Ubuntu 8.04.3 para 8.04.4, isso também
> atualizou o kernel
> - verificação do menu.lst e reinicialização do servidor para verificar se a
> atualização funcionou adequadamente, utilizando o novo kernel e proveitando
> que temos o KVM IP por 24 horas
> - atualização dos pacotes das máquinas virtuais que rodam Debian Lenny
> (apenas a máquina djangobrasil estáva 100% atualizada)

Um viva para o unattended-upgrades[1]. :)

[1]. http://packages.debian.org/unattended-upgrades

[...]
> Conclusão:
>
> Felizmente o problema não estava relacionado a falhas de disco ou outros
> tipos de problemas de integridade de dados.
>
> O servidor estava estável já com mais de 200 dias em funcionamento sem
> paradas, e acredito que deve vai continuar assim, e com desempenho melhor
> devido ao upgrade de memoria.
>
> Porem, esse incidente evidencia que é preciso ter mais de uma pessoa no
> suporte do servidor com condições de acionar o suporte e tomar providências
> na resolução dos problemas, pois idependentemente da causa do problema, o
> tempo para solucioná-lo foi devido a algumas causas:
>
> - o provedor não informou falha de boot após o upgrade de memória
> - eu falhei em não verificar o servidor no dia 28 pela manhã
> - eu não li meus email no dia 28 na parte da tarde e noite
> - apenas o Arthur identificou o problema, mas avisou por email, talvez uma
> ligação por telefone nesse caso ajudaria
> - eu não tive disponibilidade imediata para verificar o problema assim que
> li o email do Arthur
>
> Quem de vocês teria disponibilidade para essa tarefa de auxiliar no suporte
> do servidor?

Eu posso ajudar. :)

Como todos, a minha disponibilidade de tempo não é infinita, porém
acho que juntando o pouco tempo de vários, nós conseguimos fechar uma
janela de tempo razoavelmente grande que ajude a resolver os problemas
de forma mais rápida.

> Além disso, é interessante que os telefones dos responsaveis sejam passados
> para alguns outros membros que auxiliem também na notificação de quaisquer
> problemas e se for algo como indisponibilidade total, que possam entrar em
> contato por telefone (até mesmo SMS) imediatamente.
>
> Uma melhoria interessante seria ter um serviço de monitoramento em outro
> local (gratuito ou cedido por algum membro da comunidade) que envie emails
> de alerta em caso de falha do servidor ou até mesmo SMS.

Acho que isso seria interessante, principalmente a questão do
monitoramento dos serviços.


- --
Atenciosamente,

Arthur Furlan (afurlan)
afu...@afurlan.org
http://blog.afurlan.org
Public GPG KeyID: 27D81084

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (GNU/Linux)

iQIcBAEBCAAGBQJL2vTMAAoJEOW5JtQn2BCEyF0P/2r/HglE5JSjVMc7ijpzy4c5
SZ6lkNkkAdSNrefIpVor2xfHmSzirgkB7g2X6vUmm6BZJaGYcJE/abMxKVmDT3GK
f6umC0Q3OFJ2WWlLlv2RLTjwTs+/tG8YdaxRTeXdVgBO2ltWbWQbfHm3iIsGdrow
FFiX25JAzfVN68n2to7Hk2mj9mDbN9GXt/WjA/QEAF5nRnRaQkx+g7ikZixKJDQ8
aMureRfU/iy4sQjy8eH7Xmbw1XD6dA7XzIz35BHlltucG1CVh+qBlA0GfCq9MQli
lbqxRuKar/Upc5irWdnrPHbNfWKpvYPBpn76eUKiF8LzS28xxPw1k7tfvxBjk5TQ
7umZH447RvX1tPDm68F3uwFtJu0y14NAk28ANteeuwwWs77EIQSPi0CM26A6Jgcg
hgY8WL/Lryr8t4wzviK4hicBi3t4MhUeHNeArzg3WZSBrtughxuIc6gbbNhlYG6n
QaMPzHvROPzwt4CushMPpNWHV6s32AGFfAr6tTYGiZ2Fc9jvFgX2pXJIlTH+NPkZ
Ew9Sxe9ZgZV0M/LuyzUYxylSqNpfPOoOYsxA3Dw84CpnOD2EVVQf8HpW/0BLvGCY
aCPqkYSDVBsxqHxcSrrkM+R14rQC3A1khQv/6SCV3FxU1hSAGqqgwsXTs55VVx6D
7llsWLnMX2ml/yQX0ImE
=Rqm6
-----END PGP SIGNATURE-----

Joao S. O. Bueno

unread,
May 1, 2010, 12:39:09 AM5/1/10
to apyb-...@googlegroups.com
to vendo aqui os 25 projetos mais ativos em abril, no soruceforge,e um
deles é o "zenoss core"[1] - um negócio para monitoramento, mas fieto
em Python + zope (eu tambem "cresci" com o nagios).

De repente é mais legal que o Nagios para nós.
(em tempo: também posso oferecer espaço num servidor virtual que augo
para o monitoramento de *.python.org.br - mas estou sem tempo para
nada, nem configurar isso - mas se o problema for servidor, podem
contar com esse meu espaço lá)

js
-><-
[1]http://sourceforge.net/projects/zenoss/

2010/4/30 Arthur Furlan <afu...@afurlan.org>:
Reply all
Reply to author
Forward
0 new messages