Отрицательный опыт стабильности GAE

92 views
Skip to first unread message

Rekby

unread,
Oct 26, 2012, 8:14:21 PM10/26/12
to google-ap...@googlegroups.com
Для старта проекта решил выбрать GAE как простую неадминистрируемую платформу. Проект еще не запущен, но для статистики ping-admin проверяет работу ресурса раз с интервалами от раз в 5 минут до раз в час в течение последних 2 месяцев (58 дней).

Мониторинг заметил два сбоя. В первый раз это было значительное увелиение времени отдачи страницы (с 0.5 секунд до 30 с лишним секунд без изменения кода и накопления данных - проект еще не запущен).

Второй раз сегодня, в GAE случилась общая проблема, которую они поправили и разбираются, сайт фактически был недоступен больше 3 часов, на большенство запросов отдавал 500-ю ошибку, но могу случайно выдать и обычную страницу (1 из 10-15 раз).

Итого по мониторингу даунтайм за последние 2 месяца составил 1 час, на самом деле минимум 4 часа (особенности настройки мониторинга могут значительно занижать даунтайм).

При этом сегодняшняя проблема была общая для платнформы и даже премиум-аккаунты не могли обратиться за поддержкой, т.к. сайт appengine и все его формы тоже не работали.

Для себя принял решение - что этот проект всё же запущу на GAE, чтобы готовую вещь не переделывать и в момент когда станет понятно что проект начинает зарабатывать деньги слезать с GAE и переходить на собственные сервера или на Amazon.

Дальнейшие проекты уже сразу виртуальном хостинге, VDS или своих серверах, чтобы в момент проблемы можно было что-то сделать для поднятия системы (например быстро переехать в другое место).
Message has been deleted

Timofey Koolin

unread,
Nov 1, 2012, 4:19:13 PM11/1/12
to google-ap...@googlegroups.com
Да, такая масштабная на моей памяти первая, ну и они пишут что первая.
До этого была проблема о которой они вообще в отчетах не упоминали - это был как бы не простой, а просто страница отдается за 30 секунд вместо 0.2 секунды - на практике это почти тоже самое что простой, но в SLA подобных штук нету и о таких вещах гугль не упоминал, на обращения в StackOverflow в канал GAE и в GAE-группу гугль никак не отреагировал.

Согласен и у амазона бывают и у всех остальных тоже, но с амазона и т.п. вполне можно быстро переехать - для этого ставится второй сервер в независимом ДЦ с непрерывной репликацией Master-Slave, в момент аварии достаточно прописать новый IP-адрес на DNS-серверах с предварительно настроенным низким TTL и остановить репликацию.

Просто переключения на практике отрабатываются за 10-15 минут, варианты с непрерывной репликацией сейчас для клиента настраиваю, т.к. реально были случаи недоступности ДЦ, а час простоя стоит много тысяч рублей.

В гугль плох даже не сам факт простоя, а то что при этом на ситуацию никак нельзя повлиять, кроме как переключиться на сайт где написано что мы временно не работаем. Т.е. получается некий черный ящик, где всё работает пока работает, а если что-то вдруг не работает, то просто сидеть и ждать.

Кроме того не увидел у них в договорах каких-то условий на счет прекращения сотрудничества - за какой срок они  гарантируют предупреждение о том что  GAE закрывается и больше работать не будет в момент когда такое решение будет принято?

Ну за последние 3 года это по моему первая серьезная авария, до этого тоже были простои но не такие длительные и не такие глобальные. Обо всех проблемах с GAE можно посмотреть здесь: https://groups.google.com/forum/#!forum/google-appengine-downtime-notify

У амазона тоже бывают простои, не говоря уже об обычных хостерах.
Простои бывают даже у Яндекса, Фейсбука, Вконтакта и т.п. не представляю как Вы на обычном виртуальном хостинге сможете добиться 100% аптайма. И как Вы в случае проблемы за несколько часов переедете из недоступного датацентра, в котором будут размещены ваши виртуальные сервера.

суббота, 27 октября 2012 г., 4:14:21 UTC+4 пользователь Rekby написал:

--
Вы получили это сообщение, поскольку подписаны на группу Google App Engine Russian.
Просмотреть это обсуждение в Сети можно по адресу https://groups.google.com/d/msg/google-appengine-ru/-/tgrfvtFuMmMJ.
Чтобы добавлять сообщения в эту группу, отправьте письмо по адресу google-ap...@googlegroups.com.
Чтобы отменить подписку на эту группу, отправьте сообщение по адресу google-appengin...@googlegroups.com.
О дополнительных функциях можно узнать в группе по адресу http://groups.google.com/group/google-appengine-ru?hl=ru.

Mikhail Kashkin

unread,
Nov 5, 2012, 3:13:04 AM11/5/12
to google-ap...@googlegroups.com
Что-то такое было, вроде бы чуть ли ни 3 года если подписать корпконтракт и платить 500 баксов в месяц. Но деталей не помню. Где-то в SLA должно быть.

2012/11/2 Timofey Koolin <tim...@koolin.ru>

Кроме того не увидел у них в договорах каких-то условий на счет прекращения сотрудничества - за какой срок они  гарантируют предупреждение о том что  GAE закрывается и больше работать не будет в момент когда такое решение будет принято?



--
Mikhail Kashkin

Сергей Скрипов

unread,
Nov 1, 2012, 6:43:26 PM11/1/12
to google-ap...@googlegroups.com

Ну Вам же не только сервер с БД надо перевезти, но и сервера приложений, балансировщики, прокси и т.п. В этом плане удобней всего амазон и его несколько ДЦ, больше чем в одном одновременно у них аварии не случаются, так что можно держать выключенными копию основных серверов в другом ДЦ и запускать их в случае аварии в первом ДЦ или изначально построить инфраструктуру с балансировкой между несколькими ДЦ. Но как показывает жизнь, даже у гугла бывают аварии и нет гарантии, что при экстренном переезде у Вас все пройдет гладко. А кроме этого поддерживать подобную ифраструктуру тоже стоит денег. Плюс в случае аварии можно сделать крайними администраторов или себя, но толку от этого? :-)

Все так боятся этого "черного ящика" GAE, но мне кажется, лучше надежный черный ящик, чем ненадежный прозрачный и стеклянный. :-)

Тут вопрос доверия и тех.требований. Во первых не каждое приложение можно сделать на GAE, а во вторых несколько лет назад боялись свой рабочий сервер у провайдера поставить (хранили все под столом у админа), а сейчас все в облака рвутся.

По поводу прекращения сотрудничества сложный вопрос, я вообще не видел, чтобы кто-то писал "в случае банкротства обязуемся предупредить за 2 года" :))
Но гугл еще ни один сервис по моему просто так без предупреждения не закрывал, и всегда давал возможность забрать все свои данные.

02.11.2012 0:19 пользователь "Timofey Koolin" <tim...@koolin.ru> написал:
Reply all
Reply to author
Forward
0 new messages