Вопрос, процессов несколько одновременно запущено, или только один на
одной машине?
Если в каждый момент времени один, то все просто, пишешь рестарты в
логи, и потом по таймстампам смотришь, кто жил в момент кончившейся
памяти.
Если процессов много, то это интересная коробочка с червями, которую
кушают нынешние системы мониторинга в связи с наступлением
контейнеров. Готового решения не знаю, найдешь - покажи.
Варианты слепить из того, что есть:
- зашивать пид процесса в имена метрик, которые он шлет, и валить это
дело в графит, включив там lazy allocation. Файлов создаст неимоверное
число, место должно от lazy allocation экономиться, но графит (или
графана) скорее всего взорвется, делая из этого агрегаты (или просто
ища максимум из моря метрик)
- зашивать пид процесса в тег метрики и использовать систему, которая
умеет теги, типа OpenTSDB или что там сейчас у InfluxDB из не
сломанных фич осталось.
> --
> Вы получили это сообщение, поскольку подписаны на группу "devopsru".
> Чтобы отменить подписку на эту группу и больше не получать от нее сообщения,
> отправьте письмо на электронный адрес
devopsru+u...@googlegroups.com.
> Чтобы настроить другие параметры, перейдите по ссылке
>
https://groups.google.com/d/optout.