[자료] Zabbix, Redmine을 연동한 자동화 모니터링 환경 구축

799 views
Skip to first unread message

JongJun Lee

unread,
Mar 14, 2016, 10:15:14 PM3/14/16
to sysadminstudy

안녕하세요! 눈팅만 하는 jjun이라고 합니다.


통일한 설정을 하고 있던 와중에 외국 자료가 발견되어서 번역해둔 것을 공유드립니다.


본 자료의 내용은 

원문 http://www.okinawaopenlabs.org/wp/wp-content/uploads/16_1000_NTTRezonanto.pdf  의 내용에서 37~44 페이지를 구글 번역과 네이버 번역기를 통해 번역한 것입니다. (참고로 저는 일본어를 모릅니다..)


저는 아주 기초적이고 기본적인 상태로만 설정되어 있습니다. 예전에 메일링 리스트에서도 말씀드린 적이 있는데...
1) Zabbix에서 이벤트 발생하면 통지기능을 통해 2) Redmine에 티켓 등록하고 3) Redmine을 플러그인을 통해 다시 Slack으로 실시간 알람, Telegram도 가능함)


에스컬레이션 부분만 통지만 좀 더 연구해보면 될 것같은데... 아직 미진합니다.
- 관련된 오픈소스
나 SaaS 서비스가 있기는 합니다만...
  https://github.com/ustream/openduty


통지 관련하여 자체 전산실을 운영하는 경우 망장애에 대한 감시 및 통보가 문제가 되는데,
안드로이드 폰에 QPython(SL4A)를 설치해서 직접 ping test와 전화통지, 문자발송을 하는 것을 목표로 조끔식 연구중입니다.


감사합니다.




20160107-zabbix_redmine_연동_자동화모니터링.pptx

Taejoon Moon

unread,
Mar 18, 2016, 4:40:39 AM3/18/16
to sysadm...@googlegroups.com
문서 내용을 보니 모든 알람이 발생하면 이걸로 티켓을 만든다는 것인가요? 그러면 수많은 티켓이 만들어질 건데요.

제가 있는 곳에서도 요즘에 모니터링 시스템과 slack을 연동해서 사용을 하더라구요. 아직 어떻게 연동을 하는 것까지는 잘 모르겠지만.

2016년 3월 15일 오전 11:15, JongJun Lee <juni0...@gmail.com>님이 작성:

--
이 메일은 Google 그룹스 'sysadminstudy' 그룹에 가입한 분들에게 전송되는 메시지입니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 sysadminstud...@googlegroups.com에 이메일을 보내세요.
이 그룹에 게시하려면 sysadm...@googlegroups.com에 이메일을 보내세요.
https://groups.google.com/group/sysadminstudy에서 이 그룹을 방문하세요.
더 많은 옵션을 보려면 https://groups.google.com/d/optout을(를) 방문하세요.

JongJun Lee

unread,
Mar 21, 2016, 1:28:39 AM3/21/16
to sysadm...@googlegroups.com
개념적으로는 그렇습니다. 물론 Zabbix에서 통지 레벨 조정이 가능하므로, 모든 것의 범주가 조정이 될 수 있습니다.  통지를 특정 이벤트이나, 레벨 이상일때로 조건부로 보낼 수 있으니깐요.


Slack이.. 그냥 curl로 URL과 메시지 던져주면 끝입니다. Slack의 강점이 이런 연동 부분이.. 쉽게 잘되어 있는 것 같습니다. 워낙이 실시간 통지가 안정적으로 잘되는.. 무료로 사용가능한 솔루션이니 채택. (무료는 1만건 까지만 대화기록이 저장되는 단점이 있고... 이건 Redmine에 이슈로 남기니깐 극복 가능^^)


티켓(이슈) 관리 솔루션과의 연동이 좋은 점 중 하나는...이런 시스템모니터링 툴과 덜 친한... 다른 (개발, 보안, 총무) 파트와의 소통이 수월해지고 자동화 된다는 점에서 매력적이고... Redmine의 경우는 프로젝트와 이슈에 대한 부모/자식 관계가 자율성이 높아서 API 만 잘 이용해서 정책을 잘 설계하면 유용하게 쓰일수 있겠습니다. 
- 예를 들어 서버그룹별로 프로젝트로 분류하고, 서버 1대 = 티켓 1개로 생성하며, 이슈의 상태 변경 및 댓글로 관리하면... 티켓발생이 그렇게 많지 않게 될됩니다.
Redmine이 단일 서버환경에서 200만개 티겟운영도 하는 사례도 있어서요..(물론 서버설정에 따라 다르겠지만) 이것 티겟 운영을 어떤 기준으로 할것이냐의 문제라서.. 상황마다 다를듯 합니다. (저는 몇대 안되어서..^^)

티겟 관리가 잘 되면... 결국 역으로 어느 서비스그룹, 어느 담당자, 어느 서비스에서 문제가 발생하는지 가시화 되고, 개선 포인트가 바로 전체 시스템운영관리 업무가 가시화 될것으로 보고.. 계속 시도중입니다.


2016년 3월 18일 오후 5:40, Taejoon Moon <taejoo...@gmail.com>님이 작성:
Reply all
Reply to author
Forward
0 new messages