열심히 테스팅중이군요.
테스팅화면뿐만 아니라 나중에 진행하고나서 정리된 문서도 있으면 좋겠는데
요????
제가 있는 곳도 모니터링이 이슈중의 하나라서 요즘 여러가지 검토예정입니
다. (근데 모니터링뿐만 아니라 전체적인 모든 이슈에 대한 검토라서 고민할
게 많지만)
whatsUp : 기존에 IDC에서 많이 사용하는 모니터링 프로그램
-> 버전이 올라가면서 기능이나 UI가 더 나아졌다고 하는군요. 프리미엄버전
에는 MS-SQL 등과 윈도우즈 wmi 를 이용한 모니터링 가능.
http://www.adventnet.com/products/webnms/index.html A
<http://intranet.sds.co.kr/moniwiki/wiki.php/AdventNet>dventNet Web NMS 4
A <http://intranet.sds.co.kr/moniwiki/wiki.php/AdventNet>dventNet Web
NMS is the industry-leading network management model / framework for
building custom OEM software such as Element, Network and Systems
Management (EMS / NMS) applications. Networking equipment vendors and
other management solution providers can rely on A
<http://intranet.sds.co.kr/moniwiki/wiki.php/AdventNet>dventNet Web NMS
for building OEM software for network management such as EMS and NMS.
* EMS, NMS 용도의 OEM 소프트웨어로 개발하기 위한 네트워크 관리 모델,
프레임워크 제공
* http://www.tmn.co.kr/ 국내판매, 개발업체
공개프로그램 : zabbix 등
상용솔루션
상용솔루션은 기존 시스템구성과의 연계가 문제가 되는 듯 합니다. 솔루션에
따라서 커스터마이징이 제한이 될 수 있지요.
물론 회사에서 계속 유지보수 비용을 지출하면 상관없겠지만 쉬운것은 아니지
요. 그렇다고 하더라도 또 내부시스템관의 연동을 위해서는 모든것을 맡길수
없는 부분도 있을 것입니다. ITSM 도 하나의 용어로서 이야기는 많이 되지만
기존 업무프로세스 개선과 연관이 되어있기때문에 프로그램만으로 처리하는것
이 아니라 기본적으로는 업무프로세스개선 및 함께 일하는 사람들에 대한 정
책강제(?)가 있어야 하는 부분입니다. 일부 포탈도 상용솔루션을 구매하였다
가 커스터마이징부분때문에 고생하고 있는곳도 있더군요.
성능관리, 상태관리(모니터링)으로 끝나는 것이 아니라 장비입고부터 모니터
링, 문제시 알람, 이력관리, IP/HW 자산관리, 고객서비스관리(서비스데스크)
까지 모두 연관이 되어야 하는데 이건 전담기획자, 개발자가 있어야 가능할
것이고 이렇게 운영하고 있는 사이트도 있습니다.
제가 모든것을 다 테스팅해볼 수 있는 것은 아니기에 이후 어떻게 할지 고민
중입니다. 아는 사람도 zabbix를 가지고 테스팅을 하고 있다고 하는데(실제
도입했나??) 기능은 좋은데 여러가지 노가다 작업이 심하다고 합니다. 여긴
자체 에이전트가 있죠. 윈도우 포함. 그래프 기능은 막강하다고 하는데 엄기
성님 이야기와는 좀 다르군요. DBMS 설계 도 좋고 에이전트 안정성도 좋다고
합니다. 그렇지만 대량으로 작업할 경우에는 GUI가 불편해서 직접 SQL 문으로
작업하는 경우가 있다고 하는군요.
아래는 솔루션 검토하면서 썼던 글 일부입니다.
오늘은 여기까지.
-----------------------------------------
1. 모니터링 시스템(알람을 포함)을 빠르게 도입한다. 현재 WhatsUP을 테스팅
하고 있고 테스팅한 것을 가지고 데모를 보고 판단
-> 장점 : 빠른 시간내에 도입이 가능하며 WhatUP은 기존에 익숙한 툴(시간이
많이 지나서 UI, 기능등은 많이 바뀌었을 것으로 예상)
-> 단점 : 모니터링 용도로만 사용가능하며 기존 시스템과의 연동부분은 확인
해보아야함(기존 고객정보, SMS 발송정보)
-> 필요기간 : 기능테스팅 1-2주, 시스템연동 1-2주. 한달정도의 기간에 처리가능
2. AdventNet Web NMS 4 도입. 이는 EMS, NMS 용도의 OEM 소프트웨어로 개발
하기 위한 네트워크 관리 모델, 프레임워크 제공을 합니다. Java 기반인 듯
하네요.
-> 장점 : 처음부터 모든 것을 재구성하는 것보다는 개발속도가 빠를 것임.
위의 제품은 EMS, NMS 개발용도로 많이 사용하고 있으며 국내개발, 판매회사
도 있음.
-> 단점 : 작업을 할 수 있는 개발자 필요하고 개발자가 있다고 하더라도 요
구사항을 분석하고 개발작업을 진행하는것은 최소 2-3개월 이상 걸릴 것으로
판단함. 이는 모니터링부분만 말하는 것임. 여기에 구성관리 및 기존 업무와
의 연계는 더 많은 시간이 들어갈 것으로 판단이 됨
-> 필요기간 : 요구분석 , 프로그램설계, 구현, 테스팅, 실제적용
3. 상용 EMS 솔루션 도입
-> 장점 : 모니터링에만 그치는 것이 아니라 전체적인 통합관리시스템구축 가
능하며 업무 프로세스 개선, 고객 서비스 향상에 기여할 수 있음. 통합관리시
스템구축 차원에서는 가장 빠르게 진행할 수 있음.
-> 단점 : 당장 들어가는 비용은 가장 클 것임. 기존 시스템과의 연동 부분은
확인이 필요함.
-> 필요기간 : 업체확인이 필요하나 업무분석, 설치, 초기 1-2주 초기 데이터
분석, 관리 후 관리정책 수립 및 적용은 1-2개월에 가능할 것으로 판단함
** 해당 업체와 협의후 ASP 형태로 도입하여 호스팅고객에게 부가서비스로 제
공하고 서로 이익을 나누는 방식이 있을 수 있음
4. 모든 것 자체 개발, 다른 공개소스 활용
-> 장점 : 자체 개발을 통하여 경험과 노하우를 쌓을 수 있음. 공개소스로 시
스템, 네트워크 모니터링, 성능관리 프로그램은 많이 있는 편임
-> 단점 : 언제 끝날지 모름. 통합관리시스템개발경험이 부족한 상태에서 프
로젝트가 장기간 미궁으로 빠질수도 있음
또 한가지 판단을 할 부분은 상용솔루션을 구매하든, Web NMS를 가져오든 구
성관리가 정확히 되지 않고 있기에 초기 분석 및 연동작업에 생각보다 많은
시간이 걸릴 수 있습니다.
Gi Seong Eom 쓴 글:
> 안녕하세요.
> 엄기성입니다.
> Zabbix 1.1.1 테스트를 간단히 마치고, 저희쪽 production 서버에 일부 적
> 용을 해서
> 사용하고 있습니다. UI, 설치등이 간단해서, 처음 접하는 분들도 쉽게 만족하실
> 것으로 생각합니다... (생각보다 노가다가 있습니다만..)
> Zabbix의 Graph는 좀 부실합니다. 그래서, 개인적으론 openNMS를 통해서 이를
> 보완할려고 같이 테스트를 하고 있습니다. OpenNMS는 공부가 더 필요하네요 ^^
> 스크린샷 몇개 보여드리지요.
> 1. 사용자정의 스크린
> http://performance.pe.kr/download/_2006.08.24.zabbix.custom.screen.jpg_
> <http://performance.pe.kr/download/2006.08.24.zabbix.custom.screen.jpg>
> 2. MS-SQL 서버 모니터링
> http://performance.pe.kr/download/
> <http://performance.pe.kr/download/2006.08.24.zabbix.sql.jpg>2006.08.24.zabbix.sql.jpg
> <http://performance.pe.kr/download/2006.08.24.zabbix.sql.jpg>
> System Monitor에서 성능카운터를 가져올 수 있습니다. (Windows agent)
> 3. Windows Agent의 자원점유
> 부하가 많은 시스템에서 Agent 의 오동작/자원누수 여부는 꽤 중요하죠.
> Spotlight on Windows로 측정한 내용입니다.
>
> http://performance.pe.kr/download/
> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo2.jpg>2006.08.13.zabbixw32.procinfo2.jpg
> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo2.jpg>
> http://performance.pe.kr/download/
> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo1.jpg>2006.08.13.zabbixw32.procinfo1.jpg
> <http://performance.pe.kr/download/2006.08.13.zabbixw32.procinfo1.jpg>
> 일단은 여기까지^^
> *
>
> *"Imagination is more important than knowledge."*
> -- *Albert Einstein*
> *Gi Seong Eom*
> MSN: jur...@kldp.org <mailto:jur...@kldp.org> / e-mail:
> k2l...@gmail.com <mailto:k2l...@gmail.com>
> *
>
> >
--
--------------------------------------------------------
문태준
연락처 : 016-761-1160
이메일 : j...@tunelinux.pe.kr
http://tunelinux.pe.kr
http://database.sarang.net
저희는 한동안 AdventNet 의 Opmanager 를 사용했습니다.
가격도 저렴하고, 서버 IP 주소만 적어주면 Auto Discovery
해줘서 편하게 썼는데,
관리하는 서버가 늘어나면서 check interval 이 문제가
되어 포기했습니다.
요즘에는 Cacti 를 사용하는데 생각보다 꽤
편리하더군요.
CPU, Memory, Disk, Process, Connection, HTTP, Load 등의
간단한 정보를 RRD 그래프로 그려주고있고요,
사실 Cacti가 관리에 불편함이 많은데,
인터넷에서 구한 벌크 등록 스크립트 (add_device.php) 를
수정해서 사용하고 있습니다.
필요한 분 있으면 공개하도록 하겠습니다.
일주일마다 cron 스크립트로 RRD data 를 뽑아서 Weekley
Report 내주고 있고
이를 엑셀에서 불러와서 System Mertics Report 쓰고
있습니다.
(CACTI 에 plugin 으로 report 구현할 수도 있습니다)
Cacti 에 등록된 호스트들의 디스크 사용량을 점검하는
PHP 스크립트를 몇 시간마다 실행해서
메일로 보내주게 했습니다.
리눅스용으로 Munin 도 꽤나 괜찮습니다.
전에 다니던 회사에서는 Munin 을 썼는데, 윈도우 쓰는
회사로 옮겨서 이제 쓰기 힘드네요.
그리곤 Nagios를 사용해 봤습니다.웹에서도 쉽게 볼 수
있어서 좋았습니다만,
100여대정도의 서버 셋팅이, 너무 세분화 되고
복잡해서 저로선 매우 힘들었습니다.
결국 기본적인 서버상태만 볼 수 있도록 설정하고,
사장님께 보여드리는 용도로만 사용하고 있습니다.
제가 지금까지 매우 유용하게 사용하고 있는건 What's
UP 입니다.
이녀석은 서버 등록 및 설정도 매우 쉽고, 자체 설치
및 설정 또한 간결했습니다.
처음엔 2006 트라이얼 버젼을 사용해 봤는데 너무
좋아서 기간이 만료되는게 아쉽더라구요..
그래서 2005버젼을 어두운 하수구를 뚫고 구해왔죠..
현재로는 여기에 전부 의존하고 있는 편입니다.
기본적으로 What'sup에서 지원하지 않는 프로토콜들은
TCP 프로토콜을 사용하여
직접 서비스 포트로 핑을 때리는 식으로 체크했고,
문자역시 따로 문자발송용 서버 프로그램을 만들어서
적당한 서버에 올려두었습니다.
What'sup에서 시스템문제를 발견 할 경우 직접 제작한
클라이언트 프로그램을 실행하여
실행 인자로 문자열을 넣어주게 되어있고, 그
문자열은 서버프로그램에 날아가서,
서버에선 저희 회사에서 서비스하고 있는 무료 문자
디비서버로 쿼리를 날리게 되는거죠..(SMS
터널링이라고하나요 혹시..잘몰라서..)
지금 이 상태로 6개월이 넘게 아주 마음놓고 잘
지내고 있습니다.
물론 로그관리는 Logwatch 를 이용하고 있구요..
Logwatch로 하드디스크용량, 크론로그, 접속관련,
부팅관련로그들을 받아보고 있습니다.
이것도 역시 100여대정도 되는 서버의 로그를
한꺼번에 받아봐야 하기때문에 혼자로썬 꽤나 무리가
있는 편이긴 하지만,
그래도 어쩌겠습니까 .... 주어진 환경이 그러한걸..^^
어쨋든 그동안 전 What'up + Logwatch를 사용하고 있었고,
요즘들어 What'sup의 한개가 느껴지던 참인데
이 기회에 각 모니터링 시스템들좀 비교해보면서
삽질해 봐야겠습니다..
근데 문제는 이게 글자가 제한되서 짤라서 보내는
간단한 프로그램을 짜야했다는거죠..ㅎ
트래픽보기는 사실 전체적인 트래픽만 그냥 IDC에서
제공해 주는 것을 보고 있습니다.
회사에서 하는 서비스중에는 대용량
파일서비스(FTP)도 있는데, 이 서비스에
관련된 서버만 따로 mrtg로 묶어서 접속상태나,
전송속도등의 문제가 들어왔을 경우만
확인합니다.
opmanager는 전에는 잘 몰랐었는데 이것도 국내는 모르지만 해외에서는 많이
쓰는 듯 합니다.
http://www.adventnet.com/
opmanager는 완제품이고 webnms라는것은 자체적으로 개발해 사용할 수 있도록
제공하는 프레임웍입니다.
기본적인 모니터링하는것이야 왓츠업이든 뭐든 완제품쓰면 되겠지만 좀더 기
존 시스템과의 연동이나 여러가지 것을 처리하려면 부가적인 기능이 있어야
할 것 같습니다.
상용 nms 제작시 위 회사의 webnms 모듈을 많이 쓰는 듯 합니다.
이외에도 여러가지 시스템, 네트워크 관련 프로그램들이 많은데 한번 사이트
를 보면서 저런 제품도 있구나 참고하면 도움될 듯 하네요.
왓츠업은 예전에 비해 최근에 나온것이 기능과 UI가 많이 보강되었다고 알고
있습니다.
저는 전에 이걸 써보지 않아서 이름만 알고 있고 옆의 다른 사람들이 그러더군요.
opmanager 나 webnms 를 이용해본 경험 가진 분들 더 없나요?
재현님은 "서버가 늘어나면서 check interval 이 문제가되어 포기했습니다"
라고 했는데 이게 어떤것을 말하는지??
그리고 cacti 쓰면서 말흔 벌크스크립트 그런건 당근 공개해도 되지요.
수많은 사람들이 항상 비슷한 잘못이나 실수를 반복!
Dr.Mirr 쓴 글:
> 아참...한가지 빠뜨린게 있어서 다시 포스팅합니다..혹시 그룹포스팅 매너에 어긋나나요? 메일링리스트에참여해본 경험이 없어서요..^^What'up으로 좀 더 쉽게(하지만 문자로받기엔불편하게ㅡ,.ㅡ::) 하는 방법도 있습니다.Nate에 보면 메일알림 서비스라는게 있습니다.이게 메일을 Nate로 보내면 메일제목을 문자로보내주는 기능인데,한때는 이걸 이용해서 (회사에서 SMS 서비스를 하고있었다는걸 몰랐을때...)시스템에 문제가 있을때 What'up 메일발송 액션을이용해서 직접 메일을 이쪽으로보내게 한적이 있었죠.....
> 근데 문제는 이게 글자가 제한되서 짤라서 보내는간단한 프로그램을 짜야했다는거죠..ㅎ
> 트래픽보기는 사실 전체적인 트래픽만 그냥 IDC에서제공해 주는 것을 보고 있습니다.회사에서 하는 서비스중에는 대용량파일서비스(FTP)도 있는데, 이 서비스에관련된 서버만 따로 mrtg로 묶어서 접속상태나,전송속도등의 문제가 들어왔을 경우만확인합니다.
> >
>
가격은 Professional 버전이 $795 이고, Premium 버전이 $1995
입니다.
User 단위로 증가하기 때문에 대부분 Single user 로
구입하시면 될겁니다.
(http://manageengine.adventnet.com/products/opmanager/pricing.html)
What's up gold 보다 더 저렴합니다.
(http://www.ipswitch.com/purchase/products/whatsup_professional.asp)
check interval 문제는..
퍼포먼스 체크하는 시간 간격이 5분인데,
전체 서버를 체크하는 소요 시간이 5분을 초과하는
경우에 문제가 됩니다.
예를 들어 0,5,10,15,20,25,30,35,40,45,50,55 분에 체크를
하도록 스케줄되어 있는데,
0분에 시작한 체크가 5분이 넘어도 끝나지 않으면,
5분에 새로 시작하는 스케줄과 충돌해서 시스템이
느려지거나 체크를 못하게 됩니다.
OpManager 에서 interval 을 10분 정도까지 늘려봤는데도
어렵더군요.
check interval 을 더 늘리면 performance logging 의 의미가
퇴색할거 같아 그냥 포기했습니다.
(이 때가 500 device 정도 였습니다)
결국 단순한 Cacti 로 바꾸게 되었고요.
Cacti 는 1회 측정시에 3분 정도에 완료되도록 서버를
분배하고 있습니다.
2 cpu 서버에 현재 3~400 device 를 측정하고 있습니다.
Dr.Mirr 쓴 글:
> 안녕하세요 이미르 입니다.다들 모니터링 시스템에 대한 갖은 테스트를해보시고 계시는군요..저도 경험은 비록 얼마 안되지만 적어보겠습니다.저의 경우는 처음 모니터링 툴에 대한 선택으로 많은고민을 해야 했습니다.기왕이면 여러번의 삽질 없이도, 간단하게 모든걸 다보고 싶었던 거죠..(욕심이 컸습니다..^^)그래서 처음엔 cacti를 설치해 보았는데, 이것이 기타설정들 및 관리가 생각보다 까다롭드라구요..
> 그리곤 Nagios를 사용해 봤습니다.웹에서도 쉽게 볼 수있어서 좋았습니다만,100여대정도의 서버 셋팅이, 너무 세분화 되고복잡해서 저로선 매우 힘들었습니다.결국 기본적인 서버상태만 볼 수 있도록 설정하고,사장님께 보여드리는 용도로만 사용하고 있습니다.
> 제가 지금까지 매우 유용하게 사용하고 있는건 What'sUP 입니다.이녀석은 서버 등록 및 설정도 매우 쉽고, 자체 설치및 설정 또한 간결했습니다.처음엔 2006 트라이얼 버젼을 사용해 봤는데 너무좋아서 기간이 만료되는게 아쉽더라구요..그래서 2005버젼을 어두운 하수구를 뚫고 구해왔죠..
> 현재로는 여기에 전부 의존하고 있는 편입니다.기본적으로 What'sup에서 지원하지 않는 프로토콜들은TCP 프로토콜을 사용하여직접 서비스 포트로 핑을 때리는 식으로 체크했고,문자역시 따로 문자발송용 서버 프로그램을 만들어서적당한 서버에 올려두었습니다.What'sup에서 시스템문제를 발견 할 경우 직접 제작한클라이언트 프로그램을 실행하여실행 인자로 문자열을 넣어주게 되어있고, 그문자열은 서버프로그램에 날아가서,서버에선 저희 회사에서 서비스하고 있는 무료 문자디비서버로 쿼리를 날리게 되는거죠..(SMS터널링이라고하나요 혹시..잘몰라서..)
> 지금 이 상태로 6개월이 넘게 아주 마음놓고 잘지내고 있습니다.물론 로그관리는 Logwatch 를 이용하고 있구요..Logwatch로 하드디스크용량, 크론로그, 접속관련,부팅관련로그들을 받아보고 있습니다.이것도 역시 100여대정도 되는 서버의 로그를한꺼번에 받아봐야 하기때문에 혼자로썬 꽤나 무리가있는 편이긴 하지만,그래도 어쩌겠습니까 .... 주어진 환경이 그러한걸..^^
넷지기 쓴 글:
각 모니터링 라이브러리가 풍부하지 못한점, 가끔
discovery를 실행하면 이상한 결과가
나오기도 하는점(나만그런가 ㅡ,.ㅡ::)
또, 리스트데이터나 설정파일들을 추출해서 다른
컴퓨터의 왓츠업으로 옮기는 방법도 아직까지
못찾아냈거든요..
What'sup Gold 버젼의 데이타를 마이그레이션
시켜주는메뉴는 있는데,
2005나 2006의 데이타를 익스포트시켜주는걸
못찾겠어요..
뭐 대략 이정도랄까요...그런점만 빼면 끝내주는
툴이지요..
기존에 내부적으로 왓츠업을 사용하고 있는데 이를 다른 것으로 대체할지 아
니면 계속 쓸지 고민중이랍니다.
왓츠업의 경우 모니터링할 댓수가 늘어나는 경우 (천대이상?) 성능에 문제가
없나요??
큰 IDC에서도 사용을 한다면 괜찮을 듯도 한데요.
모니터링할 규모가 커지면 그만큼 자주 모니터링할 명령을 내려야하고 받아서
처리해야 할 것도 많을텐데요.
nagios의 경우는 분산 모니터링이라고 하여 일정한 범위에서 모니터링하는 서
버를 분산하고 모니터링한 결과만 중앙의 관리서버로 보내는 방식을 이용합니
다. 실제 알람은 중앙의 관리서버에서 하는 방식이지요.
이보다 더 중요한 것은 기존 시스템과의 연동입니다.
모니터링할 호스트를 일일이 한대한대 세팅하는 것이 아니라 자동화하려고 한
다면 기존 시스템과 연동을 해야 합니다.
이경우 다른 프로그램과 연동을 하여 신규 호스트를 자동으로 등록, 수정, 삭
제하고 모니터링 항목도 변경가능할지요.
DB를 MS-SQL을 사용할 수가 있으므로 직접 DB를 컨트롤할수가 있는지요.
--
--------------------------------------------------------
문태준
연락처 : 공일육 칠육일 일일육공
이메일 : jun(at)tunelinux.pe.kr
http://tunelinux.pe.kr
http://database.sarang.net
1. 일단 Zabbix에서 Distrubuted Monitoring은 향후 버전에서 제공될 예정입니다. (현재 안정버전에서는 안됨)
참고로 현재 사용중인 장비는 270여대 서버를 모니터링 중인데, 무난하게 사용하고 있습니다.
Host 머신 스펙은 다음과 같습니다. (IBM x330 / 1.2Ghz 2way / RAM 1G)
2. 굳이 분산 모니터링 구조가 아니더라도, 현재 쓰는 모니터링 솔루션이 운영중인 서버의 상태, Backend DB(mysql) 설정에 따라
확장성은 굉장히 달라집니다 예를 들어 established TCP connection 체크 간격을 30초, 1분, 5분으로 변경해보면
응답속도가 굉장히 차이납니다. 현재 사용하는 솔루션에서도 튜닝의 여지가 꽤 있다고 봅니다.
3. 오픈소스 DBMS든, MS-SQL이든, 백엔드DB를 사용하는 솔루션이면 뭐가 되든 직접 제어가 가능할 것입니다.
이 부분은 관리자의 역량인데, 저는 (실력이 미진하여) 따로 손대지는 않고 있습니다. ^^
참고하세요~~
-----원본 메시지-----
보낸 사람: sysadm...@googlegroups.com [mailto:sysadm...@googlegroups.com] 이(가) 다음 사람 대신 보냄: 문태준
보낸 날짜: 2007년 3월 28일 수요일 오후 2:10
받는 사람: sysadm...@googlegroups.com
제목: [sysadminstudy:414] Re: 오픈소스NMS: Zabbix, OpenNMS